Слайд 2Основные понятия
Переменная = одна характеристика объекта или события
Количественные: возраст,
ежегодный доход
Качественные: пол, раса человека
Таблица частот = таблица, в
которой собраны сведения о том, сколько раз встречаются данные с определенной величиной.
Слайд 3Статистические параметры распределения
Персентиль – это такое значение заданного распределения,
которое больше «р» процентов всех значений распределения.
Квартили – значения,
соответствующие 25, 50 и 75-й персентилям, т.е. четвертям распределения.
Интерквартильный диапазон – разница между первой и третьей квартилями.
Медиана - середина распределения , т.е. одна половина заданного набора данных имеет меньшие значения, а другая – большие значения.
Слайд 4Среднее значение
= сумма значений, деленная на их количество.
Усеченное среднее
– среднее для набора данных, из которого исключены несколько процентов
значений с обоих концов распределения.
Среднее геометрическое
Слайд 6Основные понятия
Изменчивость характеризует различия между данными или разброс от центра
Диапазон
= разница между максимальным и минимальным значениями распределения.
Отклонение = наиболее
распространенная мера изменчивости
Стандартное отклонение
Слайд 8Основные понятия
Случайные события - события, в которых нельзя точно определить
отдельные исходы, но суммарный исход имеет определенную закономерность.
Определение вероятности =
количество успешных исходов на их общее число.
Относительная частота = количество повторений события на общее число испытаний.
Слайд 9Распределение вероятностей
= набор вероятностей для нескольких событий
Вероятность каждого события
или комбинации событий должна находиться в диапазоне от 0 до
1.
Сумма вероятностей всех возможных событий должна быть равна 1.
Слайд 10Случайные переменные
Случайная переменная - переменная, которая принимает значения случайным образом
в соответствии с распределением вероятностей.
Дискретная случайная переменная принимает значения
в соответствии с дискретным распределением вероятностей.
Непрерывная случайная переменная - в соответствии с непрерывным распределением вероятностей.
Слайд 11Случайные выборки данных
Наблюдение - каждое зарегистрированное значение, которое принимает случайная
переменная.
Выборка - набор нескольких таких наблюдений.
Случайная выборка -
если наблюдения генерируются совершенно случайным образом и без какой-либо тенденции.
Слайд 13Свойства распределений и выборок
Выборочное среднее приблизительно удовлетворяет нормальному распределению со
средним μ и стандартным отклонением σ / √ n, где
μ — среднее распределения, из которого сделана выборка, σ — стандартное отклонение распределения, из которого сделана выборка, п — размер выборки. В общем это свойство обозначается следующим выражением:
х = N ( μ, σ / √ n)
В нормальном распределении около 95% значений попадают в диапазон двух стандартных отклонений от среднего.
Слайд 14Пример доверительного интервала
Если σ ( σ — стандартное отклонение распределения,
из которого сделана выборка) = 10 , а п (п
— размер выборки ) = 25 , то выборочное среднее приблизительно удовлетворяет нормальному распределению со средним μ и стандартным отклонением 2, т.е. с вероятностью 95% выборочное среднее попадает в диапазон отклонения на 4 единицы от μ.
Это значит, что если выборочное среднее равно 20, то μ ( μ — среднее распределения, из которого сделана выборка) с вероятностью 95% находится в диапазоне от 16 до 24. Этот диапазон называется доверительным интервалом
(x- μ / (σ / √ n)) – N (0;1)
Слайд 16Четыре основных элемента
Формулировка нулевой гипотезы Но.
Формулировка альтернативной гипотезы На.
Вычисление статистики
теста.
Определение области непринятия гипотезы.
Слайд 17Типы ошибок
Никогда нет абсолютной уверенности в том, что выводы не
содержат ошибок, но вероятность ошибок можно сократить. Во время проверки
гипотез может возникнуть два типа ошибок.
Ошибка первого типа заключается в отказе от нулевой гипотезы, которая на самом деле является истинной.
Ошибка второго типа заключается в принятии нулевой гипотезы, тогда как на самом деле истинной является альтернативная гипотеза.
Вероятность возникновения ошибки первого типа обозначается греческой буквой а, а вероятность возникновения ошибки второго типа — буквой ß.
Слайд 18Пример проверки гипотезы
Фабрика по производству резисторов: количество дефектных резисторов
в партии соответствует нормальному распределению со средним 50 и стандартным
отклонением 15.
На фабрике предлагается внедрить новый технологический процесс, который позволяет сократить количество дефектных резисторов с экономией материалов. После анализа выборки из 25 партий среднее количество дефектных резисторов в партии равно 45.
Можно ли на основании этих данных утверждать, что новый технологический процесс позволяет сократить количество дефектных резисторов или число 45 является результатом допустимого случайного отклонения, а внедренный технологический процесс ни на что не влияет?