Слайд 1ОМОИ
План лекции 4
«Меры изменчивости »
1. Лимиты
2. Размах
3. Квантили
4. Размах
от 90-го до 10-го процентиля
5. Полу-междуквартильный размах
6. Дисперсия
7. Свойства дисперсии
8.
Стандартное отклонение
9. Среднее отклонение
10. Коэффициент вариации
11. Стандартизированные данные
12. Асимметрия
13. Эксцесс
Слайд 2ОМОИ
Вариабельность данных
Меры центральной тенденции говорят нам о концентрации данных на
числовой оси. Каждая такая мера в каком-то смысле наилучшим образом
«представляет» данные.
Меры центральной тенденции игнорируют различия между данными.
Для измерения вариабельности данных требуются другие описательные статистики.
Слайд 3ОМОИ
Зачем нужны меры вариабельности данных?
Научная работа связана с понятием вариабельности
данных. Если есть много необъяснимых причин вариабельности, прогнозы будут неточными.
Задача науки найти причины вариабельности данных и тем самым увеличить точность прогноза.
Например установлено, что наследственность и окружающая среда влияют на IQ ребенка. Поэтому информация о родителях ребенка и его воспитании позволяет более точно прогнозировать его умственное развитие в зрелости. Без такой информации прогноз будет менее точным.
Слайд 4ОМОИ
Наиболее часто используемые меры вариабельности данных
1. Лимиты
2. Размах
3. Квантили
4.
Дисперсия
5. Стандартная ошибка
6. Среднее отклонение
7. Коэффициент вариации
Слайд 5ОМОИ
Лимиты
Это самая простая мера изменчивости.
Определяется минимальное (Xmin) и максимальное
значение (Xmax) массива данных. Между этими статистиками находятся все данные
массива.
Несмотря на свою простоту эта мера используется редко, потому что экстремальные значения сильно подвержены ошибкам. Поэтому трудно определить влияние факторов на вариабельность данных.
Слайд 6ОМОИ
Размах
Определяет расстояние на числовой оси, в пределах которого варьируются
данные. R=Xmax-Xmin.
Исключающий размах – это разность максимального и минимального значений.
Включающий размах – это разность между естественной верхней границей интервала, содержащего максимальное значение и естественной нижней границей интервала, содержащего минимальное значение.
Например рост 5 мальчиков равен 150, 155, 157, 165 и 168. Исключающий размах равен 168-150=18, включающий размах равен 168,5 – 149,5=19.
Слайд 7ОМОИ
Квантили
Это характеристики вариационного ряда, которые отсекают определенную его часть.
Наиболее часто используются квартили, децили и процентили.
Квартиль – это статистика,
отсекающая ¼ часть ряда. Три квартиля Q1, Q2 и Q3 делят ряд на четыре, равные по объемы части (кварты).
Дециль (Di) – это статистика, отсекающая 1/10 часть ряда. Девять децилей делят ряд на 10 равных частей.
Процентиль (Pi) - это статистика, отсекающая 1/100 часть ряда. Девяносто девять процентилей делят ряд на 100 равных частей.
Слайд 8ОМОИ
Зачем нужны квантили?
Квантили, как и медиана, - это важные
характеристики вариационного ряда, особенно для асимметричных распределений. Часто квантили используются
для установления границ тех или иных нормативов.
Размах от 90-ого до 10-ого процентиля является более стабильной мерой, чем размах.
Полу-междуквартильный размах Q3-Q1 содержит 50% наблюдений вариационного ряда.
Слайд 9ОМОИ
Дисперсия
При вычислении всех предыдущих мер вариабельности не учитывалось каждое
отдельное значение массива данных.
Отклонения наблюдений от мер центральной тенденции несут
информацию о вариабельности данных. Чем больше отклонения, тем больше вариабельность. Однако
Слайд 10ОМОИ
Формула
для вычисления дисперсии
Слайд 11ОМОИ
Свойства дисперсии
1. Прибавление константы с к каждому значению не влияет
на дисперсию (а на среднее?)
2. Умножение каждого значения на константу
с увеличивает дисперсию в с2 раз.
3. Дисперсия объединенной совокупности зависит как от дисперсий, так и от средних объединяемых групп
Слайд 12ОМОИ
Задача 3. Вычислить средние и дисперсии совокупностей:
А (3, 3,
3, 3) и В (7,7,7,7)
Слайд 13ОМОИ
Стандартное отклонение
Эта мера тесно связана с дисперсией. Стандартное отклонение –
это положительный корень из дисперсии.
Стандартное отклонение измеряется в тех
же единицах, что и исходные данные. Например, как интерпретировать кг2 или л2?
Полезность этой меры еще и в том, что для многих распределений мы знаем, какая доля наблюдений находится внутри одного, двух, трех и более стандартных отклонений. Поэтому эта мера используется наиболее часто.
Слайд 14ОМОИ
Среднее отклонение
Формула имеет вид
Несмотря на легкость вычисления и простоту
интерпретации эта мера используется редко. Это объясняется тем, что эта
мера неудобна для аналитический преобразований (например необходимо брать производную для поиска минимума функции).
Эта формула неудобна также для вычисления стандартизированных отклонений.
Слайд 15ОМОИ
Коэффициент вариации
Формула для вычисления имеет вид
Эта мера позволяет сравнивать вариабельность
признаков имеющих разные единицы измерения.
Эта мера часто используется в биологии
и других науках, где измеряемые признаки отличны от нуля.
Слайд 16ОМОИ
Стандартизированные данные
Формула для вычисления имеет вид
Таким образом любое множество данных
на основе вычисленных среднего и стандартного отклонения можно преобразовать в
стандартизированное множество с нулевым средним и единичной дисперсией. Это удобно для проверки различных статистических гипотез.
Слайд 17ОМОИ
Задача 4. Вычислить средние и дисперсии двух массивов
Слайд 18ОМОИ
Задача. Вычислить дисперсию тестового балла
Слайд 19ОМОИ
Рекомендуемая литература
1. Гмурман В.Е. Теория вероятностей и математическая статистика. –
М.: Высшая школа, 2004, 479 с.
2. Гмурман В.Е. Руководство к
решению задач по теории вероятностей и математической статистике. – М.: Высшая школа, 2004, 400 с.
3. Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии. Пер. с англ. – М.: Издательство «Прогресс», 1976. -496 с.
4. Маслак А.А. Основы планирования и анализа сравнительного эксперимента в педагогике и психологии. – Курск: РОСИ, 1998. – 167 с.