Слайд 1Классификация параметрических и непараметрических методов математической статистики
(лекционное занятие)
Слайд 2Пример построения вариационного ряда при дискретной и непрерывной вариации
На
основе полученного статистического наблюдения может быть составлен следующий вариационный ряд
Объем выборки n = 55
Слайд 3Дискретная и непрерывная вариации
Изменение (вариация) признака может быть:
- дискретной;
-
непрерывной
При дискретной вариации значения признака отличаются друг от друга на
некоторое (обычно целое) число, например:
- число судимостей;
- число сообщений о происшествиях, поступивших в дежурную часть;
- число эпизодов в уголовном деле и др.
Слайд 4Дискретная и непрерывная вариации
При непрерывной вариации значения признака могут отличаться
на сколь угодно малую величину, например:
- время достижения патрульной группой
места происшествия;
процент выполнения нормы выработки на предприятиях исправительно-трудовых учреждений (ИТУ) и др.
При непрерывной (а часто и при дискретной) вариации разделение признака называется интервальным, то есть частоты относятся не к отдельному значению признака, а к некоторому интервалу
Слайд 5Пример, вариационного ряда распределения работающих в ИТУ по норме выработки
Объем
выборки n = 696
Слайд 6Дискретная и непрерывная вариации
От выбора интервала во многом зависят результата
последующего анализа:
- при чрезмерно зауженном интервале начинает значительно сказываться случайность
наблюдений, различные «шумовые» эффекты;
- при неоправданном расширении интервала нивелируются важные особенности наблюдаемого социально-правового явления
Слайд 7Дискретная и непрерывная вариации
От этих неприятных последствий уходят путем выбора
интервала по формуле:
где: xmax - xmin – размах вариации, характеризующий разность между наибольшей и наименьшей вариантами;
n – объем выборки
Слайд 8Дискретная и непрерывная вариации
Для данных таблицы 1 получаем величину интервала
k = 1,3; а для данных таблицы 2 k =
3,8
Полученные значения близки к выбранным, то есть к интервалам 1 и 5 соответственно
Слайд 93.Структурные средние
Характеристиками вариационного ряда являются:
- медиана;
- мода
Слайд 10Медиана
Медиана (Ме) – это такое значение варианты, которое приходится на
середину вариационного ряда
В случае, если число членов ряда нечетное, Ме
= а +1, где а – целая часть от деления пополам количества вариант вариационного ряда
Таким образом для ряда в таблице 1
Ме = а + 1 = 11/2 + 1 = 5 +1 = 6,
то есть Ме = 21 (см. таблицу 1)
Слайд 11В случае, если вычисляется медиана интервального вариационного ряда, используется следующая
приближенная формула: Ме = Х1н +К1м (n/2 –Ti-1)/ni,
(4)
где: Х1н – значение начала медианного варианта;
К1м – длина медианного интервала;
n/2 – полуобъем выборки в процентах;
Ti-1 – сумма частот интервалов, предшествующих медианному (определяется по первой накопленной частоте, превышающей половину всего объема вариационного ряда, то есть более 50%);
ni – частота медианного интервала
Слайд 12Медиана обладает замечательным свойством – сумма абсолютных величин отклонений вариантов
от нее меньше, в том числе и от средней арифметической
На
практике это свойство может быть применено, например, при:
- проектировании маршрутов патрульных групп;
- выборе места для пункта управления подразделениями ГИБДД на протяженных участках дороги и др.
Слайд 13Мода
Мода (Мо) – значение варианты, имеющей максимальную частоту в вариационном
ряду
В таблице 1 максимальная частота (максимальное количество осужденных за тяжкие
телесные повреждения) – 19 (лет)
Слайд 14Модальное значение интервального ряда вычисляется с использованием формулы:
Мо = Х1н +(К1м / (ni - ni+1) )/
((ni - ni+1) + (ni - ni-1)),
где: Х1н – значение начала медианного варианта;
К1м – длина модального интервала;
ni – частота модального интервала;
ni-1 и ni+1 – соответственно частоты предшествующего и последующего интервалов по отношению к модальному
Слайд 15
Сравнивая значения средней арифметической, моды и медианы, можно определить, каким
является вариационный ряд:
- симметричным или асимметричным (скошенным)
Важно знать, что при нормальном распределении величины средней арифметической, моды и медианы совпадают
Слайд 16Симметричный и асимметричный ряды
Если ряд умеренно отличается от симметричного, то
должно выполняться соотношение:
(6)
Характерно, что для таких рядов медиана расположена между модой и средней арифметической
Слайд 17Вариационный размах
Вариационный размах (R) (широта распределения) – это показатель, характеризующий
разность между крайними значениями вариационного ряда:
R = xmax – xmin
, (7)
где xmax и xmin – варианты вариационного ряда
Например, вариационный размах для ряда, характеризующего число осужденных за тяжкие телесные повреждения (таблица 1) составляет
R = 26 -16 = 10 лет
Слайд 18Вариационный размах
Но, несмотря на простоту рассматриваемого критерия вариации признака (R),
при практическом использовании он чрезвычайно зависит от случайностей, весьма неустойчив
и поэтому может служить лишь для грубой оценки колеблемости вариационного ряда
Более надежным и наиболее часто применяемым на практике , хотя и более сложным для вычисления, являются показатели дисперсии и среднего квадратического отклонения
Слайд 19Среднее квадратическое отклонение
С учетом того, что среднее квадратическое отклонение представляет
собой абсолютную величину и зависит от единицы измерения, для сопоставимости
различных исследований нужно использовать относительный коэффициент вариации
Слайд 20Относительный коэффициент вариации
Относительный коэффициент вариации (V) – это коэффициент, представляющий
собой отношение среднего квадратического отклонения от средней арифметической, выраженное в
процентах:
(10)
Значение относительного коэффициента вариации применительно к возрастному распределению осужденных за тяжкие телесные повреждения (таблица1) равно 12,2%
Слайд 214. Измерение вариации признака
В практике социально-правовых исследований довольно часто встречаются
случаи, когда при анализе вариационного ряда числовое значение того или
иного признака резко выделяется, вызывая большие сомнения с точки зрения включения его в дальнейшую обработку
Причинами такого положения могут быть следующие:
- в первичном материале произошла грубая ошибка (ошибку необходимо исправить);
- значительное отличие варианты от других, когда ее значение выходит за пределы случайной вариации (варианту следует исключить из рассмотрения как ошибочную
Слайд 224. Измерение вариации признака
Но нередко бывает и такая ситуация, когда
вызвавший сомнение объект, характеризующийся маловероятным значением признака, на самом деле
является уникальным и должен быть повергнут индивидуальному социально-правовому анализу
Таким образом, исключение вариантов не должно быть автоматическим, его следует производить с большой осторожностью
Слайд 234. Измерение вариации признака
При исключении испытуемого варианта из вариационного ряда
следует следовать следующему алгоритму:
Шаг 1. Вычислить среднюю арифметическую без включения
в нее признаков испытуемого варианта xR.
Шаг 2. Вычислить вариационный размах R без включения признаков испытуемого варианта.
Шаг 3. Определить, заключается ли величина испытуемого варианта (S) в следующих пределах:
, (11)
где коэффициент α находится из таблицы 3:
Слайд 24Зависимость значения коэффициента α
от объема исследуемой совокупности
Таблица 3.
Слайд 25Пример использования алгоритма исключения испытуемого варианта из вариационного ряда
Постановка задачи:
Пусть
имеется вариационный ряд: распределение времени, затраченного дежурной группой для достижения
места происшествия (таблица 4):
Слайд 26Пример использования алгоритма исключения испытуемого варианта из вариационного ряда
Слайд 27Пример использования алгоритма исключения испытуемого варианта из вариационного ряда
Сомнение вызывает
варианта 20,0
Средняя арифметическая равна 5,59Вариационный размах R = 6,5 при
n = 112 и α = 0,8Таким образом, допустимые границы вариации определяются соотношением:
0,39 < S < 10,79
Так как варианта 20,0 почти в два раза превосходит максимально допустимую границу случайного колебания, то при дальнейшей обработке вариационного ряда ее надо исключить