Слайд 1Учебные вопросы:
Точечные и интервальные оценки вариационного ряда
Характеристики вариационного ряда
Измерение вариации
признака
Статистические критерии согласия
Статистическое оценивание и проверка гипотез
Слайд 22. Точечные и интервальные оценки вариационного ряда
Оценки вариационного ряда могут
быть:
- точечными;
- интервальными
Точечной называют оценку, определяемую одним числом
При выборке малого
объема точечная оценка может существенно отличаться от оцениваемого параметра, и, как следствие, приводит к грубым ошибкам
По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками
Слайд 32. Точечные и интервальные оценки вариационного ряда
Интервальной называют оценку, определяемую
двумя числами – концами интервала
Интервальная оценка, в отличие от точечной,
позволяют установить:
- точность оценок;
- надежность (доверительную вероятность) оценок
Слайд 4Пример построения вариационного ряда при дискретной и непрерывной вариации
Основные
черты социальных и социально-правовых систем - это случай и время,
то есть они развиваются во времени отчасти при непредсказуемом поведении их элементов
Как мы уже знаем, изучение уголовно-правовых массовых явлений начинается со сбора статистических данных, то есть со статистического наблюдения
Также нам известно, что полученный в результате наблюдения первичный материал подвергается в дальнейшем группировке, то есть равносоставную массу элементов разделяют по тому или иному признаку на однородные группы
Слайд 5Пример построения вариационного ряда при дискретной и непрерывной вариации
Пусть
в качестве изучаемого признака (X) совокупности лиц, осужденных за тяжкие
телесные повреждения, взят возраст
Анализ возрастных способностей названной группы применительно к 55 осужденным дал следующие результаты:
16, 22, 20, 19, 18, 24, 21, 17, 23, 18,
19, 16, 22, 18, 23, 20, 19, 22, 20, 19,
20, 18, 21, 18, 19, 24, 17, 16, 23, 19,
25, 21, 20, 18, 19, 22, 20, 18, 17, 21,
19, 20, 23, 25, 22, 20, 17, 24, 19, 17,
21, 18, 19, 21, 26
Слайд 6Пример построения вариационного ряда при дискретной и непрерывной вариации
На
основе полученного статистического наблюдения может быть составлен следующий вариационный ряд
Объем выборки n = 55
Слайд 7Дискретная и непрерывная вариации
Изменение (вариация) признака может быть:
- дискретной;
-
непрерывной
При дискретной вариации значения признака отличаются друг от друга на
некоторое (обычно целое) число, например:
- число судимостей;
- число сообщений о происшествиях, поступивших в дежурную часть;
- число эпизодов в уголовном деле и др.
Слайд 8Дискретная и непрерывная вариации
При непрерывной вариации значения признака могут отличаться
на сколь угодно малую величину, например:
- время достижения патрульной группой
места происшествия;
процент выполнения нормы выработки на предприятиях исправительно-трудовых учреждений (ИТУ) и др.
При непрерывной (а часто и при дискретной) вариации разделение признака называется интервальным, то есть частоты относятся не к отдельному значению признака, а к некоторому интервалу
Слайд 9Пример, вариационного ряда распределения работающих в ИТУ по норме выработки
Объем
выборки n = 696
Слайд 10Дискретная и непрерывная вариации
От выбора интервала во многом зависят результата
последующего анализа:
- при чрезмерно зауженном интервале начинает значительно сказываться случайность
наблюдений, различные «шумовые» эффекты;
- при неоправданном расширении интервала нивелируются важные особенности наблюдаемого социально-правового явления
Слайд 11Дискретная и непрерывная вариации
От этих неприятных последствий уходят путем выбора
интервала по формуле:
где: xmax - xmin – размах вариации, характеризующий разность между наибольшей и наименьшей вариантами;
n – объем выборки
Слайд 12Дискретная и непрерывная вариации
Для данных таблицы 1 получаем величину интервала
k = 1,3; а для данных таблицы 2 k =
3,8
Полученные значения близки к выбранным, то есть к интервалам 1 и 5 соответственно
Слайд 13Лекция 3: Числовые характеристики статистического распределения. Приложения математической статистики для
решения правовых задач
Учебный вопрос 3:
Характеристики вариационного ряда
Слайд 143.Структурные средние
Характеристиками вариационного ряда являются:
- медиана;
- мода
Слайд 15Медиана
Медиана (Ме) – это такое значение варианты, которое приходится на
середину вариационного ряда
В случае, если число членов ряда нечетное, Ме
= а +1, где а – целая часть от деления пополам количества вариант вариационного ряда
Таким образом для ряда в таблице 1
Ме = а + 1 = 11/2 + 1 = 5 +1 = 6,
то есть Ме = 21 (см. таблицу 1)
Слайд 16В случае, если вычисляется медиана интервального вариационного ряда, используется следующая
приближенная формула: Ме = Х1н +К1м (n/2 –Ti-1)/ni,
(4)
где: Х1н – значение начала медианного варианта;
К1м – длина медианного интервала;
n/2 – полуобъем выборки в процентах;
Ti-1 – сумма частот интервалов, предшествующих медианному (определяется по первой накопленной частоте, превышающей половину всего объема вариационного ряда, то есть более 50%);
ni – частота медианного интервала
Слайд 17Для вариационного ряда, представленного в таблице 2, значение медианы в
соответствии с этой формулой, будет: Ме = 80+5(50 – 35,1)/17,2
= 84,3
Медиана обладает замечательным свойством – сумма абсолютных величин отклонений вариантов от нее меньше, в том числе и от средней арифметической
На практике это свойство может быть применено, например, при:
- проектировании маршрутов патрульных групп;
- выборе места для пункта управления подразделениями ГИБДД на протяженных участках дороги и др.
Слайд 18Мода
Мода (Мо) – значение варианты, имеющей максимальную частоту в вариационном
ряду
В таблице 1 максимальная частота (максимальное количество осужденных за тяжкие
телесные повреждения) – 19 (лет)
Слайд 19Модальное значение интервального ряда вычисляется с использованием формулы:
Мо = Х1н +(К1м / (1 + ((ni -
ni+1) / (ni - ni-1))), (5)
где: Х1н – значение начала медианного варианта;
К1м – длина модального интервала;
ni – частота модального интервала;
ni-1 и ni+1 – соответственно частоты предшествующего и последующего интервалов по отношению к модальному
Слайд 20Для вариационного ряда, характеризующего распределение работающих в ИТУ по норме
выработки (таблица 2) это следующие значения:
Х1н = 80;
К1м = 5;
ni
= 120;
ni-1 = 95;
ni+1 = 88
Слайд 21Мода интервального ряда, представленного в таблице 2, равна 82,2. Это
и есть оценка значения нормы выработки, которую выполняет наибольшая группа
осужденных
Сравнивая значения средней арифметической, моды и медианы, можно определить, каким является вариационный ряд:
- симметричным или асимметричным (скошенным)
Важно знать, что при нормальном распределении величины средней арифметической, моды и медианы совпадают
Слайд 22Симметричный и асимметричный ряды
Если ряд умеренно отличается от симметричного, то
должно выполняться соотношение:
(6)
Так, для вариационного ряда, характеризующего распределение работающих в ИТУ по норме выработки (таблица 2), получается значение, равное 2,3. Это приводит к выводу о незначительном отличии ряда от симметричного
Характерно, что для таких рядов медиана расположена между модой и средней арифметической
Слайд 234. Измерение вариации признака
Рассмотренные числовые характеристики вариационного ряда, и, в
частности, параметры, характеризующие средние величины и максимум ряда, не учитывают
вариации признака различных социально-правовых процессов
Для измерения вариации признака применяют такие показатели, как:
- вариационный размах;
- дисперсии;
- среднее квадратическое отклонение;
- относительный коэффициент вариации
Слайд 24Вариационный размах
Вариационный размах (R) (широта распределения) – это показатель, характеризующий
разность между крайними значениями вариационного ряда:
R = xmax – xmin
, (7)
где xmax и xmin – варианты вариационного ряда
Например, вариационный размах для ряда, характеризующего число осужденных за тяжкие телесные повреждения (таблица 1) составляет
R = 26 -16 = 10 лет
Слайд 25Вариационный размах
Но, несмотря на простоту рассматриваемого критерия вариации признака (R),
при практическом использовании он чрезвычайно зависит от случайностей, весьма неустойчив
и поэтому может служить лишь для грубой оценки колеблемости вариационного ряда
Более надежным и наиболее часто применяемым на практике , хотя и более сложным для вычисления, являются показатели дисперсии и среднего квадратического отклонения
Слайд 26Среднее квадратическое отклонение
С учетом того, что среднее квадратическое отклонение представляет
собой абсолютную величину и зависит от единицы измерения, для сопоставимости
различных исследований нужно использовать относительный коэффициент вариации
Слайд 27Относительный коэффициент вариации
Относительный коэффициент вариации (V) – это коэффициент, представляющий
собой отношение среднего квадратического отклонения от средней арифметической, выраженное в
процентах:
(10)
Значение относительного коэффициента вариации применительно к возрастному распределению осужденных за тяжкие телесные повреждения (таблица1) равно 12,2%
Слайд 284. Измерение вариации признака
В практике социально-правовых исследований довольно часто встречаются
случаи, когда при анализе вариационного ряда числовое значение того или
иного признака резко выделяется, вызывая большие сомнения с точки зрения включения его в дальнейшую обработку
Причинами такого положения могут быть следующие:
- в первичном материале произошла грубая ошибка (ошибку необходимо исправить);
- значительное отличие варианты от других, когда ее значение выходит за пределы случайной вариации (варианту следует исключить из рассмотрения как ошибочную
Слайд 294. Измерение вариации признака
Но нередко бывает и такая ситуация, когда
вызвавший сомнение объект, характеризующийся маловероятным значением признака, на самом деле
является уникальным и должен быть повергнут индивидуальному социально-правовому анализу
Таким образом, исключение вариантов не должно быть автоматическим, его следует производить с большой осторожностью
Слайд 304. Измерение вариации признака
При исключении испытуемого варианта из вариационного ряда
следует следовать следующему алгоритму:
Шаг 1. Вычислить среднюю арифметическую без включения
в нее признаков испытуемого варианта xR.
Шаг 2. Вычислить вариационный размах R без включения признаков испытуемого варианта.
Шаг 3. Определить, заключается ли величина испытуемого варианта (S) в следующих пределах:
, (11)
где коэффициент α находится из таблицы 3:
Слайд 31Зависимость значения коэффициента α
от объема исследуемой совокупности
Таблица 3.
Слайд 32Пример использования алгоритма исключения испытуемого варианта из вариационного ряда
Постановка задачи:
Пусть
имеется вариационный ряд: распределение времени, затраченного дежурной группой для достижения
места происшествия (таблица 4):
Слайд 33Пример использования алгоритма исключения испытуемого варианта из вариационного ряда
Слайд 34Пример использования алгоритма исключения испытуемого варианта из вариационного ряда
Сомнение вызывает
варианта 20,0
Средняя арифметическая равна 5,59Вариационный размах R = 6,5 при
n = 112 и α = 0,8Таким образом, допустимые границы вариации определяются соотношением:
0,39 < S < 10,79
Так как варианта 20,0 почти в два раза превосходит максимально допустимую границу случайного колебания, то при дальнейшей обработке вариационного ряда ее надо исключить
Слайд 354. Измерение вариации признака
Графическое представление вариационного ряда в виде полигона
принято называть также эмпирической кривой распределения
Для обеспечения анализа, предсказания различных
свойств исследуемой совокупности стремятся описать эмпирический ряд с помощью некоторой математической модели – закона распределения
Самым известным законом распределения в природе и обществе, в частности, проявляющимся в действии социально-правовых процессов, выступает закон нормального распределения
Слайд 364. Измерение вариации признака
Кривая функции плотности нормального распределения описывается с
помощью следующего соотношения:
(12)
Нормальное распределений той или иной случайной величины возникает в силу влияния на нее большого числа случайных причин, не имеющих значительного преимущества в этом влиянии друг перед другом. Такими случайными величинами могут выступать:
- возраст преступников;
- количество сигналов о происшествиях за единицу времени;
- время раскрытия преступления и др.
Слайд 374. Измерение вариации признака
Покажем, что эмпирический вариационный ряд, отражающий время,
затрачиваемое дежурной группой для достижения места преступления (таблица 4), подчиняется
закону нормального распределения
Средняя арифметическая этого ряда (математическое ожидание – m) равна 5,64
Среднее квадратическое отклонение σ = 1,26
Подставляя известные значения в формулу для функции плотности нормального распределения (формула 12), получим формулу конкретного эмпирического нормального распределения времени:
f(x)* = 0,316* exp(- 0,313 * (x – 5,64)2) (13)
Слайд 384. Измерение вариации признака
Для получения теоретических частот нормального распределения (niT),
то есть вычисленных с помощью математической модели частоты нормального распределения,
необходимо значение функции f(x)* умножить на k*n, то есть:
niT = f(x)*k*n (14)
Этим самым учитывается величина выборочной совокупности и интервал наблюдения эмпирических данных
Слайд 394. Измерение вариации признака
Применительно к рассматриваемому примеру (исходные данные в
таблице 4), получим формулу конкретного теоретического нормального распределения времени:
f(x) =
17,5* exp(- 0,313 * (x – 5,64)2) (15)
Результаты расчетов приведены в правом столбце таблицы 4, где в нижней строке представлены значения теоретических частот, вычисленных по формуле (15)
Слайд 404. Измерение вариации признака
В том, что эмпирическая и теоретическая функции
плотности распределения выездов дежурных групп примерно совпадают (то есть теоретическое
нормальное распределение достаточно верно отражает эмпирическое распределение исследуемой совокупности), можно убедиться, построив график распределения выездов дежурных групп по времени достижения места происшествия (график строится самостоятельно)
На графике по оси абсцисс откладывается время (от 0 до 10 мин.), а по оси ординат – количество выездов (от 0 до 20)
Слайд 414. Измерение вариации признака
На графике можно увидеть, что кривая нормального
распределения располагается симметрично относительно средней арифметической, поэтому величину средней называют
центром распределения
Влияние величины среднего квадратического отклонения (σ) сказывается следующим образом:
- чем σ меньше, тем более вытянута кривая вдоль оси ординат;
- чем σ больше, тем более плоской становится кривая, растягиваясь вдоль оси абсцисс
Слайд 424. Измерение вариации признака
Для практических приложений в социально-правовых исследованиях используется
правило «трех сигм»:
- случайная величина с нормальным
распределением практически не принимает значений, которые отличаются от средней арифметической на величину больше, чем 3σ
Если указать точнее, то:
- в интервал (+-) σ попадает 68% всех наблюдений;
- в интервал (+-)2σ попадает 96% всех наблюдений ;
- в интервал (+-)3σ попадает 99,7% всех наблюдений
Слайд 434. Измерение вариации признака
Если проанализировать самостоятельно построенный график для рассматриваемого
примера, то можно убедиться, что в интервал (+-)2σ попало 93,8%
всех выездов дежурных групп
Таким образом и интервала (+-)2σ достаточно, чтобы оценить основное число вариант в исследуемых совокупностях, характеризующих те или иные социально-правовые процессы
Важно знать, что при нормальном распределении величины средней арифметической, моды и медианы совпадают