Слайд 1МЕТОДЫ СРАВНЕНИЯ СТАТИСТИЧЕСКИХ СОВОКУПНОСТЕЙ
Занятие 5
Слайд 2Основные этапы статистического анализа
Описание полученного массива данных
Анализ данных и проверка
различных гипотез
Слайд 3Анализ данных и проверка различных гипотез
1. Сформулируйте вопрос, на который
Вы хотите ответить с помощью статистического анализа.
2. Выберите наиболее адекватный
для
ответа на данный вопрос
статистический критерий или метод.
3. Правильно интерпретируйте его
результаты.
Слайд 4Некоторые направления статистического анализа
Сравнение и определение достоверности различия
Выявление и измерение
взаимосвязи между признаками
Изучение динамики явления
Анализ выживаемости
Анализ прогностических факторов
Слайд 5ВНИМАНИЕ !
При выборе статистического критерия или метода обратите внимание на
условия их применения
Слайд 6 Сравнение и определение достоверности различия
независимые группы
опыт-контроль
сопряженные группы
«до» и «после»
Две
группы
параметрические
непараметрические
Несколько групп
Слайд 7 Статистические методы сравнения совокупностей включают в себя следующие методы
Оценка
достоверности различия обобщающих коэффициентов (параметрические и непараметрические);
Оценка достоверности различий в
распределении совокупностей ;
Стандартизация обобщающих коэффициентов.
Слайд 8Общие принципы сравнения совокупностей основываются на анализе так называемой нулевой
гипотезы (Но).
Слайд 9Согласно этой гипотезе первоначально принимается, что между совокупностями (показателями) различия
случайны (не достоверны) , т.е., что обе группы вместе составляют
один и тот же однородный материал, одну совокупность.
Слайд 10Статистический анализ должен привести или к отклонению Но-гипотезы, если доказана
достоверность полученных различий,
или к ее сохранению, если достоверность различий
не доказана, т.е. различия признаны случайными.
Слайд 11Т.к. статистические различия всегда характеризуются определенным уровнем значимости, то принятие
решения по отбрасыванию или сохранению Но - гипотезы связано с
оценкой уровня значимости.
Слайд 12В медико-биологических исследованиях общепризнанным минимальным уровнем значимости является р=0.05,
Слайд 13-если при сравнении совокупностей полученный при исследовании уровень значимости меньше
0,05 (р < 0,05),
то Но-гипотеза отбрасывается и различия в
совокупностях признаются достоверными, воспроизводящимися при повторных исследованиях с определенной вероятностью;
Слайд 14-если при сравнении совокупностей полученный в исследовании уровень значимости больше
0,05 (р > 0,05),
то Но- гипотеза признается верной
(
т.е.подтвержденной), что свидетельствует об отсутствии достоверных различий между совокупностями.
Слайд 15Это может быть связано как с реальным отсутствием различий, так
и с недостаточным объемом выборки, который не позволяет проявиться основным
закономерностям изучаемого явления.
Слайд 16 Параметрические методы оценки достоверности различий обобщающих коэффициентов
Слайд 17Параметрические методы оценки требуют знания характера распределения (только для нормального
распределения) изучаемого признака и
его параметров (средних величин, стандартного отклонения
и др.).
Слайд 18Уровень значимости в этих методах определяется с помощью расчета критерия
t и сравнения его значения с табличным, который соответствует определенному
уровню значимости:
Слайд 19- если t ф > t 0,05, то р
0,05 и Но - гипотеза отвергается;
- если t ф
t 0,05, то р > 0,05 и Но- гипотеза принимается,
при этом t ф - фактический критерий, рассчитанный исследовании;
t 0,05 - табличное значение критерия t для р = 0.05.
Слайд 211.При сопоставлении двух независимых серий наблюдений:
Слайд 24Для оценки достоверности полученного критерия «t» при числе наблюдений больше
30 можно пользоваться следующей закономерностью:
если критерий t ≥ 2, то
он достоверен, т.к. соответствует р ≥ 0,95 или р ≤ 0,05
если критерий t ≥ 3, то он достоверен с большей степенью достоверности, т.к. соответствует р ≥ 0,99 или р ≤ 0,01.
Слайд 25Для числа наблюдений меньше 30 достоверность критерия t определяется по
таблице Стьюдента.
Для определения табличного значения критерия t необходимое число
степеней свободы рассчитывается по формуле: n1 = n 1 + n 2 - 2
где n 1- число наблюдений в одной совокупности
п 2- число наблюдений в другой совокупности.
Слайд 26При оценке двух методов операции в двух группах больных (n1=
145; n2=147) в качестве критерия была взята средняя длительность послеоперационного
периода. Необходимо оценить достоверность различия по этому критерию. (Предполагается нормальное распределение изучаемого признака.)
Средняя длительность послеоперационного периода в соответствующих группах больных: метода №1: 1=9 дней, m1=0,3 дн.
метода №2: 2=11 дней, m2=0,2 дн.
Слайд 27Так как представлены результаты сравнения средних величин в двух независимых
совокупностях,
и распределение изучаемого признака предполагается нормальным,
то для оценки достоверности
различия можно использовать соответствующий критерий t.
t = =5,0
Слайд 28Так как n > 30 для оценки достоверности критерия t
можно использовать следующую закономерность: t0,05 ≥ 2; t0,01 ≥ 3.
Вывод: Т.к.
tфакт.(5,0) > t0,01 (3), следовательно различия в средней длительности послеоперационного периода достоверны (р < 0,01), и по этому показателю метод №1 достоверно лучше метода №2.
Слайд 29Для оценки эффективности вакцинации против гриппа провели изучение заболеваемости среди
привитых и непривитых. Необходимо оценить достоверность различия между этими показателями.
Заболеваемость
непривитых: Р1=13,2 ‰, m1=0,9 ‰
Заболеваемость привитых: Р2=10,6 ‰, m2=1,1 ‰
Слайд 30Так как представлены результаты сравнения двух относительных величин в двух
независимых совокупностях, то для оценки достоверности различия можно использовать соответствующий
критерий t.
Слайд 31Так как n1,2 > 30 для оценки достоверности критерия t
можно использовать следующую закономерность: t0,05 ³ 2; t0,01 ³ 3.
Вывод: Т.к.
tфакт.(1,8) < t0,05 (2), следовательно различия в уровнях заболеваемости гриппом среди привитых и непривитых статистически недостоверно, и нет оснований считать противогриппозную вакцину эффективной.
Слайд 32Сравнение двух сопряженных совокупностей по "разностному методу".
Слайд 33Для сравнения степени однородности статистических групп используется критерий Фишера..Его значение
велико в ряде специальных разделов статистики, особенно в дисперсионном анализе.
За Но-гипотезу в этом случае принимается признание равенства дисперсий в сравниваемых совокупностях. Критерий Фишера рассчитывается по формуле:
Слайд 34Непараметрические методы оценки достоверности различий обобщающих коэффициентов
Слайд 35Положительные стороны непараметрических методов:
не требуют предварительного расчета параметров распределения (средних
величин, стандартного отклонения и др.);
не требуют предварительного знания характера распределения;
позволяют
сравнивать совокупности с номинальными и порядковыми признаками;
просты в применении.
Слайд 36Отрицательные стороны непараметрических методов:
дают менее точные результаты, чем параметрические
методы;
имеют существенные ограничения в применении по числу наблюдений.
Слайд 37При сравнении сопряженных (взаимосвязанных) совокупностей
критерий знаков (Z)
критерий Вилкоксона
(Т)
критерий Манна-Уитни-модификация
Слайд 38 При сравнении независимых совокупностей
критерий Манна-Уитни
критерий Розенбаума (Q)
критерий Уайта (К или Т)
критерий Ван дер Вандена (X)
серийный критерий (S)
критерий Колмогорова - Смирнова (λ)
Слайд 39При альтернативном распределении совокупностей
точный метод Фишера для четырехпольных таблиц
(Р)
Слайд 40
Оценка достоверности различий по методу "хи-квадрат"(критерию соответствия, критерию Пирсона, коэффициенту
согласия)
Слайд 41Область применения метода:
определение достоверности различий в нескольких сравниваемых группах и
при нескольких результатах с определенной степенью достоверности;
определение наличия связи между
явлениями без измерения ее величины;
оценка идентичности (близости) распределений двух и более вариационных
Слайд 42Преимущества метода:
не зависит от формы распределения;
может использоваться для
сравнения нескольких групп (признаков)
используется на абсолютных цифрах;
Слайд 43Ограничения метода:
величина полученного "хи -квадрата" зависит от перегруппировки материала. Если
группировки не ярко выражены, результат не показателен;
действует лишь как
суммарный показатель различия, не устанавливая отклонение каких именно групп друг от друга обусловило конечный результат,
группы должны быть как можно более однородны для предупреждения "погашения влияний";
ожидаемые числа" при расчете должны быть не менее 5;
не следует применять, если число наблюдений < 20
служит для оценки независимых совокупностей
Слайд 44Суть метода заключается в том, что в сравниваемых группах предполагается
отсутствие различий в распределении совокупностей (отсутствие связи между исследуемыми факторами),
т.е. формулируется Но-гипотеза.
На основании этой гипотезы рассчитывается новое распределение признаков в совокупности по группам (расчет т.н. "ожидаемых чисел")
Слайд 45"Ожидаемые числа" сопоставляют с фактическим.
Если Но-гипотеза верна, то теоретические
и фактические числа должны совпасть, и рассчитанный "хи -квадрат" будет
равен О,
либо отклонение теоретических чисел от фактических будет незначительно и полученный •хи-квадрат" не превысит своего критического значения.
Слайд 46Чем больше теоретические числа, рассчитанные на основе Но-гипотезы, будут отличаться
от фактических,
тем более "хи -квадрат" будет отличаться от О,
тем с большей вероятностью можно отклонить Но-гипотезу и говорить о статистической достоверности имеющихся различий в сравниваемых совокупностях.
Слайд 47Хи - квадрат" рассчитывается по формуле:
где
р - фактические данные;
р1-"ожидаемые",теоретические числа,
рассчитанные на основе Но- гипотезы.
Слайд 48 При альтернативном распределении применяется упрощенная формула, которая рассчитывается на
основе таблицы взаимной сопряженности (четырехпольной таблицы ):
Слайд 50где
р-частота встречаемости признака в одной
( pi) и другой (
р2 ) группе;
q-альтернативный р показатель;
п -число наблюдений;
a;b;c;d -абсолютные числа
в клетках таблицы.
Слайд 51 Оценка достоверности результатов:
1. Рассчитаный по формуле "хи-квадрат" оценивается по таблице χ2:
достоверности различий подтверждается и Но-гипотезы отклоняется, если
χ2 факт.> χ2 0,05
при числе степеней свободы ( f )• не более 30.
Расчет f проводится по формуле:
f= (с-1)( г-1),
где с-число групп по горизонтали ( без итоговых);
г-число граф по вертикали (без итоговых).
Слайд 522. Приближенную оценку можно провести по формуле Романовсксго:
для f
f ≥30:
> 1,64
=
-