Слайд 1Статистические методы в научных исследованиях
Частоедова И.А. – зав. кафедрой нормальной
физиологии, к.м.н., доцент
Слайд 2Эмпирические данные– это данные, полученные в результате исследования, всегда опосредованы
использованием какой-либо измерительной процедуры, методики или теста
Слайд 3Количественные данные– это данные, получаемые при измерениях (результаты тестирования в
баллах)
Порядковые данные – это данные соответствующие местам этих элементов в
последовательности, полученной при их расположении в возрастающем порядке (ранжирование)
Качественные данные представляют собой какие-то свойства элементов выборки или популяции, их нельзя измерить, оценкой служит частота встречаемости.
Слайд 4Выборка – это ограниченная по численности группа объектов, специально отбираемая
из генеральной совокупности для изучения ее свойств. Изучение на выборке
свойств генеральной совокупности называется выборочным исследованием.
Слайд 5Репрезентативность – это способность выборки представлять изучаемые явления достаточно полно
– с точки зрения их изменчивости в генеральной совокупности. Репрезентативность
выборки является основным критерием при определении границ генерализации выводов исследования.
Способы обеспечения репрезентативности:
простой (случайный) рандомизированный отбор
стратифицированный (случайный) отбор – с учетом качеств, которые могут повлиять на изменчивость изучаемого свойства
Слайд 6Статистическая достоверность- определяется при помощи методов статистического вывода. Они предъявляют
требования к численности или объему выборки.
Слайд 7Строгих рекомендаций по определению объема выборки нет, тем не менее,
можно сформулировать наиболее общие рекомендации:
наибольший объем выборки необходим при разработке
диагностической методики от 200 до 1000 – 2000 человек
при сравнении 2 выборок их общая численность д.б. не менее 50 чел
При изучении взаимосвязи между к-л свойствами объем выборки д.б. не менее 30 - 35 чел
Чем больше изменчивость изучаемого свойства, тем больше д.б. объем выборки. При этом уменьшаются возможности генерализации выводов.
Слайд 8Виды выборок:
зависимая выборка – каждому испытуемому 1 выборки соответствует испытуемый
2 выборки
независимая выборка – испытуемые в выборках не зависят друг
от друга
Слайд 9Уровень значимости – это вероятность того, что различия сочли существенными,
что они не случайны
В биологических и медицинских исследованиях приняты 5%
и 1% уровни значимости
Слайд 10р-уровень значимости- вероятность случайного получения такого (или большего) отклонения от
того, что утверждает Н0
Что такое р-уровень ?
Слайд 11Интерпретация уровней значимости
Слайд 12
Как правильно представить результаты исследования?
в таблицах Ехсеl
Слайд 14
С чего начать обработку результатов?
С проверки нормальности распределения!
Слайд 15Нормальное распределение характеризуется тем, что крайние значения признака в нем
встречаются достаточно редко, а значения, близкие к средней величине –
достаточно часто.
График нормального распределения представляет собой так называемую колокообразную кривую.
Слайд 19Какие использовать тесты?
Колмогорова -Смирнова
Шапиро-Уилка (предпочтительнее, особенно при небольших выборках (n=3-50)-
обладает наибольшей мощностью (т.е. чаще выявляет различия между распределениями)
Слайд 21
Получаем р=0,16836, т.е. различий нет, данные распределены нормально
Слайд 23
Получаем р=0,00016, т.е. различия есть, распределение данных не соответствует нормальному
Слайд 24Как выбрать метод ?
Если Вы имеете дело с порядковыми и
качественными признаками, то подходят только непараметрические методы.
Если признак числовой,
стоит подумать, нормально ли его распределение. Если данных мало (или Вы не хотите думать о типе распределения) - воспользуйтесь непараметрическими методами.
Слайд 27Например сравнение средних показателей уровня утомления у мальчиков (26 человек)
и девочек (54 человека)
Слайд 29То есть, различия статистически значимы
Результаты вычислений
Слайд 30Непараметрические методы
Условия, когда применение непараметрических методов является оправданным:
распределение признака не
соответствует закону нормального распределения
выборка слишком мала, чтобы решить вопрос о
соответствии распределения нормальному- если выборка менее 10 объектов, то результаты применения непараметрических методов можно рассматривать лишь как предварительные
не выполняется требование гомогенности дисперсии при сравнении средних значений для независимых выборок
Слайд 32Самым популярным и наиболее чувствительным (мощным) аналогом критерия t-Стъюдента для
независимых выборок является критерий U-Манна-Уитни. Критерий предназначен для оценки различий
между 2 выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n1, n2 ≥3 или n1 =2, n2≥5.
Слайд 33Ограничения критерия:
- в каждой выборке должно быть не менее 3
наблюдений, допускается что в 1 выборке 2 наблюдения, тогда в
другой д.б. на менее 5
- в выборке должно быть не более 20 наблюдений, при большем количестве затруднено ранжирование.
Слайд 34Например сравнение средних показателей количества шагов в сутки у мальчиков
(11 человек) и девочек (17 человек)
Слайд 35То есть, различия обнаружены на уровне тенденций
Слайд 36Самым чувствительным (мощным) аналогом критерия t-Стъюдента для зависимых выборок является
критерий Т-Вилкоксона.
Критерий применяется для сопоставления показателей, измеренных в 2
разных условиях на одной и той же выборке испытуемых.
Он позволяет установить не только направленность изменений, но и их выраженность.
С его помощью мы определяем, является ли сдвиг показателей в каком-то одном направлении более интенсивным, чем в другом.
Слайд 37Суть метода состоит в том, что мы сопоставляем выраженность сдвигов
в том и ином направлениях по абсолютной величине
Условия применения критерия:
-
обычно применяют на выборках объемом от 12 и более элементов
- минимальное количество испытуемых 5 – максимальное 50
Слайд 38Средние показатели САД
p = 0,04 (
Слайд 39Корреляционный анализ
Корреляционная связь – это согласование изменения двух признаков или
большего множества признаков (множественная корреляция). Она означает, что изменчивость одного
признака находится в некотором соответствии с изменчивостью другого.
Слайд 40Виды корреляционной связи:
По форме
Прямолинейная
Криволинейная (между мотивацией и эффективностью выполнения
задачи –при повышении мотивации эффективность выполнения задачи вначале возрастает, достигает
оптимума, затем снижается, несмотря на дальнейшее повышение мотивации)
Слайд 41Виды корреляционной связи:
По направлению и знаку:
Прямая (положительная) – с увеличением
одного признака второй тоже увеличивается или с уменьшением одного другой
тоже уменьшается
Обратная (отрицательная) – с увеличением одного признака второй уменьшается
Слайд 42Виды корреляционной связи:
По силе:
Сила связи не зависит от ее направленности.
Коэффициент корреляции r может изменяться от -1 до + 1.
r=0, отсутствие связи.
Классификация связи по силе (по Ивантер Э.В., Коросову А.В., 1992)
Очень слабая (малая, низкая) – 0-0,19
Слабая -0,20 – 0,29
Умеренная - 0,3-0,49
Средняя – 0,50-0,69
Сильная (большая, высокая) – 0,7 – 1,0
Слайд 43Виды корреляционной связи:
По достоверности:
Высокая значимая корреляция р ≤ 0,01
Значимая корреляция
р ≤ 0,05
Незначимая корреляция р >0,05
Слайд 44Факторы, влияющие на корреляцию:
Выбросы – экстремально большие или малые значения
признака.
«Третья» переменная –иногда корряляция между 2 переменными обусловлена не
связью между соответствующими свойствами, а влиянием некоторой общей причины совместной изменчивости этих переменных, которая зачастую выпадает из поля зрения исследователя.
Нелинейные связи –(например – связь тревожности и продуктивности деятельности – вид купола). Можно разделить выборку на подгруппы по выраженности признака и коэффициент корреляции определить отдельно по подгруппам.
Слайд 45Корреляционные матрицы
Часто корреляционный анализ включает в себя изучение связей не
двух, а множества переменных, измеренных в количественной шкале на 1
выборке. В этом случае вычисляются корреляции для каждой пары из этого множества переменных. Вычисления проводят на компьютере, а результатом является корреляционная матрица.
Корреляционная матрица – это результат вычисления корреляций одного типа для каждой пары из множества переменных, измеренных в количественной шкале на одной выборке.
Слайд 47После решения проблемы статистической значимости элементов корреляционной матрицы статистически значимые
корреляции можно представить графически в виде корреляционной плеяды (фигура, состоящая
из вершин и соединяющих ее линий).
Слайд 49Качественный анализ данных (процентное распределение)
Слайд 50"Хи-квадрат"
Критерий "Хи-квадрат" позволяет сравнивать распределения частот вне зависимости от
того, распределены они нормально или нет.
Слайд 51Под частотой понимается количество появлений какого-либо события.
Обычно, с частотой
появления события имеют дело, когда переменные измерены в шкале наименований
и другой их характеристики, кроме частоты подобрать невозможно или проблематично. Другими словами, когда переменная имеет качественные характеристики.
Слайд 52Так же многие исследователи склонны переводить баллы теста в уровни
(высокий, средний, низкий) и строить таблицы распределений баллов, чтобы узнать
количество человек по этим уровням.
Чтобы доказать, что в одном из уровней (в одной из категорий) количество человек действительно больше (меньше) так же используется коэффициент Хи-квадрат.
Слайд 53Процентное распределение
по вегетативному тонусу
Всего – 15 человек
Ваготония -2
Эйтония- 6
Всего
– 15 человек
Ваготония -11
Эйтония- 4
Слайд 54Во вводную таблицу необходимо ввести количество с ваготонией до (2
человека) и после (11 человек) и не имеющих этого признака
(разность между общей численностью группы и числом лиц с данным признаком)
Таблицы сопряженности 2×2