Статистические методы в научных исследованиях

Содержание

1. Статистические методы в научных исследованиях
2. Эмпирические данные– это данные, полученные в результате
3. Количественные данные– это данные, получаемые при измерениях
4. Выборка – это ограниченная по численности группа
5. Репрезентативность – это способность выборки представлять изучаемые
6. Статистическая достоверность- определяется при помощи методов статистического вывода. Они предъявляют требования к численности или объему выборки.
7. Строгих рекомендаций по определению объема выборки нет,
8. Виды выборок:зависимая выборка – каждому испытуемому 1
9. Уровень значимости – это вероятность того, что
10. р-уровень значимости- вероятность случайного получения такого (или
11. Интерпретация уровней значимости
12. Как правильно представить результаты исследования?в таблицах Ехсеl
13. Слайд 13
14. С чего начать обработку результатов?С проверки нормальности распределения!
15. Нормальное распределение характеризуется тем, что крайние значения
16. Нормальное распределение
17. Слайд 17
18. Слайд 18
19. Какие использовать тесты?Колмогорова -СмирноваШапиро-Уилка (предпочтительнее, особенно при
20. Слайд 20
21. Получаем р=0,16836, т.е. различий нет, данные распределены нормально
22. Слайд 22
23. Получаем р=0,00016, т.е. различия есть, распределение данных не соответствует нормальному
24. Как выбрать метод ?Если Вы имеете дело
25. Сравнения двух выборок
26. Выбор параметрического метода
27. Например сравнение средних показателей уровня утомления у мальчиков (26 человек) и девочек (54 человека)
28. Слайд 28
29. То есть, различия статистически значимы Результаты вычислений
30. Непараметрические методыУсловия, когда применение непараметрических методов является
31. Выбор непараметрического метода
32. Самым популярным и наиболее чувствительным (мощным) аналогом
33. Ограничения критерия:- в каждой выборке должно быть
34. Например сравнение средних показателей количества шагов в сутки у мальчиков (11 человек) и девочек (17 человек)
35. То есть, различия обнаружены на уровне тенденций
36. Самым чувствительным (мощным) аналогом критерия t-Стъюдента для
37. Суть метода состоит в том, что мы
38. Средние показатели САДp = 0,04 (
39. Корреляционный анализКорреляционная связь – это согласование изменения
40. Виды корреляционной связи:По формеПрямолинейная Криволинейная (между мотивацией
41. Виды корреляционной связи:По направлению и знаку:Прямая (положительная)
42. Виды корреляционной связи:По силе:Сила связи не зависит
43. Виды корреляционной связи:По достоверности:Высокая значимая корреляция р ≤ 0,01Значимая корреляция р ≤ 0,05Незначимая корреляция р >0,05
44. Факторы, влияющие на корреляцию:Выбросы – экстремально большие
45. Корреляционные матрицы Часто корреляционный анализ включает в себя
46. Слайд 46
47. После решения проблемы статистической значимости элементов корреляционной
48. Слайд 48
49. Качественный анализ данных (процентное распределение)
50. "Хи-квадрат" Критерий "Хи-квадрат" позволяет сравнивать распределения частот вне зависимости от того, распределены они нормально или нет.
51. Под частотой понимается количество появлений какого-либо события.
52. Так же многие исследователи склонны переводить баллы
53. Процентное распределение по вегетативному тонусуВсего – 15 человекВаготония -2Эйтония- 6Всего – 15 человекВаготония -11Эйтония- 4
54. Во вводную таблицу необходимо ввести количество с
55. Скачать презентанцию

Эмпирические данные– это данные, полученные в результате исследования, всегда опосредованы использованием какой-либо измерительной процедуры, методики или теста

Главная
Разное
Статистические методы в научных исследованиях

Слайды и текст этой презентации

Слайд 1Статистические методы в научных исследованиях
Частоедова И.А. – зав. кафедрой нормальной

физиологии, к.м.н., доцент

Слайд 2Эмпирические данные– это данные, полученные в результате исследования, всегда опосредованы

использованием какой-либо измерительной процедуры, методики или теста

Эмпирические данные– это данные, полученные в результате исследования, всегда опосредованы использованием какой-либо измерительной процедуры, методики или теста

Слайд 3Количественные данные– это данные, получаемые при измерениях (результаты тестирования в

баллах)
Порядковые данные – это данные соответствующие местам этих элементов в

последовательности, полученной при их расположении в возрастающем порядке (ранжирование)
Качественные данные представляют собой какие-то свойства элементов выборки или популяции, их нельзя измерить, оценкой служит частота встречаемости.

Количественные данные– это данные, получаемые при измерениях (результаты тестирования в баллах)Порядковые данные – это данные соответствующие местам

Слайд 4Выборка – это ограниченная по численности группа объектов, специально отбираемая

из генеральной совокупности для изучения ее свойств. Изучение на выборке

свойств генеральной совокупности называется выборочным исследованием.

Выборка – это ограниченная по численности группа объектов, специально отбираемая из генеральной совокупности для изучения ее свойств.

Слайд 5Репрезентативность – это способность выборки представлять изучаемые явления достаточно полно

– с точки зрения их изменчивости в генеральной совокупности. Репрезентативность

выборки является основным критерием при определении границ генерализации выводов исследования.
Способы обеспечения репрезентативности:
простой (случайный) рандомизированный отбор
стратифицированный (случайный) отбор – с учетом качеств, которые могут повлиять на изменчивость изучаемого свойства

Репрезентативность – это способность выборки представлять изучаемые явления достаточно полно – с точки зрения их изменчивости в

Слайд 6Статистическая достоверность- определяется при помощи методов статистического вывода. Они предъявляют

требования к численности или объему выборки.

Статистическая достоверность- определяется при помощи методов статистического вывода. Они предъявляют требования к численности или объему выборки.

Слайд 7Строгих рекомендаций по определению объема выборки нет, тем не менее,

можно сформулировать наиболее общие рекомендации:
наибольший объем выборки необходим при разработке

диагностической методики от 200 до 1000 – 2000 человек
при сравнении 2 выборок их общая численность д.б. не менее 50 чел
При изучении взаимосвязи между к-л свойствами объем выборки д.б. не менее 30 - 35 чел
Чем больше изменчивость изучаемого свойства, тем больше д.б. объем выборки. При этом уменьшаются возможности генерализации выводов.

Строгих рекомендаций по определению объема выборки нет, тем не менее, можно сформулировать наиболее общие рекомендации:наибольший объем выборки

Слайд 8Виды выборок:
зависимая выборка – каждому испытуемому 1 выборки соответствует испытуемый

2 выборки
независимая выборка – испытуемые в выборках не зависят друг

от друга

Виды выборок:зависимая выборка – каждому испытуемому 1 выборки соответствует испытуемый 2 выборкинезависимая выборка – испытуемые в выборках

Слайд 9Уровень значимости – это вероятность того, что различия сочли существенными,

что они не случайны
В биологических и медицинских исследованиях приняты 5%

и 1% уровни значимости

Уровень значимости – это вероятность того, что различия сочли существенными, что они не случайныВ биологических и медицинских

Слайд 10р-уровень значимости- вероятность случайного получения такого (или большего) отклонения от

того, что утверждает Н0
Что такое р-уровень ?

Слайд 11Интерпретация уровней значимости

Слайд 12
Как правильно представить результаты исследования?
в таблицах Ехсеl

Слайд 13

Слайд 14
С чего начать обработку результатов?
С проверки нормальности распределения!

Слайд 15Нормальное распределение характеризуется тем, что крайние значения признака в нем

встречаются достаточно редко, а значения, близкие к средней величине –

достаточно часто.
График нормального распределения представляет собой так называемую колокообразную кривую.

Нормальное распределение характеризуется тем, что крайние значения признака в нем встречаются достаточно редко, а значения, близкие к

Слайд 16Нормальное распределение

Слайд 17

Слайд 18

Слайд 19Какие использовать тесты?
Колмогорова -Смирнова
Шапиро-Уилка (предпочтительнее, особенно при небольших выборках (n=3-50)-

обладает наибольшей мощностью (т.е. чаще выявляет различия между распределениями)

Какие использовать тесты?Колмогорова -СмирноваШапиро-Уилка (предпочтительнее, особенно при небольших выборках (n=3-50)- обладает наибольшей мощностью (т.е. чаще выявляет различия

Слайд 20

Слайд 21
Получаем р=0,16836, т.е. различий нет, данные распределены нормально

Слайд 22

Слайд 23
Получаем р=0,00016, т.е. различия есть, распределение данных не соответствует нормальному

Слайд 24Как выбрать метод ?
Если Вы имеете дело с порядковыми и

качественными признаками, то подходят только непараметрические методы.

Если признак числовой,

стоит подумать, нормально ли его распределение. Если данных мало (или Вы не хотите думать о типе распределения) - воспользуйтесь непараметрическими методами.

Как выбрать метод ?Если Вы имеете дело с порядковыми и качественными признаками, то подходят только непараметрические методы.

Слайд 25Сравнения двух выборок

Слайд 26Выбор параметрического метода

Слайд 27Например сравнение средних показателей уровня утомления у мальчиков (26 человек)

и девочек (54 человека)

Слайд 28

Слайд 29То есть, различия статистически значимы
Результаты вычислений

Слайд 30Непараметрические методы
Условия, когда применение непараметрических методов является оправданным:
распределение признака не

соответствует закону нормального распределения
выборка слишком мала, чтобы решить вопрос о

соответствии распределения нормальному- если выборка менее 10 объектов, то результаты применения непараметрических методов можно рассматривать лишь как предварительные
не выполняется требование гомогенности дисперсии при сравнении средних значений для независимых выборок

Непараметрические методыУсловия, когда применение непараметрических методов является оправданным:распределение признака не соответствует закону нормального распределениявыборка слишком мала, чтобы

Слайд 31Выбор непараметрического метода

Слайд 32Самым популярным и наиболее чувствительным (мощным) аналогом критерия t-Стъюдента для

независимых выборок является критерий U-Манна-Уитни. Критерий предназначен для оценки различий

между 2 выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n1, n2 ≥3 или n1 =2, n2≥5.

Самым популярным и наиболее чувствительным (мощным) аналогом критерия t-Стъюдента для независимых выборок является критерий U-Манна-Уитни. Критерий предназначен

Слайд 33Ограничения критерия:
- в каждой выборке должно быть не менее 3

наблюдений, допускается что в 1 выборке 2 наблюдения, тогда в

другой д.б. на менее 5
- в выборке должно быть не более 20 наблюдений, при большем количестве затруднено ранжирование.

Ограничения критерия:- в каждой выборке должно быть не менее 3 наблюдений, допускается что в 1 выборке 2

Слайд 34Например сравнение средних показателей количества шагов в сутки у мальчиков

(11 человек) и девочек (17 человек)

Слайд 35То есть, различия обнаружены на уровне тенденций

Слайд 36Самым чувствительным (мощным) аналогом критерия t-Стъюдента для зависимых выборок является

критерий Т-Вилкоксона.
Критерий применяется для сопоставления показателей, измеренных в 2

разных условиях на одной и той же выборке испытуемых.
Он позволяет установить не только направленность изменений, но и их выраженность.
С его помощью мы определяем, является ли сдвиг показателей в каком-то одном направлении более интенсивным, чем в другом.

Самым чувствительным (мощным) аналогом критерия t-Стъюдента для зависимых выборок является критерий Т-Вилкоксона. Критерий применяется для сопоставления показателей,

Слайд 37Суть метода состоит в том, что мы сопоставляем выраженность сдвигов

в том и ином направлениях по абсолютной величине
Условия применения критерия:
-

обычно применяют на выборках объемом от 12 и более элементов
- минимальное количество испытуемых 5 – максимальное 50

Суть метода состоит в том, что мы сопоставляем выраженность сдвигов в том и ином направлениях по абсолютной

Слайд 38Средние показатели САД
p = 0,04 (

Слайд 39Корреляционный анализ

Корреляционная связь – это согласование изменения двух признаков или

большего множества признаков (множественная корреляция). Она означает, что изменчивость одного

признака находится в некотором соответствии с изменчивостью другого.

Корреляционный анализКорреляционная связь – это согласование изменения двух признаков или большего множества признаков (множественная корреляция). Она означает,

Слайд 40Виды корреляционной связи:

По форме
Прямолинейная
Криволинейная (между мотивацией и эффективностью выполнения

задачи –при повышении мотивации эффективность выполнения задачи вначале возрастает, достигает

оптимума, затем снижается, несмотря на дальнейшее повышение мотивации)

Виды корреляционной связи:По формеПрямолинейная Криволинейная (между мотивацией и эффективностью выполнения задачи –при повышении мотивации эффективность выполнения задачи

Слайд 41Виды корреляционной связи:

По направлению и знаку:
Прямая (положительная) – с увеличением

одного признака второй тоже увеличивается или с уменьшением одного другой

тоже уменьшается
Обратная (отрицательная) – с увеличением одного признака второй уменьшается

Виды корреляционной связи:По направлению и знаку:Прямая (положительная) – с увеличением одного признака второй тоже увеличивается или с

Слайд 42Виды корреляционной связи:

По силе:
Сила связи не зависит от ее направленности.

Коэффициент корреляции r может изменяться от -1 до + 1.

r=0, отсутствие связи.
Классификация связи по силе (по Ивантер Э.В., Коросову А.В., 1992)
Очень слабая (малая, низкая) – 0-0,19
Слабая -0,20 – 0,29
Умеренная - 0,3-0,49
Средняя – 0,50-0,69
Сильная (большая, высокая) – 0,7 – 1,0

Виды корреляционной связи:По силе:Сила связи не зависит от ее направленности. Коэффициент корреляции r может изменяться от -1

Слайд 43Виды корреляционной связи:

По достоверности:
Высокая значимая корреляция р ≤ 0,01
Значимая корреляция

р ≤ 0,05
Незначимая корреляция р >0,05

Слайд 44Факторы, влияющие на корреляцию:

Выбросы – экстремально большие или малые значения

признака.
«Третья» переменная –иногда корряляция между 2 переменными обусловлена не

связью между соответствующими свойствами, а влиянием некоторой общей причины совместной изменчивости этих переменных, которая зачастую выпадает из поля зрения исследователя.
Нелинейные связи –(например – связь тревожности и продуктивности деятельности – вид купола). Можно разделить выборку на подгруппы по выраженности признака и коэффициент корреляции определить отдельно по подгруппам.

Факторы, влияющие на корреляцию:Выбросы – экстремально большие или малые значения признака. «Третья» переменная –иногда корряляция между 2

Слайд 45Корреляционные матрицы
Часто корреляционный анализ включает в себя изучение связей не

двух, а множества переменных, измеренных в количественной шкале на 1

выборке. В этом случае вычисляются корреляции для каждой пары из этого множества переменных. Вычисления проводят на компьютере, а результатом является корреляционная матрица.
Корреляционная матрица – это результат вычисления корреляций одного типа для каждой пары из множества переменных, измеренных в количественной шкале на одной выборке.

Корреляционные матрицы Часто корреляционный анализ включает в себя изучение связей не двух, а множества переменных, измеренных в количественной

Слайд 46

Слайд 47После решения проблемы статистической значимости элементов корреляционной матрицы статистически значимые

корреляции можно представить графически в виде корреляционной плеяды (фигура, состоящая

из вершин и соединяющих ее линий).

После решения проблемы статистической значимости элементов корреляционной матрицы статистически значимые корреляции можно представить графически в виде корреляционной

Слайд 48

Слайд 49Качественный анализ данных (процентное распределение)

Слайд 50"Хи-квадрат"

Критерий "Хи-квадрат" позволяет сравнивать распределения частот вне зависимости от

того, распределены они нормально или нет.

Слайд 51Под частотой понимается количество появлений какого-либо события.

Обычно, с частотой

появления события имеют дело, когда переменные измерены в шкале наименований

и другой их характеристики, кроме частоты подобрать невозможно или проблематично. Другими словами, когда переменная имеет качественные характеристики.

Под частотой понимается количество появлений какого-либо события. Обычно, с частотой появления события имеют дело, когда переменные измерены

Слайд 52Так же многие исследователи склонны переводить баллы теста в уровни

(высокий, средний, низкий) и строить таблицы распределений баллов, чтобы узнать

количество человек по этим уровням.

Чтобы доказать, что в одном из уровней (в одной из категорий) количество человек действительно больше (меньше) так же используется коэффициент Хи-квадрат.

Так же многие исследователи склонны переводить баллы теста в уровни (высокий, средний, низкий) и строить таблицы распределений

Слайд 53Процентное распределение
по вегетативному тонусу
Всего – 15 человек
Ваготония -2
Эйтония- 6
Всего

– 15 человек
Ваготония -11
Эйтония- 4

Слайд 54Во вводную таблицу необходимо ввести количество с ваготонией до (2

человека) и после (11 человек) и не имеющих этого признака

(разность между общей численностью группы и числом лиц с данным признаком)

Таблицы сопряженности 2×2

Во вводную таблицу необходимо ввести количество с ваготонией до (2 человека) и после (11 человек) и не

Скачать презентацию

Разделы презентаций