Слайд 1Методология научных исследований
Лекции 3-4 Статистическая обработка результатов
Слайд 2План
1. Общее понятие о статистике
2. Представление данных
3. Описательная статистика
4. Индуктивная
статистика
Слайд 3Литература
Руководство по проведению научных исследований в области биологии для студентов
и аспирантов / сост. Л.А.Гайсина, А.И.Фазлутдинова, Ю.З.Габидуллин Уфа: Изд-во БГПУ,
2008. 72с.
http://www.statsoft.ru.
Слайд 41. Общее понятие о статистике
Слово «статистика» часто ассоциируется со словом
«математика», и это пугает студентов, связывающих это понятие со сложными
формулами, требующими высокого уровня абстрагирования.
Статистика – это прежде всего способ мышления, и для ее применения нужно лишь иметь немного здравого смысла и знать основы математики. В нашей повседневной жизни мы, сами о том не догадываясь, постоянно занимаемся статистикой.
Слайд 5Общее понятие о статистике
Все эти виды деятельности мало отличаются от
тех операций, которые лежат в основе научного исследования. Они состоят
в синтезе данных, в их сравнении и сопоставлении, в предсказании определенных фактов на основании тех выводов, к которым приводят полученные результаты.
Именно в этом заключается цель статистики в науке. Без статистики выводы в большинстве случаев были бы чисто интуитивными и не могли бы составлять солидную основу для интерпретации данных, полученных в других исследованиях (Годфруа, 1992).
Слайд 6Разделы статистики
Рассмотрим в самых общих чертах три главных раздела статистики.
1. Описательная
статистика, как следует из названия, позволяет описывать, подытоживать и воспроизводить
в виде таблиц или графиков данные того или иного распределения, вычислять среднее для данного распределения и его размах и дисперсию.
2. Задача индуктивной статистики – проверка того, можно ли рас-пространить результаты, полученные на данной выборке, на всю популяцию, из которой взята эта выборка. Иными словами, правила этого раздела статистики позволяют выяснить, до какой степени можно путем индукции экстраполировать на большее число объектов ту или иную закономерность, обнаруженную при изучении их ограниченной группы в ходе какого-либо наблюдения или эксперимента. Таким образом, при помощи индуктивной статистики делают выводы и обобщения исходя из данных, полученных при изучении выборки.
Слайд 7Разделы статистики
3. Наконец, измерение корреляции позволяет узнать, насколько связаны между собой
две переменные, с тем, чтобы можно было предсказывать возможные значения
одной из них, если мы знаем другую.
Существуют две разновидности статистических методов или тестов, позволяющих делать обобщение или вычислять степень корреляции. Первая разновидность – это наиболее широко применяемые параметрические методы, в которых используются такие параметры, как среднее значение или дисперсия данных. Вторая разновидность – это непараметрические методы, оказывающие неоценимую услугу в том случае, если исследователь имеет дело с очень малыми выборками или с качественными данными; эти методы очень просты с точки зрения как расчетов, так и применения (Год-фруа, 1992).
Слайд 82. Представление данных
Одна из задач статистики состоит в том, чтобы
анализировать данные, полученные на части популяции, а затем сделать выводы
относительно популяции в целом.
Популяция в статистике не обязательно означает какую-либо группу людей или естественное сообщество; этот термин относится ко всем существам или предметам, образующим общую изучаемую совокупность, будь то атомы или студенты, посещающие то или иное кафе.
Выборка – это небольшое количество элементов, отобранных с помощью научных методов так, чтобы она была репрезентативной, т. е. отражала популяцию в целом.
Слайд 9Представление данных
Данные в статистике – это основные элементы, подлежащие анализу.
Данными могут быть какие-то количественные результаты, свойства, присущие определенным членам
популяции, место в той или иной последовательности – в общем, любая информация, которая может быть классифицирована или разбита на категории с целью обработки.
Построение распределения – это разделение первичных данных, полученных на выборке, на классы или категории с целью получить обобщенную упорядоченную картину, позволяющую их анализировать.
Слайд 10Представление данных
Существуют три типа данных:
Количественные данные, получаемые при измерениях (например,
данные о весе, размерах, температуре, времени, результатах тестирования и т.п.).
Их можно распределить по шкале с равными интервалами.
Порядковые данные, соответствующие местам этих элементов в последовательности, полученной при их расположении в возрастающем порядке (1-й, ..., 7-й, ..., 100-й, ...; А, Б, В, ...).
Качественные данные, представляющие собой какие-то свойства элементов выборки или популяции. Их нельзя измерить, и единственной их количественной оценкой служит частота встречаемости (число лиц с голубыми или с зелеными глазами, курильщиков и не курильщиков утомленных и отдохнувших, сильных и слабых и т. п.).
Слайд 11Составление таблиц
Таблицы относятся к наиболее простому способу представления данных. Они
состоят из колонок со значениями двух или более связанных переменных.
С помощью этого метода трудно получить прямое и ясное указание на связь между переменными, но он часто является первым этапом регистрации информации и служит основой для выбора последующей формы графического представления данных (Грин и др., 1996).
Слайд 12Графическое представление данных
График – это двухмерное изображение зависимости между двумя
или более переменными.
График самой простой формы строится на двух
осях.
По вертикальной оси (оси y) откладываются значения, называемые ординатами, которые показывают величину зависимой переменной, т.е. функции. Это – «неизвестное количество», иными словами переменная, значения которой не выбираются экспериментатором.
Горизонтальная ось х несет значения, называемые абсциссами, которые показывают величину независимой переменной. Это – «известное количество», т. е. переменная, значения которой выбираются экспериментатором.
Слайд 13Пример графика
График зависимости между средней высотой проростков овса и продолжительностью
роста (Грин и др., 1996)
Слайд 14Распределение частот
Существует множество отношений между переменными, при которых каждое значение
зависимой переменной, соответствующее значению независимой переменной, представляет собой число событий,
приходящихся на данное значение независимой переменной, т.е. ее частоту. Такие отношения можно описать функцией распределения частот, или просто распределением, например, дождевых червей по длине тела в популяции.
Если независимая переменная может принимать любые значения в пределах данного ряда, то распределение частот можно представить в виде обычного графика, как это описано выше. Такие графики называются кривыми распределения и в зависимости от рода данных могут иметь одну из форм, описанных ниже. Если данные представляют собой численность организмов в пределах определенного интервала, то распределение называется непрерывным, а все пространство под кривой составляет общую частоту событий.
Слайд 15Распределение частот
Кривая нормального распределения.
В этом случае распределение частот симметрично относительно
центрального значения, а рассматриваемые переменные относятся к физическим параметрам, таким,
как рост или масса биологического объекта.
Этот тип распределения показан на рисунке
Представленная в виде таблицы численность 18-летних мужчин в каждом классе массы по 2 кг. Б. Графическое изображение данных из табл. А. дает кривую нормального распределения (Грин и др., 1996)
Слайд 16Распределение частот
Положительный уклон.
Кривая распределения в этом случае несимметрична. Наибольшие частоты
независимой переменной приходятся на ее более низкие значения, а по
направлению к более высоким значениям кривая начинает «хвостить». В качестве примера такого распределения можно привести распределение числа детей, приходящихся на одну семью, размеров кладки у птиц, плотности фитопланктона с увеличением глубины (Грин и др., 1996).
Распределение с положительным уклоном. Б. Распределение с отрицательным уклоном (Грин и др., 1996)
Слайд 17Распределение частот
Отрицательный уклон.
В этом случае наибольшие частоты независимой переменной приходятся
на ее более высокие значения, а по направлению к более
низким значениям кривая начинает «хвостить». Эта форма распределения встречается реже, чем предыдущая; она характерна для распределения некоторых форм смещения.
Например, распределение оптимальных температур ферментативных реакций и выработка стимулирующих гормонов щитовидной железы в ответ на действие тироксина.
Бимодальное распределение.
В этом случае наблюдаются два максимума (или два пика), что обычно указывает на присутствие двух популяций, для каждой из которых характерно неполное нормальное распределение.
Слайд 18Диаграмма
Если независимая переменная принимает дискретные значения, например, целые числа 3
и 5 (как число лепестков у двудольных), или ею представлены
физические признаки, такие, например, как группы крови, которые характеризуются дискретными значениями, то распределение не будет непрерывным. В этом случае нельзя начертить непрерывную кривую, поэтому используются другие, описанные ниже формы графического изображения данных (Грин и др., 1996).
Слайд 19Диаграмма
Диаграмма в виде вертикальных столбцов. Она показывает частоту, с которой
определенные признаки встречаются внутри популяции. Например, при помощи такой диаграммы
можно отобразить частоту групп крови у человека.
Гистограмма. Она строится на непрерывных значениях независимой переменной, сгруппированных в классы равной ширины.
Когда классы равной ширины выбраны, например 0-5, 5-10, 10-15 и т.д., границы интервалов обычно проходят по числам меньшим, чем указанные целые значения, т.е. 0-4,99; 5-9,99; 10-14,99 и т.д.
В форме гистограммы удобно представлять данные, характеризующие наибольшие выборки. Внешне гистограммы похожи на диаграммы в виде вертикальных столбцов.
Слайд 20Описательная статистика
Описательная статистика позволяет обобщать первичные результаты, полученные при наблюдении
или в эксперименте. Процедуры здесь сводятся к группировке данных по
их значениям, построению распределения их частот, выявлению центральных тенденций распределения (например, средней арифметической) и, наконец, к оценке разброса данных по отношению к найденной центральной тенденции.
После того как данные записаны в виде ряда характеризующих переменные значений, например, таких, как рост или частота сокращений сердца, полезно подсчитать их среднее значение и разброс значений. Оценки среднего значения называются характеристиками расположения относительно центра. Они включают среднее, медиану и моду. Оценки разброса величин называются мерой рассеяния, они включают дисперсию и стандартное отклонение (Годфруа, 1992).
Слайд 21Характеристики расположения относительно центра. Среднее (среднее арифметическое)
Среднее (среднее арифметическое)
Это «средняя
величина» группы значений, которую получают путем сложения всех значений и
деления суммы на число сложенных значений. Например, среднее для значений , подсчитывается следующим образом:
Слайд 23Мода
Это значение переменной, встречающееся наиболее часто. Например, если число детей
в десядесяти семьях соответственно равно 1, 1, 1, 2, 2,
2, 2, 3, 4, то мода равна 2.
Слайд 24Соотношение средних величин
Каждое из трех значений, описанных выше, имеет свои
преимущества и недостатки и применяется при решении определенных задач. Проиллюстрировать
применение среднего или моды можно на примере с различным числом детей в семьях. Среднее число детей в семье составляет 2,4, но так как ребенок – величина дискретная, естественно описывать число детей в семье в целых числах, т. е. с помощью моды, которая равна 2.
В случае нормального распределения значения среднего, медианы и моды совпадают. В случае того или иного уклона частоты распределения их значения не совпадают (Грин и др., 1996).
Положение среднего, медианы и моды при нормальном распределении (А) и при распределении с уклоном (Б) (Грин и др., 1996)
Слайд 25Оценки дисперсии
Для того чтобы оценить, в какой мере значения признака
отклоняются от среднего, вычисляют среднее и дисперсию. Для нормального распределения
это проиллюстрировано двумя кривыми на рисунке. При статистическом анализе данных очень информативной является оценка среднего квадратичного или стандартного отклонения; по этим показателям можно предсказать и распределение значений вокруг среднего и ответить на вопрос, достоверна ли разница между двумя группами данных.
Две кривые нормального распределения, демонстрирующие распределение двух совокупностей данных с одинаковой общей частотой (т. е. площади под кривыми равны). Кривая А построена по ограниченному ряду значений, сгруппированных вокруг среднего. Кривая Б построена по широкому ряду значений, не сгруппированных вокруг среднего (Грин и др., 1996)
Слайд 28Стандартное отклонение
В этой популяции имеющих общее происхождение блюдечек среднее максимальное
значение диаметра раковины равно 38,3 мм, а стандартное отклонение равно
2,7 мм (округлили до одной десятой). Если эти значения применить к более крупной популяции блюдечек общего происхождения, то на основе статистики можно предположить, что приблизительно 68% популяции будет иметь диаметр раковины 38,3 мм плюс-минус одно стандартное отклонение (2,7 мм), т.е. размеры раковин будут лежать в интервале от 35,6 до 41,0 мм; приблизительно 95% популяции будут иметь диаметр раковины 38,3 мм плюс-минус два стандартных отклонения (5,4 мм), т. е. диаметры будут лежать в интервале 32,9-43,7 мм, а практически 100% будут лежать в интервале плюс-минус три стандартных отклонения от 38,3 мм.
Слайд 31Связь между переменными
Данные всегда необходимо представлять таким образом, чтобы можно
было выявить связи между двумя или более их совокупностями. Проще
всего это сделать с помощью графика или диаграммы, показывающих связь между переменными. Но это целесообразно только в том случае, если одна из переменных (независимая переменная) находится под контролем экспериментатора, как, например, в случае, приведенном на рисунке.
В других случаях, когда обе переменные являются независимыми, составляют таблицу, в которой значение одной помещают под соответствующим значением другой. На основе этих данных вычерчивают график, который называется диаграммой рассеяния.
Данные о массе и соответствующем росте 20- и 16-летних студентов мужского пола представлены в виде таблицы (А) и диаграммы рассеяния (Б). Построена кривая регрессии (Грин и др., 1996)
Слайд 32Линия регрессии
По внешнему виду графика видно, что эти две переменные
связаны между собой некоторым образом, но эту связь невозможно описать
более точно до тех пор, пока они не будут представлены в виде прямой линии, проходящей через точки графика.
Эта линия называется «линией наибольшего соответствия», или линией регрессии. Мера приближения точек к линии указывает на степень корреляции между двумя переменными.
Линия наибольшего соответствия должна проходить через точку, соответствующую среднему значению массы и роста ( кг, см), а число точек над и под линией должно быть приблизительно одинаковым. По этой линии можно подсчитать рост, соответствующий определенной массе (Грин и др., 1996).
Слайд 33Индуктивная статистика
Задачи индуктивной статистики заключаются в том, чтобы определять, насколько
вероятно, что две выборки принадлежат к одной популяции.
Для этого необходимо
наложить друг на друга, с одной стороны, две кривые – до и после воздействия – для контрольной группы и, с другой стороны, две аналогичные кривые для опытной группы. При этом масштаб кривых должен быть одинаковым.
А
Б
Реакция на воздействие в контрольной и опытной группах.
А – контрольная группа; Б – опытная группа.
1– фон; 2 – реакция на воздействие (Годфруа, 1992).
Слайд 34Индуктивная статистика
Видно, что в контрольной группе разница между средними обоих
распределений невелика, и поэтому можно предположить, что обе выборки принадлежат
к одной и той же популяции. Напротив, в опытной группе большая разность между средними позволяет сделать вывод о том, что распределения для фона и воздействия относятся к двум различным популяциям, разница между которыми обусловлена тем, что на одну из них повлияла независимая переменная (Годфруа, 1992).
Слайд 35Проверка гипотез
Как уже говорилось, задача индуктивной статистики – определять, достаточно
ли велика разность между средними двух распределений для того, чтобы
можно было объяснить ее действием независимой переменной, а не случайностью, связанной с малым объемом выборки (как, по-видимому, обстоит дело в случае с опытной группой эксперимента).
При этом возможны две гипотезы:
1) нулевая гипотеза (Н0), согласно которой разница между распределениями недостоверна; предполагается, что различие недостаточно значительно, и поэтому распределения относятся к одной и той же популяции, а независимая переменная не оказывает никакого влияния;
2) альтернативная гипотеза (Н1), какой является рабочая гипотеза данного исследования. В соответствии с этой гипотезой различия между обоими распределениями достаточно значимы и обусловлены влиянием независимой переменной.
Слайд 36Проверка гипотез
Основной принцип метода проверки гипотез состоит в том, что
выдвигается нулевая гипотеза Н0, с тем чтобы попытаться опровергнуть ее
и тем самым подтвердить альтернативную гипотезу H1. Действительно, если результаты статистического теста, используемого для анализа разницы между средними, окажутся таковы, что позволят отбросить Н0, это будет означать, что верна Н1, т.е. выдвинутая рабочая гипотеза подтверждается.
Принято считать, что нулевую гипотезу можно отвергнуть в пользу альтернативной гипотезы, если по результатам статистического теста вероятность случайного возникновения найденного различия не превышает 5 из 100. Если же этот уровень достоверности не достигается, считают, что разница вполне может быть случайной и поэтому нельзя отбросить нулевую гипотезу (Годфруа, 1992).
Слайд 37Проверка гипотез
Для того чтобы судить о том, какова вероятность ошибиться,
принимая или отвергая нулевую гипотезу, применяют статистические методы, соответствующие особенностям
выборки.
Так, для количественных данных при распределениях, близких к нормальным, используют параметрические методы, основанные на таких показателях, как средняя и стандартное отклонение. В частности, для определения достоверности разницы средних для двух выборок применяют метод Стьюдента, а для того чтобы судить о различиях между тремя или большим числом выборок, – тест F, или дисперсионный анализ.
Если же мы имеем дело с неколичественными данными или выборки слишком малы для уверенности в том, что популяции, из которых они взяты, подчиняются нормальному распределению, тогда используют непараметрические методы – критерии χ2 (хи) для качественных данных и критерии знаков, рангов, Манна-Уитни, Вилкоксона и другие для порядковых данных.
Слайд 38Уровни достоверности (значимости)
Уровни достоверности (значимости)
Тот или иной вывод с некоторой
вероятностью может оказаться ошибочным, причем эта вероятность тем меньше, чем
больше имеется данных для обоснования этого вывода. Таким образом, чем больше получено результатов, тем в большей степени по различиям между двумя выборками можно судить о том, что действительно имеет место в той популяции, из которой взяты эти выборки.
Однако обычно используемые выборки относительно невелики, и в этих случаях вероятность ошибки может быть значительной. В гуманитарных науках принято считать, что разница между двумя выборками отражает действительную разницу между соответствующими популяциями лишь в том случае, если вероятность ошибки для этого утверждения не превышает 5%, т.е. имеется лишь 5 шансов из 100 ошибиться, выдвигая такое утверждение. Это так называемый уровень достоверности (уровень надежности, доверительный уровень) различия. Если этот уровень не превышен, то можно считать вероятным, что выявленная нами разница действительно отражает положение дел в популяции (отсюда еще одно название этого критерия – порог вероятности).
Слайд 39Уровни достоверности (значимости)
Для каждого статистического метода этот уровень можно узнать
из таблиц распределения критических значений соответствующих критериев (t, χ2 и
т.д.); в этих таблицах приведены цифры для уровней 5% (0,05), 1% (0,01) или еще более высоких.
Если значение критерия для данного числа степеней свободы оказывается ниже критического уровня, соответствующего порогу вероятности 5%, то нулевая гипотеза не может считаться опровергнутой, и это означает, что выявленная разница недостоверна (Годфруа, 1992).
Слайд 40Параметрические методы. Метод Стьюдента (t-тест)
Метод Стьюдента (t-тест)
Это параметрический метод, используемый
для проверки гипотез о достоверности разницы средних при анализе количественных
данных о популяциях с нормальным распределением и с одинаковой вариансой.
Метод Стьюдента различен для независимых и зависимых выборок. Независимые выборки получаются при исследовании двух различных групп испытуемых (в нашем эксперименте это контрольная и опытная группы).
Слайд 42Метод Стьюдента
Если наш результат больше, чем значение для уровня достоверности
0,05 (вероятность 5%), найденное в таблице, то можно отбросить нулевую
гипотезу (Н0) и принять альтернативную гипотезу (Н1), т.е. считать разницу средних достоверной.
Если же, напротив, полученный при вычислении результат меньше, чем табличный (для n – 2 степеней свободы), то нулевую гипотезу нельзя отбросить и, следовательно, разница средних недостоверна (Годфруа, 1992).
Слайд 43Степени свободы
Для того чтобы свести к минимуму ошибки, в таблицах
критических значений статистических критериев в общем количестве данных не учитывают
те, которые можно вывести методом дедукции. Оставшиеся данные составляют так называемое число степеней свободы, т. е. то число данных из выборки, значения которых могут быть случайными.
Так, если сумма трех данных равна 8, то первые два из них могут принимать любые значения, но если они определены, то третье значение становится автоматически известным. Если, например, значение первого данного равно 3, а второго – 1, то третье может быть равным только 4. Таким образом, в такой выборке имеются только две степени свободы. В общем случае для выборки в n данных существует n – 1 степень свободы.
Слайд 44Степени свободы
Если у нас имеются две независимые выборки, то число
степеней свободы для первой из них составляет n1 – 1,
а для второй – n2 – 1. А поскольку при определении достоверности разницы между ними опираются на анализ каждой выборки, число степеней свободы, по которому нужно будет находить критерий t в таблице, будет составлять (n1 + n2) - 2.
Если же речь идет о двух зависимых выборках, то в основе расчета лежит вычисление суммы разностей, полученных для каждой пары результатов (т. е., например, разностей между результатами до и после воздействия на одного и того же испытуемого). Поскольку одну (любую) из этих разностей можно вычислить, зная остальные разности и их сумму, число степеней свободы для определения критерия t будет равно n – 1 (Годфруа, 1992).