Слайд 1
Цель и задачи дисциплины
Биометрия (от био... и...метрия), раздел биологии, содержанием
которого являются
планирование
и обработка результатов количественных экспериментов и наблюдений
методами математической статистики.
Слайд 2 Биологической статистикой или биометрией называется область научного знания,
охватывающая
классификацию,
систематизацию
обработку экспериментальных данных
в биологии, медицине
и сельском хозяйстве методами математической статистики.
Слайд 3 С формальной точки зрения биометрия
представляет «совокупность математических методов, применяемых в биологии».
Слайд 4Теория вероятностей
Математическая статистика
Изучает законы
поведения случайных событий и случайных переменных величин
Занимается разработкой теории
выборочного метода
Биометрия
наука прикладная
Имеет дело с
конкретными фактами
Анализирует конкретные факты с помощью методов
математической статистики
теории вероятностей,
составляющих в совокупности то, что называют статистическим анализом.
Разделы математики
Слайд 5Математическая биология подходит к решению биологических проблем дедуктивно, выдвигая на
первый план математические модели с последующей проверкой их опытом.
Биометрия
опирается на индуктивный метод, отправляясь от конкретных фактов, которые она анализирует методами математической статистики и теории вероятностей.
Слайд 6
Биометрия как самостоятельная наука возникла в XIX веке.
Быстрое развитие
теоретической и прикладной математики в XVII веке привело к важным
результатам.
В середине XVII века, независимо одна от другой, зародились еще две ветви точных наук:
теория вероятностей
математическая статистика.
Слайд 7 Дальнейшее развитие биометрия получила главным образом в
трудах английских ученых
Ф. Гальтона (1822-1911)
К. Пирсона (1857-1936),
основавших известную школу биометриков и создавших математический аппарат этой науки.
Слайд 8Френсис Гальтон
Заложил основы новой науки и дал ей имя.
Впервые применил статистический метод
А. Кетле
к решению кардинальной проблемы
наследственности и изменчивости организмов.
Разрабатывает методику регрессного и корреляционного анализа, вошедшую в золотой фонд биометрии.
1822-1911
Слайд 9Подтвердил вывод А. Кетле
не только физические признаки, но
и умственные способности человека распределяются по нормальному закону, описываемому формулой
Гаусса-Лапласа.
Слайд 10Карл Пирсон
1857 – 1936
1893 г. - понятие среднего квадратического
отклонения
- коэффициента вариации
1898 г. – разрабатывает основы множественной
регрессии
1903 г . - разработал основы теории сопряженности признаков
1905 г. - опубликовал основы нелинейной корреляции и регрессии
- обоснование метода хи-квадрат
- развил учение о типах кривых распределения
- разработал методику построения множественной регрессии
Слайд 11С именем К. Пирсона (1857 – 1936) связано:
- - обоснование
метода хи-квадрат, получившего широкое распространение в биометрии;
- развил учение
о типах кривых распределения;
- развил теорию линейной и нелинейной корреляции;
- разработал методику построения множественной регрессии.
Слайд 12Рональд Фишер
1890-1962
Создана методология современной биометрии
Впервые показал, что
планирование экспериментов и наблюдений и обработка их результатов — две
неразрывно связанные задачи статистического анализа.
Слайд 13 Р. Фишером были разработаны:
- теория выборочных распределений;
- методы
дисперсионного и дискриминантного анализа;
- теории планирования экспериментов;
метод максимального правдоподобия,
и многое другое, что составляет основу современной прикладной статистики и математической генетики.
Такое сочетание статистики и генетики не является чем-то редким.
Слайд 14Распространение биометрических идей и методов русскими учёными
Слайд 15Четвериков Сергей Сергеевич
Первым, кто еще в 1919 г. начал
читать студентам МГУ курс биометрии с основами генетики, был С.С.
Четвериков.
В 1924 г. в МГУ уже самостоятельный курс биометрии.
Слайд 16Филипченко Юрий Александрович -
советский биолог и генетик, известный
своей педагогической и научно-организаторской деятельностью
Его научные интересы охватывали:
генетику
качественных и количественных признаков, включая наследование таланта у человека, евгенику,
генетические основы эволюции.
Он предложил понятия «микроэволюция» и «макроэволюция».
1882-1930
Организовал при ЛГУ первую в России и вторую в мире кафедру генетики.
Основатель ленинградской школы биометриков.
Слайд 17 Статистические методы обработки экспериментальных данных используют для:
характеристики биологических явлений
технологических процессов производства
переработки сельскохозяйственной продукции.
Слайд 18Необходимость статистической обработки данных
При переходе от описательного
метода анализа биологических явлений к экспериментальному.
Признаки и свойства характеризуются
количественными вариациями частоты встречаемости или степени проявления.
Каковы возможные пределы случайных колебаний изучаемой величины и являются ли наблюдаемые разницы между вариантами опыта случайными или достоверными.
Слайд 19 Необходимость использования статистических расчетов экспериментальных данных
1. Все биологические объекты
обладают двумя противоположными свойствами: наследственностью и изменчивостью. Широкая амплитуда изменчивости
признаков у различных объектов требует усреднения данных, оценить границы изменчивости и силу связи между признаками.
Слайд 202. Все биологические явления и свойства подчиняются статистическим закономерностям, характерным
не отдельным объектам, а целым совокупностям объектов.
Слайд 21
Статистические методы анализа биологических объектов позволяют
определить средние величины изучаемого признака
(среднее арифметическое – ; мода – Мо; медиана – Ме);
установить
характер и тип распределения объектов с разными параметрами признака (нормальное, биноминальное, Пуассона и др.)
- выявить изменчивость признака с помощью среднего квадратического (или стандартного) отклонения (σ), вариансы (σ2), дисперсии (S), коэффициента изменчивости (Сv);
Слайд 22
Статистические методы анализа биологических объектов позволяют
оценить значимость различия показателей в
разных совокупностях (использования критерия достоверности Стьюдента, Фишера, метода χ2 и
других непараметрических методов);
определить величину и направление связи между переменными величинами признаков объектов совокупности (коэффициенты корреляции (r) и регрессии (R); ранговый коэффициент Спирмена (rs));
- изучить степень влияния того или иного фактора на изменчивость анализируемого признака (дисперсионный анализ) и прогнозировать показатели-отклики при заданных значениях воздействующих факторов.
Слайд 23Предметом биометрической генетики служит группа биологических объектов, которая составляет совокупность.
Всякое
множество идентифицируемых объектов, отличающихся друг от друга незначительно по конкретному
признаку, но сохраняющих сходство по некоторым существенным характеристикам, называется совокупностью.
Совокупностями могут являться сорта, виды растений, делянка или поле растений.
Совокупность состоит из единиц или членов. Число единиц, входящих в совокупность, называется объектом совокупности и обозначается буквой n. Единица совокупности характеризуется определенными признаками.
Величину изучаемого признака для отдельной единицы совокупности называют вариантой и обозначают х1, х2, х3, …, а в общем виде хi, где индекс i означает порядковый номер варианты.
Например, при изучении урожая пшеницы определенного сорта с 1 га получены следующие данные 25, 27, 28,5 ц. Эти величины и будут вариантами, т.е. х1=25, х2=27, х3=28,5.
Слайд 24Различия между отдельными вариантами называются изменчивостью или вариацией.
Различают количественную
и качественную изменчивость.
Количественная изменчивость бывает двух типов:
- прерывная
(дискретная)
- непрерывная.
Если же различия определяются целыми числами, то это будет прерывная (дискретная) изменчивость. Так, число колосков выражается целым числом 11, 12, 13 и т.д.
При непрерывной изменчивости между вариантами нет четких границ и переходов, различия между вариантами определяются точностью измерений (длина колоса, вес зерна, колоса).
Качественные признаки – это признаки, которые описываются словами и отражают качественные характеристики объекта.
Например: окраска семян гороха (желтая и зеленая).
Большинство качественных признаков характеризуется альтернативной изменчивостью. Например: здоровые и больные растения.
Слайд 252. Генеральная и выборочная совокупность
Генеральная совокупность – все множество
имеющихся объектов.
Под генеральной совокупностью понимается все множество возможных объектов, характеризующихся
определенным признаком .
Выборка (выборочная совокупность) – набор объектов, случайно отобранных из генеральной совокупности.
Репрезентативная выборка (представительной).
Если в выборку входит до 30 членов, она называется малой (n < 30), а свыше 30 – большой (n > 30).
Из выборки можно выбрать еще меньшую выборку.
Объем генеральной совокупности N и объем выборки n – число объектов в рассматриваемой совокупности.
Слайд 26Исходные данные
45 49 50 51
52 53 54 54 63
60
49 50 52 53 62 61 59 57 56 55
50 51 52 53 59 57 56 55 55 54
51 52 53 54 55 55 54 55 54 53
52 53 58 56 55 54 53 52 51 54
54 60 57 56 55 54 53 51 54 49
54 59 55 54 53 52 54 47 54 55
59 55 60 52 54 48 58 57 54 58
52 48 50 54 56 54 57 51 46 54
53 55 56 55 47 50 52 51 55 55
Слайд 27Последовательность вариант, записанных в порядке возрастания, называют вариационным рядом, а
перечень вариант и соответствующих им частот или относительных частот –
статистическим рядом.
Слайд 29 Статистические показатели
для характеристики совокупности
Слайд 31Основные параметры для характеристики совокупности
Средние величины
Показатели изменчивости
признака
Слайд 32Статистические показатели для характеристики совокупности
Средние величины
Среднее арифметическое (
) показывает, какое значение признака наиболее характерно в целом
для данной совокупности.
- Является обобщенной характеристикой совокупности.
- Она используется как для характеристики отдельных выборочных совокупностей (например, сорта) по какому-либо признаку, так и для сравнения их между собой.
Слайд 35Мода (Мо) – наиболее часто встречающаяся варианта в совокупности.
Медиана (Ме)
– варианта, расположенная в середине (центре) ряда и делящая его
на две равные части. В ряду с чётным числом наблюдений находятся две варианты, тогда за Ме принимается их полусумма.
Слайд 38Если выборочная совокупность имеет одну Мо, то распределение объектов (наблюдений)
в такой выборке будет называться унимодальным.
В случае наличия двух и
более Мо речь идет о би- или полимодальном распределении объектов (наблюдений) в совокупности. Полимодальный ряд распределения свидетельствует о неоднородности выборочной совокупности, т.е. наблюдается объединение качественно различных совокупностей.
Слайд 41Показатели изменчивости
Для характеристики разнообразия признаков в совокупности служат:
лимиты
варианса
коэффициент вариации
среднее квадратическое отклонение.
Абсолютные показатели
Слайд 43Лимиты (lim) - это максимальное и минимальное значения признака в
совокупности.
Чем больше разность между максимальной (max) и минимальной (min)
вариантой, тем выше изменчивость признака. Однако при одинаковых лимитах изменчивость в сравниваемых группах может различаться, так как лимиты не учитывают распределения отдельных вариант в совокупности.
Слайд 44Дисперсия (S) – сумма квадратов отклонений каждой варианты от среднего
арифметического.
Слайд 46113.611.
Значения далеко отстоят от мат. ожидания, что и приводит к
большому
значению дисперсии.
113.611.
174.5 см.
Слайд 47Вариансой, или средним квадратом, называют сумму квадратов центральных отклонений, деленную
на число степеней свободы.
df - число степеней свободы, т. е.
количество всех вариант совокупности, уменьшенных на единицу (df= n - 1). Для выборки из 100 особей (n = 100) число степеней свободы равно 99 (n= n - 1 = 100 -1 = 99).
Варианса характеризует степень разнообразия величин, собранных в одну группу. Если выборка составлена из отдельных измерений признака, варианса характеризует разнообразие вариант этой группы по данному признаку.
Если группа составлена из средних величин для выборок, взятых из одной генеральной совокупности, то s2 характеризует получившееся разнообразие этих выборок. В этом случае варианса средних величин s2xi связана с вариансой индивидуальных значений s2 равенствами , где n – одинаковая численность выборок.
Слайд 48Среднее квадратическое или стандартное отклонение
Используется как более точный
показатель для характеристики изменчивости.
Среднее квадратическое отклонение обозначается
греческой буквой σ (сигма).
Слайд 51 Этот показатель указывает, насколько в среднем каждая
варианта отклоняется от среднего арифметического. Эта величина именованная, т.е. выражается
в тех же единицах, что и (кг, см, % и т.д.).
Чем больше величина σ , тем выше изменчивость.
Слайд 55Коэффициент вариации (Сv) показывает, какой процент от средней арифметической составляет
σ .
С помощью коэффициента вариации можно сравнить изменчивость двух
и более групп в отношении признаков, единицы измерения которых могут быть разными (например, число колосков в колосе, масса зерна, длина стебля и т. д.).
При характеристике совокупности коэффициент вариации является дополнительным показателем и должен применяться с основными параметрами и σ .
Относительный показатель
Слайд 57
Вся изменчивость признака лежит от среднего арифметического в пределах ±3,3
σ (±3,3 σ ).
Это называется правилом «плюс-минус трех сигм».
Поэтому средняя арифметическая, увеличенная и уменьшенная на три сигмы, дает практически крайние значения признака при нормальном распределении объектов в совокупности.