Слайд 1Лекция 4:
Планирование эксперимента в научных исследованиях: цели, задачи, основные
понятия
Слайд 2Задачи лекции
Ознакомление с теоретическими основами планирования эксперимента.
Ознакомление с понятиями «ошибки
первого и второго рода».
Демонстрация цены ошибок первого и второго рода.
Ознакомление
с требованиями, предъявляемыми к «хорошему» эксперименту.
Слайд 3Общая схема исследования
1. ПЛАНИРОВАНИЕ
2. ВЫПОЛНЕНИЕ
3. ОПИСАНИЕ
4. ПУБЛИКАЦИЯ
Слайд 4Лирическое отступление
Исследования, выполненные по принципу «Д2ПР», легко опознаются как рецензентами,
так и внимательными читателями и, как правило, не имеют шансов
на успех.
Слайд 5Лирическое отступление
Исследования, выполненные по принципу «Д2ПР», легко опознаются как рецензентами,
так и внимательным читателем и, как правило, не имеют шансов
на успех.
Д2ПР = Давай, давай, потом разберемся!
Слайд 6Общая схема экспериментального исследования
Наблюдения / чтение
научных публикаций
Модель:
объяснение / теория
Гипотеза
Нулевая
(противо-
положная) гипотеза
Эксперимент:
проверка гипотезы
Интерпретация
результатов
Нет оснований
отклонить Н0
Отклоняем
Н0
Проверка
силы анализа
Пересмотр
модели
Слайд 7Общая схема исследования
1. ПЛАНИРОВАНИЕ
Первичный поиск информации;
Выбор темы (включая обоснование
выбора);
Разработка гипотезы (гипотез);
Постановка цели и формулировка задач исследования;
Выбор объекта (предмета)
исследования;
Разработка методов проведения исследования;
Подготовка к сбору данных.
2. ВЫПОЛНЕНИЕ
3. ОПИСАНИЕ
4. ПУБЛИКАЦИЯ
Слайд 8Планирование исследования
Общая цель деятельности:
Подготовка исследования, по результатам которого будет написана
статья с предварительным названием «ZZZ» для журнала «ХХХ».
Слайд 9Планирование исследования
Конкретная задача:
Написание плана НИР
для зануды-шефа
для грантовой заявки
для лаборанта
для самого
себя
Формальный подход
Неформальный подход
Слайд 10Планирование исследования
Сверхзадача:
Написание реально выполнимого плана,
который при минимуме затрат даст максимум
информации,
причем качество и количество информации будут достаточны для подготовки серьезной
статьи для избранного журнала.
Слайд 11Определение
Эксперимент (лат. experimentum – проба, опыт) – метод познания, при
помощи которого в контролируемых или управляемых условиях исследуются явления действительности
с целью проверки гипотез, сформулированных до начала исследования.
Слайд 12Определение
Эксперимент (лат. experimentum – проба, опыт) – метод познания, при
помощи которого в контролируемых или управляемых условиях исследуются явления действительности
с целью проверки гипотез, сформулированных до начала исследования.
Слайд 13Определения
Эксперимент называется активным, либо контролируемым (англ. manipulatiuve), если он проводится
с применением искусственного воздействия на часть объектов по специальной программе,
причем экспериментатор может при его постановке выбирать между некоторыми возможными совокупностями условий.
Эксперимент называется пассивным, либо измерительным (англ. mensurative), если экспериментатор не вмешивается в естественный ход событий, а регистрирует характеристики объекта, пребывающего в обычных для него условиях.
Слайд 14История эксперимента в естествознании
Фрэнсис Бэкон, один из родоначальников экспериментального метода
европейской науки, видел в причину неудач античной (греческой) науки в
отсутствии экспериментального подхода.
Эксперимент позволил отойти от традиционного античного описания природы и перейти к естествоиспытанию.
Слайд 15Эксперимент – инструмент для проверки научных гипотез
Важная характеристика экспериментального метода
– конструирование предметов и ситуаций, которые до этого не существовали
в природе.
«Полигоном» для такого конструирования часто служит лаборатория – место, которое создано разумом, а не природой.
Слайд 16Определения
Общее (теоретическое): “...план эксперимента есть схема для анализа [будущих] результатов
на основе имеющейся информации”.
Н. Бейли (1962)
Частное (практическое): Планирование эксперимента - процедура выбора числа опытов и условий их проведения, необходимых для решения поставленной задачи с требуемой точностью.
Слайд 17Важность априорной информации
В зависимости от уровня имеющейся информации экспериментатор выбирает
определенную модель планирования с целью подтвердить или отвергнуть ту или
иную гипотезу.
Причем чем выше уровень и объем имеющихся знаний, тем более тонкие свойства объекта можно выявить в результате эксперимента и тем более сложными становятся применяемые планы.
Слайд 18Методы планирования эксперимента
Возникли и долгое время развивались в связи с
прикладным анализом данных в сельском хозяйстве и медицине.
В настоящее
время возросло применение этих методов в точных науках, в том числе при построении моделей физических процессов.
Современная теория планирования экспери-мента развивается на стыке вычислительной математики, математической статистики, дискретной математики и теории оптимизации.
Слайд 19Курсы для студентов – почти в каждом университете
Слайд 20Курсы для студентов – почти в каждом университете
Слайд 21Курсы для студентов – почти в каждом университете
Слайд 22Повышение квалификации:
Massachusetts Institute of Technology
Слайд 23Профессиональная помощь исследователям
Слайд 25Учебники и методические пособия для биологов
Слайд 26Математическая теория планирования эксперимента
Пример текста:
Понимание и использование требуют
хорошего знания
высшей математики!
Слайд 27Математическая теория планирования эксперимента
Для понимания учебных пособий, посвященных математической теории
оптимального эксперимента, требуется глубокое знание некоторых разделов высшей математики.
Такими
знаниями биологи, как правило, не владеют.
Однако это вовсе не означает, что приложения теории недоступны для биологов.
Слайд 28Экспериментальный метод в современной экологии
Современная биология развивается в основном за
счет экспериментальных работ.
Чем выше в «табели о рангах» стоит журнал,
тем меньше в нем описательных и тем больше экспериментальных работ.
Слайд 29Использование экспериментального метода
Слайд 30Требования международных журналов
Западные журналы предъявляют жесткие требования к структуре статьи,
особенно к её методической части.
Первая задача – предоставить достаточное
количество информации для повторения эксперимента.
Вторая задача – предоставить достаточное количество информации для обоснованного суждения об адекватности выбранного метода обработки данных.
Слайд 31Требования международных журналов
Всегда указывается применявшийся метод анализа, если возможно –
со ссылкой на стандартные процедуры широко распростра-ненных пакетов прикладных программ.
Результаты измерений (подсчетов) всегда включаются в статью – как правило, в виде таблиц или графиков. Обязательно указывается объем выборки (репозиторий данных Dryad http://datadryad.org/ Перечень подобных хранилищ с разбивкой по темам и странам - http://www.re3data.org/).
Любая фраза, содержащая вероятностное утверждение, должна сопровождаться ссылкой на статистический тест.
Слайд 32От автора требуется всегда четко говорить «да» и «нет», то
есть разграничивать ситуации, когда эффект получен либо не получен.
Фраза
«Хотя различия и не достигли уровня статистической достоверности, снижение плотности популяции под влиянием загрязнения не вызывает сомнений» (пример реальный – из российского журнала) будет последней, которую прочитает рецензент.
Любое отклонение от основной темы, включая побочные результаты, рассматривается как недостаток статьи.
Требования международных журналов
Слайд 33Требования российских журналов
Как правило, менее «жесткие» и менее четко сформулированы,
чем в международных журналах.
Слайд 34В чем причины различий между «Западом» и «Востоком»?
На Западе:
Работа начинается
с написания заявки на финансирование;
Заявка обязательно включает описание экспериментов;
Исследователь уже
на этапе планирования экспериментов думает о написании статьи (статей) по итогам работы,
то есть он постоянно ориентирован на конечный результат.
Слайд 35В России:
Существенное количество ученых до последнего времени находилось на
бюджетном финансировании;
Планы НИР часто пишутся «для галочки»;
О подготовке публикации исследователь
часто задумывается уже после того, как материал собран,
то есть он чаще ориентирован на процесс, чем на конечный результат.
В чем причины различий между «Западом» и «Востоком»?
Слайд 36Пример 1. Описание площадок, на которых проводили эксперимент:
Плотность древостоя на
экспериментальных площадках была одинакова (очень плохо: так подобрать площадки невозможно);
Плотность
древостоя на экспериментальных площадках (Таблица 1.2) была практически одинакова (удовлетвори-тельно: приведены цифровые данные, позволяющие при необходимости оценить достоверность заключения).
Плотность древостоя на экспериментальных площадках не различалась (F2,9 = 0.41, P = 0.68) (удовлетворительно: нет исходных данных).
Экспериментальные площадки не различались по плотности древостоя (Таблица 1.2; F2,9 = 0.41, P = 0.68) (очень хорошо).
Таблица 1.2. Плотность древостоя (число стволов с диаметром более 5 см на 1 га; среднее значение по результатам четырех выборок ± стандартная ошибка)
Слайд 37Пример 1. Описание площадок, на которых проводили эксперимент:
Плотность древостоя на
экспериментальных площадках была одинакова (очень плохо: так подобрать площадки невозможно).;
Плотность
древостоя на экспериментальных площадках (Таблица 1.2) была практически одинакова (удовлетвори-тельно: приведены цифровые данные, позволяющие при необходимости оценить достоверность заключения).
Плотность древостоя на экспериментальных площадках не различалась (F2,9 = 0.41, P = 0.68) (удовлетворительно: нет исходных данных).
Экспериментальные площадки не различались по плотности древостоя (Таблица 1.2; F2,9 = 0.41, P = 0.68) (очень хорошо).
Таблица 1.2. Плотность древостоя (число стволов с диаметром более 5 см на 1 га; среднее значение по результатам четырех выборок ± стандартная ошибка)
Слайд 38Постановка задачи на планирование эксперимента
Имеются:
Поставленная задача и/или сформулированная гипотеза.
Информация о
свойствах объекта.
Результаты предыдущих экспериментов.
Желаемая точность оценки и/или допустимая вероятность принятия/отклонения
гипотезы.
Необходимо определить:
Условия проведения опытов.
Количество экспериментальных единиц.
Точность измерений.
Слайд 39Пример постановки задачи
Исходные данные
Задача: сравнить скорость разложения целлюлозы под кронами
берез и сосен в смешанных лесах.
Нулевая гипотеза: скорость разложения целлюлозы
под кронами берез не отличается от скорости разложения целлюлозы под кронами сосен.
Допустимая вероятность случайного отклонения истинной нулевой гипотезы <5%.
Слайд 40Пример постановки задачи
Необходимо выбрать:
Место проведения эксперимента;
Время начала эксперимента;
Тип целлюлозосодержащего материала.
Необходимо
определить:
Процедуру выбора берез и сосен;
Количество берез и сосен;
Количество проб целлюлозы;
Пространственное
размещение проб;
Продолжительность эксперимента;
Начальный вес проб и точность взвешивания.
Слайд 41Определение
Критерий оптимальности (или критерий оптимизации) – признак, на основании которого
производится сравнительная оценка возможных решений (альтернатив) и выбор наилучшего решения.
Слайд 42Выбор наилучшего решения
Выбор решения, обеспечивающего достижение заданного результата при минимальном
расходе ресурсов.
Выбор решения, обеспечивающего достижение наилучшего результата при заданном (то
есть ограниченном) количестве ресурсов.
Выбор решения, обеспечивающего достижение наилучшего результата при минимальном расходе ресурсов (то есть нет жестких требований к конечному результату и нет жестких ограничений по объему используемых ресурсов).
Слайд 43Примеры критериев оптимальности
Быстро ---------------------------- Медленно
Дешево ---------------------------- Дорого
Примерно
--------------------------- Точно
Предложенное
решение задачи
Оптимальное
решение задачи
Не существует «универсального» критерия оптимальности.
Исследователь
задает его в процессе планирования работы.
Слайд 44Выбор критерия оптимальности
Если для каждого из экспериментов, приводящих к желаемому
результату, можно оценить величину «затрат», то задача заключается в выборе
такого эксперимента, при котором «затраты» минимальны.
«Стоимостный» подход возможен только в том случае, когда все эксперименты приводят к одинаковой точности результата.
Слайд 45Выбор критерия для оптимизации
В биологических исследованиях увеличение точности обычно сопровождается
увеличением затрат, что требует нахождения приемлемого баланса между точностью результата
и стоимостью работ.
Таким образом, задачи планирования – это, во-первых, подсчет затрат, а во-вторых - формирование критерия оптимальности, который будет использован при решении конкретной задачи.
Слайд 46Пример 2. Стратегия поездки из пункта А в пункт Б
Из
пункта А в пункт Б можно попасть разными путями, за
разное время, затратив разное количество денег (горючее, амортизация а/м, штрафы, заработок за счет попутных пассажиров). Каждый водитель формирует свой критерий оптимальности, например:
Экономия денег (аккуратная езда, выбор оптимальной скорости, соблюдение правил, подбор попутчиков) за счет времени;
Экономия времени (быстрая езда) за счет денег (штрафы, без попутчиков, повышенный износ автомашины), безопасности, душевного спокойствия и комфорта (тряска, рывки).
Повышение безопасности за счет времени;
Сохранение душевного спокойствия (избегание улиц с интенсивным движением, строгое выполнение правил) за счет времени и денег (более длинный путь).
Слайд 47Лирическое отступление
Из рекламы ресторана:
«У нас Вы можете пообедать
Быстро и
вкусно, или
Вкусно и дешево, или
Быстро и дешево».
(первоисточник утрачен)
Слайд 48Стратегический выбор
При постановке биологического эксперимента невозможно одновременно максимизировать следующие характеристики:
Широта
выводов (generality);
Реалистичность (realism);
Точность (precision).
Слайд 49Стратегический выбор
При постановке экологического эксперимента невозможно одновременно максимизировать следующие характеристики:
Широта
выводов – достигается закладкой однотипных экспериментов с разными объектами в
разных условиях;
Реалистичность – максимальна у полевых экспериментов;
Точность – максимальна у лабораторных экспериментов.
Слайд 50Это полезно запомнить:
Современная биология – наука эксперимен-тальная, особенно «теоретическая» биология.
Престижные
журналы предпочитают публиковать статьи, нацеленные на экспериментальную проверку гипотез.
Планирование эксперимента
– прикладная наука с обширным математическим аппаратом.
"Обычному" биологу в первую очередь необходима не теория, а практические рекомендации по планированию эксперимента на уровне "что такое хорошо, а что такое плохо".
Слайд 51Ответственность перед обществом и учет малых вероятностей
Слайд 52Лирическое отступление
«… Нам разрешается прослыть невеждами, мистиками, суеверными
дураками. Нам одного не простят: если мы недооценили опасность. И
если в нашем доме вдруг завоняло серой,… - мы обязаны предположить, что где-то рядом объявился черт с рогами, и принять соответствующие меры, вплоть до производства святой воды в промышленных масштабах…»
А. и Б. Стругацкие. Жук в муравейнике.
Слайд 53Ответственность перед обществом и учет малых вероятностей
В нашем доме вдруг
завоняло серой…
Гипотеза Н0: молекулярная флюктуация.
Гипотеза Н1: объявился черт с
рогами.
Слайд 54Ответственность перед обществом и учет малых вероятностей
В нашем доме вдруг
завоняло серой…
Гипотеза Н0: молекулярная флюктуация.
Гипотеза Н1: объявился черт с
рогами.
Возможны варианты!
Слайд 55Ответственность перед обществом и учет малых вероятностей
В нашем доме вдруг
завоняло серой…
Гипотеза Н0: молекулярная флюктуация.
Гипотеза Н1: что-то протухло в
холодильнике.
Возможны варианты!
Слайд 56Ответственность перед обществом и учет малых вероятностей
В нашем доме вдруг
завоняло серой…
Гипотеза Н0: что-то протухло в холодильнике.
Гипотеза Н1: объявился
черт с рогами.
Возможны варианты!
Слайд 57Проверка гипотезы
Нулевая гипотеза — гипотеза, которая проверяется на согласованность с имеющимися
выборочными (эмпирическими) данными.
В стандартном случае исследователь пытается отвергнуть нулевую
гипотезу, доказав её несогласованность с имеющимися опытными данными.
Выбор экспериментального плана зависит не только от нулевой гипотезы, но и от альтернативной гипотезы.
Слайд 58Проверка гипотезы
В нашем доме вдруг завоняло серой…
Вариант 1
Гипотеза Н0:
молекулярная флюктуация.
Гипотеза Н1: что-то протухло в холодильнике.
Вариант 2
Гипотеза Н0: молекулярная
флюктуация.
Гипотеза Н1: объявился черт с рогами.
Изучение содержимого холодильника МОЖЕТ
позволить отклонить Н0.
Изучение содержимого холодильника НЕ МОЖЕТ
позволить отклонить Н0.
Слайд 59Отклонение Н0 вовсе не означает, что мы приняли Н1.
Проверка гипотезы
Слайд 60Отклонение Н0 вовсе не означает, что мы приняли Н1.
Проверка гипотезы
В
нашем доме вдруг завоняло серой…
Гипотеза Н0: что-то протухло в
холодильнике.
Гипотеза Н1: объявился черт с рогами.
Мы проверили холодильник – там все в порядке.
Будем вызывать священника?
Слайд 61Гипотезы очень редко бывают взаимоисключающими.
Проверка гипотезы
Пространство логических возможностей
Что-то протухло
в
холодильнике
Объявился черт
с рогами
Молекулярная
флюктуация
Слайд 62Два типа ошибок
Ошибочное отклонение истинной нулевой гипотезы.
Ошибочное принятие ложной
нулевой гипотезы.
Слайд 63Ответственность перед обществом и учет малых вероятностей
Гипотеза Н0: молекулярная флюктуация.
Гипотеза
Н1: объявился черт с рогами.
Слайд 64Ответственность перед обществом и учет малых вероятностей
Гипотеза Н0: молекулярная флюктуация.
Гипотеза
Н1: объявился черт с рогами.
Слайд 65Ответственность перед обществом и учет малых вероятностей
Гипотеза Н0: молекулярная флюктуация.
Гипотеза
Н1: объявился черт с рогами.
Слайд 66Ответственность перед обществом и учет малых вероятностей
Гипотеза Н0: молекулярная флюктуация.
Гипотеза
Н1: объявился черт с рогами.
Слайд 67Ответственность перед обществом и учет малых вероятностей
Гипотеза Н0: молекулярная флюктуация.
Гипотеза
Н1: объявился черт с рогами.
Слайд 68Ответственность перед обществом и учет малых вероятностей
Гипотеза Н0: молекулярная флюктуация.
Гипотеза
Н1: объявился черт с рогами.
Слайд 69Определения
Уровень значимости (α) – это вероятность совершения ошибки первого рода
(то есть отклонения истинной нулевой гипотезы).
Мощность анализа, или статистического теста
(1 – β) – это вероятность избежания ошибки второго рода (то есть принятия ошибочной нулевой гипотезы).
Слайд 70Ответственность перед обществом и учет малых вероятностей
Ошибка первого рода: имеет
место молекулярная флюктуация, а мы считаем, что …?
Ошибка второго
рода: …?, а мы считаем, что имеет место молекулярная флюктуация.
Все стандартные методы статистики нацелены на определение вероятности ошибки первого рода.
Слайд 71Ответственность перед обществом и учет малых вероятностей
Ошибка первого рода: имеет
место молекулярная флюктуация, а мы считаем, что объявился черт с
рогами.
Ошибка второго рода: объявился черт с рогами, а мы считаем, что имеет место молекулярная флюктуация.
Все стандартные методы статистики нацелены на определение вероятности ошибки первого рода.
Слайд 72Ответственность перед обществом и учет малых вероятностей
Ошибка первого рода: имеет
место молекулярная флюктуация, а мы считаем, что запах серы появился
не случайно.
Ошибка второго рода: запах серы появился не случайно, а мы считаем, что имеет место молекулярная флюктуация.
Все стандартные методы статистики нацелены на определение вероятности ошибки первого рода.
Слайд 73Ответственность перед обществом и учет малых вероятностей
Ошибка первого рода: имеет
место молекулярная флюктуация, а мы считаем, что объявился черт с
рогами.
Ошибка второго рода: объявился черт с рогами, а мы считаем, что имеет место молекулярная флюктуация.
Все стандартные методы статистики нацелены на определение вероятности ошибки первого рода.
Этот вариант верен только к том случае, если
Н0 и Н1 в совокупности описывают всё
пространство логических возможностей.
Слайд 74Лирическое отступление
В повести Стругацких «Жук в муравейнике» гипотезой было внедрение
в земное общество агентов некой сверхцивилизации («Странников»).
Цена ошибки первого
рода (агентов нет, но мы считаем, что они есть) – жизнь человека, который может оказаться таким агентом.
Цена ошибки второго рода (агенты внедрены, но мы считаем, что их нет) – благополучие человечества.
Герой Стругацких, чьи слова вынесены в эпиграф, предпочел совершить ошибку первого рода.
Кстати говоря, мы так и не знаем, совершил ли он ошибку…
Слайд 75Ответственность перед обществом и учет малых вероятностей
Ошибка первого рода: имеет
место молекулярная флюктуация, а мы считаем, что объявился черт с
рогами: Р = 0.ххх
Ошибка второго рода: объявился черт с рогами, а мы считаем, что имеет место молекулярная флюктуация: Р неизвестно.
Все стандартные методы статистики нацелены на определение вероятности ошибки первого рода.
Слайд 76Ответственность перед обществом и учет малых вероятностей
Ошибка первого рода: пациент
здоров, а врачи считают, что он нуждается в срочной операции:
Р = 0.ххх
Ошибка второго рода: пациент нуждается в срочной операции, а врачи считают, что он здоров: Р неизвестно.
Все стандартные методы статистики нацелены на определение вероятности ошибки первого рода.
Слайд 77Ответственность перед обществом и учет малых вероятностей
Ошибка первого рода: пациент
здоров, а врачи считают, что он нуждается в срочной операции:
Р = 0.ххх
Ошибка второго рода: пациент нуждается в срочной операции, а врачи считают, что он здоров: Р неизвестно.
Все стандартные методы статистики нацелены на определение вероятности ошибки первого рода.
Слайд 78Важность определения вероятности ошибки второго рода
Во всех российских пособиях по
прикладной статистике, предназначенных для биологов, понятие ошибки второго рода и
сопряженное с ней понятие мощности анализа (или статистического теста) не рассматриваются.
Единственное исключение: Козлов М.В. Планирование экологических исследований: теория и практические рекомендации. М.: КМК, 2014.
Слайд 79Ответственность перед обществом и учет малых вероятностей
Ни в теоретических построениях,
ни в практических решениях нельзя игнорировать вероятность ошибки второго рода.
Пока
что нам достаточно:
помнить, что цена ошибки второго рода может быть очень высокой, и
поверить на слово, что снижая вероятность ошибки первого рода, мы неизбежно повышаем вероятность ошибки второго рода (и наоборот).
Слайд 80Первый шаг планирования эксперимента - определение допустимых вероятностей ошибок первого
и второго рода.
Допустимых – кем?…
В большинстве биологических исследований вероятность ошибки первого рода α = 5% (один ошибочный вывод из двадцати) считается вполне приемлемой; по крайней мере ни разу не приходилось слышать об отклонении статьи по причине выбора этого уровня значимости.
Ответственность перед обществом и учет малых вероятностей
Слайд 81Вероятность ошибки второго рода для биологических исследований (β) не должна
превышать 20% (один ошибочный вывод из пяти) .
Уровень значимости задается
исследователем исходя из некоторых «общих соображений»; остальные расчеты (например, числа повторностей, объема выборки) базируются на этой величине.
Ответственность перед обществом и учет малых вероятностей
Слайд 82Печальная история
Салли Кларк
(1964 – 2007)
Первый сын Салли
Кларк внезапно умер через несколько недель после рождения. После того,
как внезапно умер ее второй сын, она была арестована.
На основании неверно истолкованных результатов статистического анализа в ноябре 1999 г. Салли была признана виновной в убийстве двух своих сыновей.
Слайд 83Обвинение было снято в январе 2003 г., после того, как
она отбыла более трех лет заключения.
Случай Салли Кларк признан
«одной из крупнейших ошибок правосудия в современной юридической истории Великобритании».
Салли впала в тяжелейшую депрессию, безуспешно лечилась от серьезных психиатрических проблем, и умерла в 2007 г. от отравления алкоголем.
Печальная история
Салли Кларк
(1964 – 2007)
Слайд 84Ответственность перед обществом и учет малых вероятностей
Н0: две смерти подряд
от естественных причин;
Н1: два убийства собственных детей.
Слайд 85Статистические данные в деле Салли Кларк (1)
Утверждение эксперта: «одна внезапная
младенческая смерть в семье - трагедия, два – подозрительный случай,
а три – убийство, если только не доказано обратное».
Эксперт утверждал, что для состоятельной семьи некурящих родителей вероятность внезапной смерти новорожденного составля-ет 1 к 8543; вероятность двух смертельных случаев в одной семье составляет 1 к 73 миллионам (то есть к 8543 × 8543).
В качестве эксперта выступал Sir Roy Meadow, в прошлом – профессор педиатрии в Университете города Лидс (Leeds University).
Слайд 86Первая ошибка интерпретации статистических данных
В январе 2002 г. Королевское Статистическое
Общество обратилось к Лорду-канцлеру с заявлением о том, что «вычисления,
на которых основана оценка вероятности двух внезапных смертей новорожденных, некорректны».
Вероятность наступления двух событий равна произведению их вероятностей только в том случае, если эти события не зависят друг от друга.
Профессор Ray Hill (Математический факультет Университета города Солфорд) доказал, что существуют некие факторы предрасположенности новорожденных к внезапной смерти. По его оценке, вероятность ВТОРОЙ внезапной смерти составляет 1 к 100, а не 1 к 8500.
Слайд 87Вторая ошибка интерпретации статистических данных
Во время суда многие газеты писали,
что «1 к 73 миллионам» - это вероятность того, что
Салли невиновна. Верно ли газеты интерпретировали статистическую информацию?
Необходимо было сравнить статистику для двух альтернативных объяснений:
Н0: две смерти подряд от естественных причин;
Н1: два убийства собственных детей.
По оценке профессора Ray Hill (Математический факультет Университета г. Солфорд), две смерти подряд от естественных причин встречались в Великобритании в 4-9 раз чаще, чем двойное убийство собственных детей.
Слайд 88Вторая ошибка интерпретации статистических данных
Во время суда многие газеты писали,
что «1 к 73 миллионам» - это вероятность того, что
Салли невиновна. Верно ли газеты интерпретировали статистическую информацию?
Необходимо было сравнить статистику для двух альтернативных объяснений:
Н0: две смерти подряд от естественных причин;
Н1: два убийства собственных детей.
По оценке профессора Ray Hill (Математический факультет Университета г. Солфорд), две смерти подряд от естественных причин встречались в Великобритании в 4-9 раз чаще, чем двойное убийство собственных детей.
Слайд 89Цена ошибки
В описанных выше примерах (повесть Стругацких, дело Салли Кларк)
построение функции оптимизации в общем случае невозможно, поскольку подразумевает этический
выбор и вследствие этого субъективно.
К счастью, в большинстве случаев, особенно в ситуациях, с которыми имеют дело биологи, цена ошибки может быть измерена более объективно.
Слайд 90Эмпирическое правило
Разумные меры предосторожности определяются произведением вероятности события на тяжесть
его последствий.
Л. Э. Цырлин, физик-теоретик.
Слайд 91Интуитивная оптимизация и нижний порог приемлемости: когда «что-нибудь» хуже, чем
ничего
Значительная часть нашего курса посвящена принятию решений.
В отличие от
курса планирования эксперимента для представителей точных наук, где оптимальное решение находится однозначно – путем построения некоторой функции и исследования ее свойств – биологи вынуждены довольствоваться «интуитивной» оптимизацией.
Кроме того, теория не рассматривает такие проблемы, как отсутствие машины для выезда на полевые работы, перебои с теплоснабжением, невозможность приобретения необходимого оборудования и многие другие, с которыми исследователь сталкивается практически ежедневно.
Слайд 92Интуитивная оптимизация и нижний порог приемлемости: когда «что-нибудь» хуже, чем
ничего
Все эти факторы, естественно, необходимо принимать во внимание; однако следует
четко осознать: если эксперимент нельзя поставить так, чтобы получить однозначный результат - нужно менять схему эксперимента.
Никогда не следует жертвовать точностью или статистической значимостью или мощностью анализа.
Таким образом, настоящий курс задает некоторый набор граничных условий, нарушать которые можно только в том случае, если результат вашей работы вам совершенно безразличен.
Слайд 93Требования, предъявляемые к «хорошему» эксперименту
Задана допустимая вероятность ошибок как первого,
так и второго рода.
Определена область применения выводов.
Точность адекватна
решаемой задаче.
Продумана интерпретация любого из возможных результатов статистического анализа данных.
Работа проста в выполнении.
Слайд 94Это полезно запомнить:
Планирование эксперимента - процедура выбора числа опытов и
условий их проведения, необходимых для решения поставленной задачи с требуемой
точностью.
Планирование эксперимента начинается с определения допустимой вероятности ошибок первого и второго рода.
Планирование эксперимента – это решение задачи на оптимизацию: должен быть задан критерий оптимальности.