Разделы презентаций


Статистические методы в QSAR

Содержание

Затронутые темыЗадача статистического анализа в QSAR Множественная линейная регрессияСтатистические показатели: R, s, F Пошаговый вариант множественной линейной регрессии Разбиение выборки на обучающую и контрольную Процедура скользящего контроля

Слайды и текст этой презентации

Слайд 1Статистические методы в QSAR
Часть 1
Множественная линейная регрессия

Статистические методы в QSAR Часть 1Множественная линейная регрессия

Слайд 2Затронутые темы
Задача статистического анализа в QSAR
Множественная линейная регрессия
Статистические показатели:

R, s, F
Пошаговый вариант множественной линейной регрессии
Разбиение выборки

на обучающую и контрольную
Процедура скользящего контроля
Затронутые темыЗадача статистического анализа в QSAR Множественная линейная регрессияСтатистические показатели: R, s, F Пошаговый вариант множественной линейной

Слайд 3Задача статистического анализа в QSAR
Целью статистического анализа в QSAR

является поиск функции f, связывающей значение свойства y (которое может

быть как физико-химическим свойством, так и биологической активностью) со значениями дескрипторов x1,…,xM, описывающих химическое соединение:

Y непрерывное – регрессионный анализ, аппроксимация функции

Y дискретное – дискриминантный анализ, классификация, распознавание образов

Задача статистического анализа в QSAR Целью статистического анализа в QSAR является поиск функции f, связывающей значение свойства

Слайд 4Задача статистического анализа в QSAR
j=1,…,N
Принцип максимального правдоподобия

Задача статистического анализа в QSARj=1,…,N Принцип максимального правдоподобия

Слайд 5Метод наименьших квадратов
Выборка является репрезентативной
Случайная величина ε имеет нормальное распределение


Наблюдения являются независимыми
Наблюдения являются равноточными

Метод наименьших квадратовВыборка является репрезентативнойСлучайная величина ε имеет нормальное распределение Наблюдения являются независимымиНаблюдения являются равноточными

Слайд 6Множественная линейная регрессия – постановка задачи
j = 1,…,N
Найти такие

значения Ci:

Множественная линейная регрессия – постановка задачиj = 1,…,N Найти такие значения Ci:

Слайд 7Множественная линейная регрессия – решение задачи
Регрессионные коэффициенты
Экспериментальные значения свойства
Значения дескрипторов

Множественная линейная регрессия – решение задачиРегрессионные коэффициентыЭкспериментальные значения свойстваЗначения дескрипторов

Слайд 8Статистические показатели для МЛР
RSS – сумма квадратов остатков
SS – дисперсия

свойства Y
R – коэффициент корреляции
O

Статистические показатели для МЛРRSS – сумма квадратов остатковSS – дисперсия свойства YR – коэффициент корреляцииO

Слайд 9Статистические показатели для МЛР
RMSE – среднеквадратичное значение ошибки
s – стандартное

отклонение
MAE – средняя абсолютная ошибка
F – критерий Фишера

Статистические показатели для МЛРRMSE – среднеквадратичное значение ошибкиs – стандартное отклонениеMAE – средняя абсолютная ошибкаF – критерий

Слайд 10Статистические показатели для МЛР

Статистические показатели для МЛР

Слайд 11Статистические показатели для МЛР

Статистические показатели для МЛР

Слайд 12Статистические показатели для МЛР

Статистические показатели для МЛР

Слайд 13Статистические показатели для МЛР
Индивидуальный t-критерий (критерий Стьюдента) для дескриптора

Статистические показатели для МЛРИндивидуальный t-критерий (критерий Стьюдента) для дескриптора

Слайд 14Необходимость отбора дескрипторов
Проблема мультиколлинеарности дескрипторов и сингулярности матрицы (XTX)-1
Проблема

переопределенности моделей
Внесение «шума» в модель нерелевантными дескрипторами


Необходимость отбора дескрипторовПроблема мультиколлинеарности дескрипторов и сингулярности матрицы (XTX)-1 Проблема переопределенности моделейВнесение «шума» в модель нерелевантными дескрипторами

Слайд 15Пошаговый вариант множественной линейной регрессии
Дескриптор включается в модель, если
Дескриптор

исключается из модели, если
Типичные значения порогов: FIN = 3.84,

FOUT = 2.7
Пошаговый вариант множественной линейной регрессии Дескриптор включается в модель, еслиДескриптор исключается из модели, если Типичные значения порогов:

Слайд 16Разбиение выборки на обучающую и контрольную
PRSSS - сумма квадратов

остатков при прогнозе
PSSS - дисперсия свойства y на контрольной выборке
PRMSES

- среднеквадратичная ошибка на прогнозе

PMAES - средняя абсолютная ошибка на прогнозе

Q2s - квадрат коэффициента корреляции на прогнозе

Разбиение выборки на обучающую и контрольную PRSSS - сумма квадратов остатков при прогнозеPSSS - дисперсия свойства y

Слайд 17Процедура скользящего контроля (cross-validation)
При μ-кратном скользящем контроле исходная выборка разбивается

на μ приблизительно равных частей
Каждая из этих частей по очереди

объявляется контрольной выборкой
Для нее формируется обучающая выборка, состоящая из всех соединений из исходной выборки, в нее не входящих
По обучающей выборке строится регрессионная модель
По текущей контрольной выборке вычисляется сумма квадратов ошибок PRSSs и сумма абсолютных ошибок PSAEs
Пункты 2-5 повторяются для всех μ частей
Процедура скользящего контроля (cross-validation)При μ-кратном скользящем контроле исходная выборка разбивается на μ приблизительно равных частейКаждая из этих

Слайд 18Процедура скользящего контроля – статистические показатели
RMSECV - среднеквадратичная ошибка

прогноза
MAECV - средняя абсолютная ошибка прогноза
Q2CV – коэффициент корреляции

для прогноза
Процедура скользящего контроля – статистические показатели RMSECV - среднеквадратичная ошибка прогноза MAECV - средняя абсолютная ошибка прогнозаQ2CV

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика