Слайд 1Построение и анализ молекулярных сетей
Слайд 2Сложная биологическая система может быть представлена в виде сети взаимодействующих
объектов: организмы, клетки, белки, гены, РНК, метаболиты, медиаторы, ионы и
др.
Молекулярная сеть описывает взаимодействия объектов (белки, гены, метаболиты и др.) на уровне клетки.
Биологические сети
Сигнальные сети
Метаболические сети
Сети белок-белковых взаимодействий
Сети ко-экспрессии
Сети ко-цитирования генов в PubMed
Другие
Слайд 3Сигнальные сети
Основная функция – распознавание и передача сигналов с рецепторов
в ядро или к другим молекулам и структурам клетки.
Пример: активация
рецепторов для факторов роста запускает сигнальные каскады, которые усиливают транскрипцию генов, связанных с пролиферацией клеток, и подавляют транскрипцию генов, связанных с запуском апоптоза.
Пример: активация рецепторов приводит через киназные каскады к фосфорилированию ионных каналов и транспортеров, что меняет амплитуду ионных токов.
Сигнальный путь – часть сигнальной сети клетки, связанная с регуляцией определенных клеточных функций.
Пример: регуляция апоптоза, регуляция клеточного деления, регуляция секреции инсулина.
Слайд 4Сигнальные пути
Активация рецепторов запускает сигнальные каскады, что приводит к изменению
транскрипции генов и ответу клетки на внешнее воздействие
Зеленые ребра –
активация
Красные ребра - ингибирование
Представлен в виде графа: Вершины – белки;
Ребра – взаимодействия.
Слайд 5Адренергический сигнальный путь в кардиомиоцитах
Стимуляция бета-адренорецепторов активирует киназы, которые фосфорилируют
транспортеры и ионные каналы, что приводит к изменению концентраций ионов
в клетке. Адренорецепторы через этот же сигнальный путь регулируют такие процессы как апоптоз и гипертрофия кардиомиоцитов.
Слайд 6Свойства сигнальных сетей
Большое количество перекрестов между сигнальными путями. Один и
тот же белок участвует в регуляции многих клеточных функций.
Существование альтернативных
(дублирующих) путей – устойчивость системы к мутациям, ингибированию и т.д.
Наличие обратных связей
Положительная обратная связь
Отрицательная обратная связь
Обеспечивает переключение между разными состояниями клетки,
например в ходе дифференцировки
Обеспечивает стабильность системы, поддержание текущего состояния клетки
Слайд 7Метаболические пути
Метаболический путь – последовательность химических реакций, осуществляющих синтез продукта
(или нескольких продуктов) из исходных субстратов или его деградацию.
Метаболическая сеть
– совокупность всех метаболических путей клетки.
Метаболическая сеть (путь) также может быть представлена в виде графа, где вершины – это метаболиты, а ребра – химические реакции. Часто ребру приписывается название фермента, который катализирует данную реакцию
Слайд 9Реконструкция метаболической сети клетки
Слайд 10Базы данных по сигнальным и метаболическим путям
Слайд 11KEGG (Kyoto Encyclopedia of Genes and Genomes)
321 сигнальных, регуляторных, метаболических
путей для разных видов животных и человека, включает также пути,
связанные с определёнными заболеваниями
Слайд 12REACTOME
1886 сигнальных и метаболических пути человека, организованные иерархически: от отдельных
реакций до крупных путей. Позволяет визуализировать отдельные участки сигнальных и
метаболических путей.
Слайд 14Сети белок-белковых взаимодействий (ББВ)
Вершины данной сети представляют собой белки, а
ребра показывают наличие прямых, физических взаимодействий между белками.
Не содержат информации
о характере взаимодействий: активация, ингибирование, образование комплекса и др.
Представляет собой вид сетей, который наиболее часто используется в различных исследованиях в области биоинформатики.
Сеть белок-белковых взаимодействий клетки по некоторым оценкам может включать более 600 000 взаимодействий.
Слайд 15Подходы к оценке белок-белковых взаимодействий
Ко-иммунопреципитация
Аффинная хроматография
Перекресная сшивка при помощи реактивных
соединений или УФ
Поверхностный плазмонный резонанс
Равновесный диализ и метод связывания на
фильтрах
Резонансный перенос энергии флуоресценции
Слайд 16Базы данных по белок-белковым взаимодействиям
Слайд 17HIPPIE
Содержит информацию о более чем 18000 белках человека и 400000
взаимодействий.
Каждому взаимодействию присвоена оценка, отражающая достоверность ББВ. Эта оценка вычисляется
исходя из количества независимых экспериментов и методов, в которых было зарегистрировано данное ББВ.
Слайд 23Сети ко-экспрессии
Разные условия, разные эксперименты
Для каждой пары генов
Коэффициент корреляции Пирсона
Ранговый
коэффициент корреляции Спирмена
Евклидово расстояние
……
Слайд 25Сети ко-экспрессии
Определяется порог коэффициента корреляции r. Если r выше порога,
то два гена соединяются ребром, если ниже, то не соединяются.
Слайд 27Результаты поиска для гена ADRB1 в COXPRESdb
Слайд 29Сети на основе интеграции информации
Сигнальные сети построены на основе интеграции
данных о белок-белковых взаимодействиях, регуляции транскрипции генов, вторичных мессенджерах и
др.
Эти данные максимально приближены к реальным событиям в клетке.
Другой пример интеграции данных: сеть, построенная Ghiassian SD с соавторами (Ghiassian SD et al., 2015). Построена путем интеграции следующих данных:
Белок-белковые взаимодействия;
Взаимодействия белок-ДНК;
Непрямые взаимодействия между ферментами метаболических путей (наличие общего метаболита).
Слайд 30Примеры средств для визуализации и анализа сетей
Слайд 31Cytoscape (http://www.cytoscape.org/)
Слайд 32Cytoscape
Платформа с открытым исходным кодом для визуализации и анализа биологических
сетей.
Возможность использования дополнительных данных, таких как функциональная аннотация, информация об
уровне экспрессии генов.
Дополнительные функции доступны в виде плагинов, которые могут менять дизайн сетей, обеспечивать поддержку дополнительных файловых форматов и связь с разными базами данных.
Плагины могут быть написаны любым пользователем на основе Java.
В настоящее время написано большое количество плагинов, доступных через http://apps.cytoscape.org/.
Слайд 34Связные компоненты
7 связных компонент
Слайд 35Путь в сети (графе)
Путь – это последовательность вершин {x1, x2,
…, xn} такая, что (x1, x2), (x2,x3), …, (xn-1, xn)
являются ребрами графа.
В направленном графе путь может быть проложен только по направлению ребер.
Кратчайший путь – путь с минимальной последовательностью вершин {x1, x2, …, xn} из всех возможных путей.
Закрытый путь xn=x1 в графе называется циклом.
Слайд 37Характеристики сети – степень вершины
Степень вершины (k) – число взаимодействий
с другими вершинами.
Для направленных сетей нужно считать отдельно число входящих
ребер (kin) и исходящих ребер (kout)
K=5
Kin=2; kout=3
Слайд 38Распределение степени
Распределение имеет вид степенной зависимости P(k) ~ k-γ
Большинство вершин
сети имеет небольшое число взаимодействий.
Лишь незначительное количество вершин сети имеет
большое число взаимодействий.
Случайная сеть
Реальная сеть
Реальная сеть
Случайная сеть
Слайд 39Свойства белков-«хабов»
Белки с большим числом взаимодействий называются белками- «хабами».
Многие «хабы»
являются наиболее важными, ключевыми белками в клетке.
Нарушение их функций может
быть фатальным для клетки.
Лекарственные вещества, связанные с противоопухолевой терапией, ингибируют «хабы», вызывая гибель опухолевых клеток. Поскольку ингибируют «хабы» в других тканях и органах, то очень токсичны.
Мутации в генах, кодирующих белки-«хабы», могут приводить к канцерогенезу.
Слайд 40Свойства белков-«хабов»
Белки-«хабы» чаще всего не взаимодействуют непосредственно друг с другом
Белки-«хабы»
более консервативны у разных видов, по сравнению с другими белками.
Белки-
«хабы» не эквивалентны между собой. «Хаб» имеющий 20 входящий ребер и одно исходящие отличается от «хаба», имеющего 1 входящее ребро и 20 исходящий, не смотря на то, что общее число взаимодействий у них равно.
Разделяют два вида белков- «хабов»: постоянные «хабы» (party hubs) и временные «хабы» (data hubs). Временные «хабы» имеют непостоянное число взаимодействий. Они могут взаимодействовать с разными белками в зависимости от условий.
Слайд 41Мотивы и графлеты
Мотивами называются цепочки или контуры из 3-6 вершин
в направленной сети (например в сигнальной сети), которые встречаются гораздо
чаще, чем в случайной сети.
Графлеты – аналог мотивов в ненаправленной сети (например в сети ББВ).
Пример мотива – обратная связь в сигнальной сети (feedback loop).
Пример графлета – комплекс из трех белков в сети ББВ (Triangle)
Слайд 42Модули в биологических сетях
Структура биологических сетей неоднородна.
Сети содержат модули, состоящие
из вершин, которые имею большее число связей друг с другом,
чем с остальными вершинами сети.
Модули состоят из белков (генов), которые выполняют общую клеточную функцию - часть сигнального пути, белковый комплекс, сложная молекулярная машинерия (например комплекс РНК-полимеразы с транскрипционными факторами и другими белками).
Слайд 43Модули в биологических сетях
Межмодулярные хабы – «хабы», которые соединяют два
соседних модуля.
Мосты (bridge) – вершины, которые также соединяют соседние модули,
но имеют меньшее число взаимодействий.
«Бутылочное горлышко» (bottleneck) – единственная вершина, которая соединяет два модуля.
Слайд 44Модули в биологических сетях
Межмодулярные «хабы» представляют собой временные «хабы», для
которых количество и состав взаимодействий меняются в зависимости от условий.
Межмолекулярные
«хабы» играют регуляторную роль и их мутации часто приводят к канцерогенезу.
Ингибирование «бутылочных горлышек» ассоциировано с высокой токсичностью, фатально для клетки. Может использоваться только для противоопухолевой терапии. «Бутылочные горлышки» являются предпочтительной мишенью микроРНК.
Модули часто перекрываются. Белок может входить в несколько модулей и выполнять несколько разных клеточных функций.
Изменение в перекрытии модулей – основной механизм адаптации сложных систем.
Слайд 45Предсказание маркеров заболеваний
Белки (гены), связанные с определенным заболеванием, обладают тенденцией
формировать один или несколько перекрывающихся модулей в сети.
Этот факт используется
для предсказания новых белков, ассоциированных с заболеванием, по их расположению в сети.
Если белок находится в модуле, обогащенным белками, для которых известна связь с заболеванием, то он также может быть связан с заболеванием.
Чем с большим числом таких белков он взаимодействует (напрямую или через одного/несколько соседей в сети), тем вероятнее связь с заболеванием.
Слайд 46Сеть белок-белковых взаимодействий
Белки с известной связью с заболеванием
Белки-кандидаты
Слайд 47Методы оценки связи белков (генов) с заболеванием
Метод ближайшего соседа
n
– число взаимодействий с белками с известной связью с заболеванием.
N
- общее число взаимодействий.
dk – вес взаимодействия (аффинность или достоверность)
Оценка равна 0,5 при условии, что веса ребер равны 1.
Слайд 48Случайное блуждание с возвратом
Методы оценки связи белков (генов) с
заболеванием
Вычисляется вероятность p∞ оказаться в вершине k после большого количества
итераций, если в начальный момент времени с равной вероятностью стартовать с одной из вершин с известной связью с заболеванием. Существует вероятность возврата в исходную вершину r. W – взвешенная матрица смежности сети, каждый элемент которой равен весу соответствующего ребра. Если ребро отсутствует, то элемент равен нулю. Начальные вероятности P0 отличны от нуля только для вершин с известной связью с заболеванием.
Слайд 49Оценка связи белка (гена) с заболеванием
Широкомасштабные генетические исследования. Оценка корреляции
полиморфизма гена с наличием/отсутствием заболевания.
Генетический нокаут. Получают линии мышей, у
которых из ДНК «вырезан» тот или иной ген. Тотальный нокаут – ген отсутствует во всех клетках организма. Органоспецифический нокаут – ген отсутствует только в определенном органе.
Генетический нокдаун. Разрушение мРНК при помощи механизмов РНК-интерференции. Используют siРНК.
Низкомолекулярные ингибиторы/активаторы. Например, ингибиторы ферментов или агонисты рецепторов.
Слайд 50Базы данных по связи белков/генов с заболеваниями
Слайд 51DisGeNET
Включает информацию, интегрированную из многих источников, в том числе из
литературы. Эту информацию можно представить в виде сети с двумя
типами вершин: гены и заболевания.
Слайд 52Результаты поиска для ADRB1
Score отражает достоверность связи между геном и
заболеванием.
Наиболее достоверна связь с гипертензией и сердечной недостаточностью.
Слайд 53Связь ADRB1 с гипертензией
Указан источник данных. Показаны предложения из Abstarcts
PubMed, в которых выделены ключевые слова: ADRB1 и hypertension.
Слайд 54«Мастер-регуляторы» в сети
«Мастер-регулятор» – ключевой белок, ответственный за изменение экспрессии
генов.
Гиперэкспрессированные гены
Гипоэкспрессированные гены
Мастер-регулятор
Слайд 55Этапы поиска «мастер-регуляторов»
Идентификация дифференциально экспрессирующихся генов (норма-патология, лекарство-растворитель и др.);
Поиск
экспериментальной информации о транскрипционных факторах, регулирующих транскрипцию этих генов, либо
предсказание сайтов связывания методами биоинформатики;
Поиск транскрипционных факторов, которые «перепредставлены» в промоторах дифференциально экспрессирующихся генов, по сравнению с генами, транскрипция которых не меняется;
Поиск «мастер-регуляторов» в сети на основе различных алгоритмов: расчет путей в сети, алгоритм случайного блуждания с возвратом и др.
Слайд 57Моделирование динамики сетей
Моделирование изменения концентраций субстратов/продуктов реакций во времени.
В сигнальной
сети изменение концентраций активных форм киназ или других белков, вторичных
мессенджеров, концентраций транскрипционных факторов в ядре и др.
Моделирование динамики дает возможность определения:
Стационарных состояний (концентрации не меняются)
Предсказание поведения системы при различных условиях (стимуляция рецепторов, ингибирование белков сигнальных путей, мутации и др.)
Предсказание перспективных мишеней лекарств и возможных побочных эффектов воздействия на них
Слайд 58Моделирование динамики сетей
Дифференциальные уравнения
Логические сети
Сети Петри
Клеточный автомат
Гибридные методы
Слайд 59Дифференциальные уравнения
Система дифференциальных уравнений, описывающих изменение концентраций РНК и белков
во времени:
Xi – концентрация i-го белка, РНК или мессенджера
Ограничения:
Каждое уравнение
требует знания одного или нескольких параметров (констант скоростей, констант диссоциации), которые известны для небольших участков сетей.
Нелинейные уравнения невозможно решить настоящими математическими методами, не прибегая к искусственной подгонке параметров в заданных интервалах.
Большие наборы дифференциальных уравнений сложно моделировать и анализировать.
Слайд 61Численные методы решения. Метод Эйлера
Начальное состояние:
Слайд 62Логические сети
Простейший вариант – булевы сети
Каждая молекула (ген или белок)
активна (1) или неактивна (0).
Состояние системы – состояние активности каждой
из молекул в сети.
Состояние молекулы определяется как функция состояний действующих на неё молекул на предыдущем шаге моделирования.
Для этой цели используются булевы функции.
A OR B = C
A AND B = C
A
B
C
A
B
C
A
B
C
A
B
C
Слайд 63Модель апоптоза у дрожжей
Сеть регуляции апоптоза
Слайд 64Для каждого белка записываются булевы функции
Плюсом обозначено логическое «И».
Слайд 65Различные внешние воздействия приводят к индукции апоптоза
Слайд 66Сети Петри
Впервые описаны Карлом Петри в 1962 году.
Сеть Петри –
это граф с двумя типами вершин и ребрами, которые их
соединяют.
P1, P2, P3, P4 – позиции
T1, T2 - переходы
В позициях могут размещаться метки (маркеры), способные перемещаться по сети.
Событие – срабатывание перехода, при котором метки из входных позиций этого перехода перемещаются в выходные позиции.
Слайд 67Примеры описания взаимодействий
A+BC
CA+B
A+BC (кат. ферментом E)
A+BC (ингибитор)
A
B
C
A
B
C
A
B
C
E
A
B
C
E
Слайд 68Расширение сетей Петри
Временная сеть Петри - такая сеть, где переходы
обладают весом, определяющим продолжительность срабатывания (задержку).
Стохастическая сеть Петри -
сеть, в которой задержки являются случайными величинами. Могут отражать скорости реакций.
Функциональная сеть Петри - сеть, в которой задержки определяются как функции некоторых аргументов, например, количества меток в каких-либо позициях, состояния некоторых переходов.
Цветная сеть Петри - сеть, в которой метки могут быть различных типов, обозначаемых цветами, тип метки может быть использован как аргумент в функциональных сетях.
Ингибиторная сеть Петри - сеть, в которой возможны ингибиторные, то есть подавляющие, дуги, запрещающие срабатывания перехода, если во входной позиции, связанной с переходом ингибиторной дугой, находится метка.
Слайд 69Клеточный автомат
Состоит из регулярной решетки ячеек, каждая из которых может
находится в одном из конечного множества состояний, таких как 1
или 0.
Для работы клеточного автомата требуется задание начального состояния всех ячеек и правил перехода ячеек из одного состояния в другое.
На каждом шаге моделирования определяется новое состояние ячейки, которое зависит от правил перехода и состояний соседних ячеек.
Количество клеток активных в начальном состоянии может быть пропорционально начальным концентрациям компонентов системы.
Клетки в состоянии 1 могут соответствовать разным компонентам системы.
Слайд 71Моделирование апоптоза, индуцированного FASL
FLIP и IAP – ингибиторы апоптоза. А
siRNA и SMAC, в свою очередь, ингибиторы этих белков.
Слайд 73Результаты моделирования
Изучение влияние siRNA и SMAC на концентрацию DFF40.
Моделирование заканчивается
при достижении стационарного состояния