Слайд 1Построение и анализ молекулярных сетей
                            							
							
							
						 
											
                            Слайд 2Сложная биологическая система может быть представлена в виде сети взаимодействующих
                                                            
                                    объектов: организмы, клетки, белки, гены, РНК, метаболиты, медиаторы, ионы и
                                    др.
Молекулярная сеть описывает взаимодействия объектов (белки, гены, метаболиты и др.) на уровне клетки.
Биологические сети
Сигнальные сети
Метаболические сети
Сети белок-белковых взаимодействий
Сети ко-экспрессии
Сети ко-цитирования генов в PubMed
Другие
                                
 
                            							
														
						 
											
                            Слайд 3Сигнальные сети
Основная функция – распознавание и передача сигналов с рецепторов
                                                            
                                    в ядро или к другим молекулам и структурам клетки.
Пример: активация
                                    рецепторов для факторов роста запускает сигнальные каскады, которые усиливают транскрипцию генов, связанных с пролиферацией клеток, и подавляют транскрипцию генов, связанных с запуском апоптоза.
Пример: активация рецепторов приводит через киназные каскады к фосфорилированию ионных каналов и транспортеров, что меняет амплитуду ионных токов.
Сигнальный путь – часть сигнальной сети клетки, связанная с регуляцией определенных клеточных функций.
Пример: регуляция апоптоза, регуляция клеточного деления, регуляция секреции инсулина.
                                
 
                            							
														
						 
											
                            Слайд 4Сигнальные пути
Активация рецепторов запускает сигнальные каскады, что приводит к изменению
                                                            
                                    транскрипции генов и ответу клетки на внешнее воздействие
Зеленые ребра –
                                    активация
Красные ребра - ингибирование
Представлен в виде графа: Вершины – белки;
Ребра – взаимодействия.
                                
 
                            							
														
						 
											
                            Слайд 5Адренергический сигнальный путь в кардиомиоцитах
Стимуляция бета-адренорецепторов активирует киназы, которые фосфорилируют
                                                            
                                    
транспортеры и ионные каналы, что приводит к изменению концентраций ионов
                                    в клетке. Адренорецепторы через этот же сигнальный путь регулируют такие процессы как апоптоз и гипертрофия кардиомиоцитов.
                                
                            							
														
						 
											
                            Слайд 6Свойства сигнальных сетей
Большое количество перекрестов между сигнальными путями. Один и
                                                            
                                    тот же белок участвует в регуляции многих клеточных функций.
Существование альтернативных
                                    (дублирующих) путей – устойчивость системы к мутациям, ингибированию и т.д.
Наличие обратных связей
Положительная обратная связь
Отрицательная обратная связь
Обеспечивает переключение между разными состояниями клетки,
например в ходе дифференцировки
Обеспечивает стабильность системы, поддержание текущего состояния клетки
                                
 
                            							
														
						 
											
                            Слайд 7Метаболические пути
Метаболический путь – последовательность химических реакций, осуществляющих синтез продукта
                                                            
                                    
(или нескольких продуктов) из исходных субстратов или его деградацию.
Метаболическая сеть
                                    – совокупность всех метаболических путей клетки.
Метаболическая сеть (путь) также может быть представлена в виде графа, где вершины – это метаболиты, а ребра – химические реакции. Часто ребру приписывается название фермента, который катализирует данную реакцию
                                
                            							
														
						 
											
											
                            Слайд 9Реконструкция метаболической сети клетки
                            							
														
						 
											
                            Слайд 10Базы данных по сигнальным и метаболическим путям
                            							
														
						 
											
                            Слайд 11KEGG (Kyoto Encyclopedia of Genes and Genomes)
321 сигнальных, регуляторных, метаболических
                                                            
                                    
путей для разных видов животных и человека, включает также пути,
                                    связанные с определёнными заболеваниями 
                                
                            							
														
						 
											
                            Слайд 12REACTOME
1886 сигнальных и метаболических пути человека, организованные иерархически: от отдельных
                                                            
                                    
реакций до крупных путей. Позволяет визуализировать отдельные участки сигнальных и
                                    метаболических путей.
                                
                            							
														
						 
											
											
                            Слайд 14Сети белок-белковых взаимодействий (ББВ)
Вершины данной сети представляют собой белки, а
                                                            
                                    
ребра показывают наличие прямых, физических взаимодействий между белками.
Не содержат информации
                                    о характере взаимодействий: активация, ингибирование, образование комплекса и др.
Представляет собой вид сетей, который наиболее часто используется в различных исследованиях в области биоинформатики.
Сеть белок-белковых взаимодействий клетки по некоторым оценкам может включать более 600 000 взаимодействий.
                                
                            							
														
						 
											
                            Слайд 15Подходы к оценке белок-белковых взаимодействий
Ко-иммунопреципитация
Аффинная хроматография
Перекресная сшивка при помощи реактивных
                                                            
                                    
соединений или УФ
Поверхностный плазмонный резонанс
Равновесный диализ и метод связывания на
                                    фильтрах
Резонансный перенос энергии флуоресценции
                                
                            							
														
						 
											
                            Слайд 16Базы данных по белок-белковым взаимодействиям
                            							
														
						 
											
                            Слайд 17HIPPIE
Содержит информацию о более чем 18000 белках человека и 400000
                                                            
                                    
взаимодействий.
Каждому взаимодействию присвоена оценка, отражающая достоверность ББВ. Эта оценка вычисляется
                                    исходя из количества независимых экспериментов и методов, в которых было зарегистрировано данное ББВ. 
                                
                            							
														
						 
											
											
											
											
											
											
                            Слайд 23Сети ко-экспрессии
Разные условия, разные эксперименты
Для каждой пары генов
Коэффициент корреляции Пирсона
Ранговый
                                                            
                                    
коэффициент корреляции Спирмена
Евклидово расстояние
……
                                                                    
                            							
														
						 
											
											
                            Слайд 25Сети ко-экспрессии
Определяется порог коэффициента корреляции r. Если r выше порога,
                                                            
                                    
то два гена соединяются ребром, если ниже, то не соединяются.
                                                                    
                            							
														
						 
											
											
                            Слайд 27Результаты поиска для гена ADRB1 в COXPRESdb
                            							
														
						 
											
											
                            Слайд 29Сети на основе интеграции информации
Сигнальные сети построены на основе интеграции
                                                            
                                    
данных о белок-белковых взаимодействиях, регуляции транскрипции генов, вторичных мессенджерах и
                                    др.
Эти данные максимально приближены к реальным событиям в клетке.
Другой пример интеграции данных: сеть, построенная Ghiassian SD с соавторами (Ghiassian SD et al., 2015). Построена путем интеграции следующих данных:
Белок-белковые взаимодействия;
Взаимодействия белок-ДНК;
Непрямые взаимодействия между ферментами метаболических путей (наличие общего метаболита).
                                
                            							
														
						 
											
                            Слайд 30Примеры средств для визуализации и анализа сетей
                            							
														
						 
											
                            Слайд 31Cytoscape (http://www.cytoscape.org/)
                            							
														
						 
											
                            Слайд 32Cytoscape
Платформа с открытым исходным кодом для визуализации и анализа биологических
                                                            
                                    
сетей.
Возможность использования дополнительных данных, таких как функциональная аннотация, информация об
                                    уровне экспрессии генов.
Дополнительные функции доступны в виде плагинов, которые могут менять дизайн сетей, обеспечивать поддержку дополнительных файловых форматов и связь с разными базами данных.
Плагины могут быть написаны любым пользователем на основе Java.
В настоящее время написано большое количество плагинов, доступных через http://apps.cytoscape.org/.
                                
                            							
														
						 
											
											
                            Слайд 34Связные компоненты
7 связных компонент
                            							
														
						 
											
                            Слайд 35Путь в сети (графе)
Путь – это последовательность вершин {x1, x2,
                                                            
                                    
…, xn} такая, что (x1, x2), (x2,x3), …, (xn-1, xn)
                                    являются ребрами графа.
В направленном графе путь может быть проложен только по направлению ребер.
Кратчайший путь – путь с минимальной последовательностью вершин {x1, x2, …, xn} из всех возможных путей.
Закрытый путь xn=x1 в графе называется циклом. 
                                
                            							
														
						 
											
											
                            Слайд 37Характеристики сети – степень вершины
Степень вершины (k) – число взаимодействий
                                                            
                                    с другими вершинами.
Для направленных сетей нужно считать отдельно число входящих
                                    ребер (kin) и исходящих ребер (kout)
K=5
Kin=2; kout=3
                                
 
                            							
														
						 
											
                            Слайд 38Распределение степени
Распределение имеет вид степенной зависимости P(k) ~ k-γ
Большинство вершин
                                                            
                                    сети имеет небольшое число взаимодействий.
Лишь незначительное количество вершин сети имеет
                                    большое число взаимодействий.
Случайная сеть
Реальная сеть
Реальная сеть
Случайная сеть
                                
 
                            							
														
						 
											
                            Слайд 39Свойства белков-«хабов»
Белки с большим числом взаимодействий называются белками- «хабами».
Многие «хабы»
                                                            
                                    
являются наиболее важными, ключевыми белками в клетке.
Нарушение их функций может
                                    быть фатальным для клетки.
Лекарственные вещества, связанные с противоопухолевой терапией, ингибируют «хабы», вызывая гибель опухолевых клеток. Поскольку ингибируют «хабы» в других тканях и органах, то очень токсичны.
Мутации в генах, кодирующих белки-«хабы», могут приводить к канцерогенезу.
                                
                            							
														
						 
											
                            Слайд 40Свойства белков-«хабов»
Белки-«хабы» чаще всего не взаимодействуют непосредственно друг с другом
Белки-«хабы»
                                                            
                                    
более консервативны у разных видов, по сравнению с другими белками.
Белки-
                                    «хабы» не эквивалентны между собой. «Хаб» имеющий 20 входящий ребер и одно исходящие отличается от «хаба», имеющего 1 входящее ребро и 20 исходящий, не смотря на то, что общее число взаимодействий у них равно.
Разделяют два вида белков- «хабов»: постоянные «хабы» (party hubs) и временные «хабы» (data hubs). Временные «хабы» имеют непостоянное число взаимодействий. Они могут взаимодействовать с разными белками в зависимости от условий.
                                
                            							
														
						 
											
                            Слайд 41Мотивы и графлеты
Мотивами называются цепочки или контуры из 3-6 вершин
                                                            
                                    в направленной сети (например в сигнальной сети), которые встречаются гораздо
                                    чаще, чем в случайной сети.
Графлеты – аналог мотивов в ненаправленной сети (например в сети ББВ).
Пример мотива – обратная связь в сигнальной сети (feedback loop).
Пример графлета – комплекс из трех белков в сети ББВ (Triangle)
                                
 
                            							
														
						 
											
                            Слайд 42Модули в биологических сетях
Структура биологических сетей неоднородна.
Сети содержат модули, состоящие
                                                            
                                    из вершин, которые имею большее число связей друг с другом,
                                    чем с остальными вершинами сети.
Модули состоят из белков (генов), которые выполняют общую клеточную функцию - часть сигнального пути, белковый комплекс, сложная молекулярная машинерия (например комплекс РНК-полимеразы с транскрипционными факторами и другими белками).
                                
 
                            							
														
						 
											
                            Слайд 43Модули в биологических сетях
Межмодулярные хабы – «хабы», которые соединяют два
                                                            
                                    
соседних модуля.
Мосты (bridge) – вершины, которые также соединяют соседние модули,
                                    но имеют меньшее число взаимодействий.
«Бутылочное горлышко» (bottleneck) – единственная вершина, которая соединяет два модуля. 
                                
                            							
														
						 
											
                            Слайд 44Модули в биологических сетях
Межмодулярные «хабы» представляют собой временные «хабы», для
                                                            
                                    
которых количество и состав взаимодействий меняются в зависимости от условий.
Межмолекулярные
                                    «хабы» играют регуляторную роль и их мутации часто приводят к канцерогенезу.
Ингибирование «бутылочных горлышек» ассоциировано с высокой токсичностью, фатально для клетки. Может использоваться только для противоопухолевой терапии. «Бутылочные горлышки» являются предпочтительной мишенью микроРНК.
Модули часто перекрываются. Белок может входить в несколько модулей и выполнять несколько разных клеточных функций.
Изменение в перекрытии модулей – основной механизм адаптации сложных систем.
                                
                            							
														
						 
											
                            Слайд 45Предсказание маркеров заболеваний
Белки (гены), связанные с определенным заболеванием, обладают тенденцией
                                                            
                                    
формировать один или несколько перекрывающихся модулей в сети.
Этот факт используется
                                    для предсказания новых белков, ассоциированных с заболеванием, по их расположению в сети.
Если белок находится в модуле, обогащенным белками, для которых известна связь с заболеванием, то он также может быть связан с заболеванием.
Чем с большим числом таких белков он взаимодействует (напрямую или через одного/несколько соседей в сети), тем вероятнее связь с заболеванием.
                                
                            							
														
						 
											
                            Слайд 46Сеть белок-белковых взаимодействий
Белки с известной связью с заболеванием
Белки-кандидаты
                            							
														
						 
											
                            Слайд 47Методы оценки связи белков (генов) с заболеванием
Метод ближайшего соседа 
n
                                                            
                                    – число взаимодействий с белками с известной связью с заболеванием.
N
                                    - общее число взаимодействий.
dk – вес взаимодействия (аффинность или достоверность) 
Оценка равна 0,5 при условии, что веса ребер равны 1.
                                
 
                            							
														
						 
											
                            Слайд 48Случайное блуждание с возвратом 
Методы оценки связи белков (генов) с
                                                            
                                    
заболеванием
Вычисляется вероятность p∞ оказаться в вершине k после большого количества
                                    итераций, если в начальный момент времени с равной вероятностью стартовать с одной из вершин с известной связью с заболеванием. Существует вероятность возврата в исходную вершину r. W – взвешенная матрица смежности сети, каждый элемент которой равен весу соответствующего ребра. Если ребро отсутствует, то элемент равен нулю. Начальные вероятности P0 отличны от нуля только для вершин с известной связью с заболеванием.
                                
                            							
														
						 
											
                            Слайд 49Оценка связи белка (гена) с заболеванием
Широкомасштабные генетические исследования. Оценка корреляции
                                                            
                                    
полиморфизма гена с наличием/отсутствием заболевания.
Генетический нокаут. Получают линии мышей, у
                                    которых из ДНК «вырезан» тот или иной ген. Тотальный нокаут – ген отсутствует во всех клетках организма. Органоспецифический нокаут – ген отсутствует только в определенном органе.
Генетический нокдаун. Разрушение мРНК при помощи механизмов РНК-интерференции. Используют siРНК.
Низкомолекулярные ингибиторы/активаторы. Например, ингибиторы ферментов или агонисты рецепторов.
                                
                            							
														
						 
											
                            Слайд 50Базы данных по связи белков/генов с заболеваниями
                            							
														
						 
											
                            Слайд 51DisGeNET
Включает информацию, интегрированную из многих источников, в том числе из
                                                            
                                    
литературы. Эту информацию можно представить в виде сети с двумя
                                    типами вершин: гены и заболевания.
                                
                            							
														
						 
											
                            Слайд 52Результаты поиска для ADRB1
Score отражает достоверность связи между геном и
                                                            
                                    
заболеванием.
Наиболее достоверна связь с гипертензией и сердечной недостаточностью.
                                                                    
                            							
														
						 
											
                            Слайд 53Связь ADRB1 с гипертензией
Указан источник данных. Показаны предложения из Abstarcts
                                                            
                                    
PubMed, в которых выделены ключевые слова: ADRB1 и hypertension.
                                                                    
                            							
														
						 
											
                            Слайд 54«Мастер-регуляторы» в сети
«Мастер-регулятор» – ключевой белок, ответственный за изменение экспрессии
                                                            
                                    
генов.
Гиперэкспрессированные гены
Гипоэкспрессированные гены
Мастер-регулятор
                                                                    
                            							
														
						 
											
                            Слайд 55Этапы поиска «мастер-регуляторов»
Идентификация дифференциально экспрессирующихся генов (норма-патология, лекарство-растворитель и др.);
Поиск
                                                            
                                    
экспериментальной информации о транскрипционных факторах, регулирующих транскрипцию этих генов, либо
                                    предсказание сайтов связывания методами биоинформатики;
Поиск транскрипционных факторов, которые «перепредставлены» в промоторах дифференциально экспрессирующихся генов, по сравнению с генами, транскрипция которых не меняется;
Поиск «мастер-регуляторов» в сети на основе различных алгоритмов: расчет путей в сети, алгоритм случайного блуждания с возвратом и др.
                                
                            							
														
						 
											
											
                            Слайд 57Моделирование динамики сетей
Моделирование изменения концентраций субстратов/продуктов реакций во времени.
В сигнальной
                                                            
                                    сети изменение концентраций активных форм киназ или других белков, вторичных
                                    мессенджеров, концентраций транскрипционных факторов в ядре и др.
Моделирование динамики дает возможность определения:
Стационарных состояний (концентрации не меняются)
Предсказание поведения системы при различных условиях (стимуляция рецепторов, ингибирование белков сигнальных путей, мутации и др.)
Предсказание перспективных мишеней лекарств и возможных побочных эффектов воздействия на них
                                
 
                            							
														
						 
											
                            Слайд 58Моделирование динамики сетей
Дифференциальные уравнения
Логические сети
Сети Петри
Клеточный автомат
Гибридные методы
                            							
														
						 
											
                            Слайд 59Дифференциальные уравнения
Система дифференциальных уравнений, описывающих изменение концентраций РНК и белков
                                                            
                                    
во времени:
Xi – концентрация i-го белка, РНК или мессенджера
Ограничения:
Каждое уравнение
                                    требует знания одного или нескольких параметров (констант скоростей, констант диссоциации), которые известны для небольших участков сетей.
Нелинейные уравнения невозможно решить настоящими математическими методами, не прибегая к искусственной подгонке параметров в заданных интервалах.
Большие наборы дифференциальных уравнений сложно моделировать и анализировать.
                                
                            							
														
						 
											
											
                            Слайд 61Численные методы решения. Метод Эйлера
Начальное состояние:
                            							
														
						 
											
                            Слайд 62Логические сети
Простейший вариант – булевы сети
Каждая молекула (ген или белок)
                                                            
                                    активна (1) или неактивна (0).
Состояние системы – состояние активности каждой
                                    из молекул в сети.
Состояние молекулы определяется как функция состояний действующих на неё молекул на предыдущем шаге моделирования.
Для этой цели используются булевы функции.
A OR B = C
A AND B = C
A
B
C
A
B
C
A
B
C
A
B
C
                                
 
                            							
														
						 
											
                            Слайд 63Модель апоптоза у дрожжей
Сеть регуляции апоптоза
                            							
														
						 
											
                            Слайд 64Для каждого белка записываются булевы функции
Плюсом обозначено логическое «И».
                            							
														
						 
											
                            Слайд 65Различные внешние воздействия приводят к индукции апоптоза
                            							
														
						 
											
                            Слайд 66Сети Петри
Впервые описаны Карлом Петри в 1962 году.
Сеть Петри –
                                                            
                                    это граф с двумя типами вершин и ребрами, которые их
                                    соединяют.
P1, P2, P3, P4 – позиции
T1, T2 - переходы
В позициях могут размещаться метки (маркеры), способные перемещаться по сети.
Событие – срабатывание перехода, при котором метки из входных позиций этого перехода перемещаются в выходные позиции.
                                
 
                            							
														
						 
											
                            Слайд 67Примеры описания взаимодействий
A+BC
CA+B
A+BC (кат. ферментом E)
A+BC (ингибитор)
A
B
C
A
B
C
A
B
C
E
A
B
C
E
                            							
														
						 
											
                            Слайд 68Расширение сетей Петри
Временная сеть Петри - такая сеть, где переходы
                                                            
                                    
обладают весом, определяющим продолжительность срабатывания (задержку). 
Стохастическая сеть Петри -
                                    сеть, в которой задержки являются случайными величинами. Могут отражать скорости реакций.
Функциональная сеть Петри - сеть, в которой задержки определяются как функции некоторых аргументов, например, количества меток в каких-либо позициях, состояния некоторых переходов. 
Цветная сеть Петри - сеть, в которой метки могут быть различных типов, обозначаемых цветами, тип метки может быть использован как аргумент в функциональных сетях. 
Ингибиторная сеть Петри - сеть, в которой возможны ингибиторные, то есть подавляющие, дуги, запрещающие срабатывания перехода, если во входной позиции, связанной с переходом ингибиторной дугой, находится метка. 
                                
                            							
														
						 
											
                            Слайд 69Клеточный автомат
Состоит из регулярной решетки ячеек, каждая из которых может
                                                            
                                    
находится в одном из конечного множества состояний, таких как 1
                                    или 0.
Для работы клеточного автомата требуется задание начального состояния всех ячеек и правил перехода ячеек из одного состояния в другое.
На каждом шаге моделирования определяется новое состояние ячейки, которое зависит от правил перехода и состояний соседних ячеек.
Количество клеток активных в начальном состоянии может быть пропорционально начальным концентрациям компонентов системы.
Клетки в состоянии 1 могут соответствовать разным компонентам системы.
                                
                            							
														
						 
											
											
                            Слайд 71Моделирование апоптоза, индуцированного FASL
FLIP и IAP – ингибиторы апоптоза. А
                                                            
                                    
siRNA и SMAC, в свою очередь, ингибиторы этих белков.
                                                                    
                            							
														
						 
											
											
                            Слайд 73Результаты моделирования
Изучение влияние siRNA и SMAC на концентрацию DFF40.
Моделирование заканчивается
                                                            
                                    
при достижении стационарного состояния