Разделы презентаций


Парное выравнивание. Матрицы замен. BLAST

Содержание

Парное выравнивание является самой фундаментальной операцией биоинформатики Определяет связаны ли структурно или функционально два белка (или гена)Выявляет домены или мотивы, которые являются общими между белкамиИспользуется для анализа и аннотации генома (поиск

Слайды и текст этой презентации

Слайд 1Парное выравнивание. Матрицы замен. BLAST
Кафедра биоинформатики МБФ РНИМУ
Лекция 2

Парное выравнивание.  Матрицы замен. BLASTКафедра биоинформатики МБФ РНИМУЛекция 2

Слайд 2Парное выравнивание является самой фундаментальной операцией биоинформатики
Определяет связаны ли

структурно или функционально два белка (или гена)

Выявляет домены или мотивы,

которые являются общими между белками

Используется для анализа и аннотации генома (поиск и описание генов, участков кодирующих рРНК и тРНК, поиск регуляторных сигналов)

Кафедра биоинформатики МБФ РНИМУ

Парное выравнивание является самой фундаментальной операцией биоинформатики Определяет связаны ли структурно или функционально два белка (или гена)Выявляет

Слайд 3Парные выравнивания: белковые последовательности могут быть более информативными, чем ДНК
Последовательность

белка более информативна (20 против 4 символов); многие аминокислоты имеют

общие физико-химические свойства
Нуклеотидные кодоны вырождены: изменения в третьей позиции часто не приводит к изменению аминокислоты
Последовательности ДНК могут быть переведены в белковые, и затем использоваться в парных выравниваниях

Кафедра биоинформатики МБФ РНИМУ

Парные выравнивания: белковые последовательности могут быть более информативными, чем ДНКПоследовательность белка более информативна (20 против 4 символов);

Слайд 4Принятые однобуквенные коды нуклеиновых кислот
Кафедра биоинформатики МБФ РНИМУ

Принятые однобуквенные коды нуклеиновых кислотКафедра биоинформатики МБФ РНИМУ

Слайд 5Кафедра биоинформатики МБФ РНИМУ

Кафедра биоинформатики МБФ РНИМУ

Слайд 6Кафедра биоинформатики МБФ РНИМУ
Pevsner J. Bioinformatics and Functional Genomics, 2009

Кафедра биоинформатики МБФ РНИМУPevsner J. Bioinformatics and Functional Genomics, 2009

Слайд 7Принятые однобуквенные коды нуклеиновых кислот
Кафедра биоинформатики МБФ РНИМУ

Принятые однобуквенные коды нуклеиновых кислотКафедра биоинформатики МБФ РНИМУ

Слайд 8Парное выравнивание в 1950-х годах
Кафедра биоинформатики МБФ РНИМУ

Парное выравнивание в 1950-х годахКафедра биоинформатики МБФ РНИМУ

Слайд 9Парные выравнивания ДНК последовательностей полезны в следующих случаях:
для подтверждения идентичности

кДНК (комплементарная ДНК (кДНК, англ. сDNA) — это ДНК, синтезированная

на матрице зрелой мРНК в реакции, катализируемой обратной транскриптазой).
исследование некодирующих областей ДНК
изучения полиморфизма ДНК
пример: ДНК неандертальца против современной человеческой ДНК

Кафедра биоинформатики МБФ РНИМУ

Парные выравнивания ДНК последовательностей полезны в следующих случаях:для подтверждения идентичности кДНК (комплементарная ДНК (кДНК, англ. сDNA) —

Слайд 10Определение парного выравнивания
Кафедра биоинформатики МБФ РНИМУ
Процесс выравнивания двух последовательностей

для достижения максимальных уровней идентичности (и консервативности, в случае аминокислотных

последовательностей) с целью оценки степени сходства и возможной гомологии.
Определение парного выравнивания Кафедра биоинформатики МБФ РНИМУПроцесс выравнивания двух последовательностей для достижения максимальных уровней идентичности  (и

Слайд 11Гомология
Сходство между последовательностями связано с происхождением от общего предка
Кафедра биоинформатики

МБФ РНИМУ
Beta globin (NP_000509)
2HHB
myoglobin
(NP_005359)
2MM1

ГомологияСходство между последовательностями связано с происхождением от общего предкаКафедра биоинформатики МБФ РНИМУBeta globin  (NP_000509) 2HHBmyoglobin(NP_005359)2MM1

Слайд 12Два типа гомологии
Кафедра биоинформатики МБФ РНИМУ
Ортологи:
Гомологичные последовательности у разных видов,

которые возникли из общего предкового гена во время видообразования; могут

быть или не быть ответственным за аналогичные функции.

Паралоги: Гомологичные последовательности в пределах одного вида, которые возникли путем дупликации генов.

Два типа гомологииКафедра биоинформатики МБФ РНИМУОртологи:Гомологичные последовательности у разных видов, которые возникли из общего предкового гена во

Слайд 13Общий подход к попарному выравниванию
Выбрать две последовательности
Выбрать алгоритм, который генерирует

оценку сходства
Определить условия (штраф) для пробелов (вставки, делеции) при выравнивании
Счет

отражает степень сходства
Выравнивание может быть глобальными или локальными
Оценить вероятность того, что выравнивание произошло случайно

Кафедра биоинформатики МБФ РНИМУ

Общий подход к попарному выравниваниюВыбрать две последовательностиВыбрать алгоритм, который генерирует оценку сходстваОпределить условия (штраф) для пробелов (вставки,

Слайд 14Кафедра биоинформатики МБФ РНИМУ
Элементарное преобразование последовательности: замена буквы или удаление

буквы или вставка буквы.
Редакционное расстояние: минимальное количество элементарных преобразований, переводящих

одну последовательность в другую.
Формализация задачи сравнения последовательностей: найти редакционное расстояние и набор преобразований, его реализующий

Редакционное расстояние

Кафедра биоинформатики МБФ РНИМУЭлементарное преобразование последовательности: замена буквы или удаление буквы или вставка буквы.Редакционное расстояние: минимальное количество

Слайд 15Расчёт оценки выравнивания (Score)
Кафедра биоинформатики МБФ РНИМУ
http://www.ncbi.nlm.nih.gov/Education/BLASTinfo/Alignment_Scores2.html
Идентичность (identity) –

остатки (аминокислоты) в одинаковых позициях последовательностей одни и те же.

«+» оценка

Несовпадение (mismatch) – остатки (аминокислоты) в одинаковых позициях последовательностей разные. «-» или «+» оценка

Штраф за пробел (gap penalty) – в одной из последовательностей произошла вставка или делеция, поэтому необходимо добавить пробел. Т.к. такое событие происходит реже, чем изменение остатка, то за это действие вводится штраф. Штрафы могут быть разные: за начало пробела (gap opening) и за продолжение пробела (gap extension). «-» оценка

Расчёт оценки выравнивания (Score) Кафедра биоинформатики МБФ РНИМУhttp://www.ncbi.nlm.nih.gov/Education/BLASTinfo/Alignment_Scores2.htmlИдентичность (identity) – остатки (аминокислоты) в одинаковых позициях последовательностей одни

Слайд 16Сходство последовательностей (Similarity)
Степень, в которой нуклеотидные или аминокислотные последовательности связаны

между собой. Она основана на идентичности и консервативности.
Кафедра биоинформатики МБФ

РНИМУ

Идентичность (identity) : Степень, в которой две (нуклеотидные или аминокислотные) последовательности одинаковы.

Консервативность (conservation) : Изменения в определенном положении аминокислотного остатка или (реже, нуклеотидного) в последовательности, которые сохраняют физико-химические свойства исходного остатка.

Сходство последовательностей (Similarity)Степень, в которой нуклеотидные или аминокислотные последовательности связаны между собой. Она основана на идентичности и

Слайд 17Кафедра биоинформатики МБФ РНИМУ
Глобальное выравнивание


Локальное выравнивание


Поиск перекрывающихся последовательностей
Стратегии выравнивания

Кафедра биоинформатики МБФ РНИМУГлобальное выравниваниеЛокальное выравниваниеПоиск перекрывающихся последовательностейСтратегии выравнивания

Слайд 18Кафедра биоинформатики МБФ РНИМУ

Кафедра биоинформатики МБФ РНИМУ

Слайд 19Кафедра биоинформатики МБФ РНИМУ
Выберем: Аlign two or more sequences…

Кафедра биоинформатики МБФ РНИМУВыберем:  Аlign two or more sequences…

Слайд 20Кафедра биоинформатики МБФ РНИМУ
Введем две последовательности (accession numbers или в

формате fasta format) и кликнем BLAST.

Выберем “Algorithm parameters” и обратим

внимание на опцию Matrix.
Кафедра биоинформатики МБФ РНИМУВведем две последовательности (accession numbers или в формате fasta format) и кликнем BLAST.Выберем “Algorithm

Слайд 21Кафедра биоинформатики МБФ РНИМУ
Результаты парного выравнивания human beta globin и

myoglobin
Myoglobin RefSeq
Query = HBB
Subject = MB
Средняя строка показывает identities;
+ sign

for similar matches

Информация о выравнивании: score, expect value, identities, positives, gaps…

Кафедра биоинформатики МБФ РНИМУРезультаты парного выравнивания human beta globin и myoglobinMyoglobin RefSeqQuery = HBBSubject = MBСредняя строка

Слайд 22Кафедра биоинформатики МБФ РНИМУ
Результаты парного выравнивания human beta globin и

myoglobin:
Score = сумма совпадений (match), несовпадений (mismatch), создание пробела

(gap creation), и продолжение пробела (gap extension)

V matching V дает +4 Эти оценки даны на основе
T matching L дает -1 матрицы замен “scoring matrix”!

Кафедра биоинформатики МБФ РНИМУРезультаты парного выравнивания human beta globin и myoglobin: Score = сумма совпадений (match), несовпадений

Слайд 23Пробелы (gaps)
Кафедра биоинформатики МБФ РНИМУ
First gap position scores -11
Second gap

position scores -1
Создание пробела – большой штраф;
Расширение пробела – небольшой

штраф.
Пробелы (gaps)Кафедра биоинформатики МБФ РНИМУFirst gap position scores -11	Second gap position scores -1	Создание пробела – большой штраф;Расширение

Слайд 24Нахождение предка
Кафедра биоинформатики МБФ РНИМУ

Нахождение предкаКафедра биоинформатики МБФ РНИМУ

Слайд 25Выравнивание парных последовательностей позволяет нам вернуться на миллиарды лет назад
Кафедра

биоинформатики МБФ РНИМУ
4
3
2
1
0
Происхождение жизни
Происхождение эукариот
Насекомые
Грибы/животные
Растения/животные
Самые ранние окаменелости
Эукориоты/
археи
Когда вы делаете попарное

выравнивание гомологичных белков человека и растений, вы изучаете последовательности общего предка, жившего 1500000000 лет назад!
Выравнивание парных последовательностей позволяет нам вернуться на миллиарды лет назадКафедра биоинформатики МБФ РНИМУ43210Происхождение жизниПроисхождение эукариотНасекомыеГрибы/животныеРастения/животныеСамые ранние окаменелостиЭукориоты/археиКогда

Слайд 26Кафедра биоинформатики МБФ РНИМУ
fly GAKKVIISAP SAD.APM..F VCGVNLDAYK

PDMKVVSNAS CTTNCLAPLA
human GAKRVIISAP SAD.APM..F VMGVNHEKYD NSLKIISNAS CTTNCLAPLA


plant GAKKVIISAP SAD.APM..F VVGVNEHTYQ PNMDIVSNAS CTTNCLAPLA
bacterium GAKKVVMTGP SKDNTPM..F VKGANFDKY. AGQDIVSNAS CTTNCLAPLA
yeast GAKKVVITAP SS.TAPM..F VMGVNEEKYT SDLKIVSNAS CTTNCLAPLA
archaeon GADKVLISAP PKGDEPVKQL VYGVNHDEYD GE.DVVSNAS CTTNSITPVA

fly KVINDNFEIV EGLMTTVHAT TATQKTVDGP SGKLWRDGRG AAQNIIPAST
human KVIHDNFGIV EGLMTTVHAI TATQKTVDGP SGKLWRDGRG ALQNIIPAST
plant KVVHEEFGIL EGLMTTVHAT TATQKTVDGP SMKDWRGGRG ASQNIIPSST
bacterium KVINDNFGII EGLMTTVHAT TATQKTVDGP SHKDWRGGRG ASQNIIPSST
yeast KVINDAFGIE EGLMTTVHSL TATQKTVDGP SHKDWRGGRT ASGNIIPSST
archaeon KVLDEEFGIN AGQLTTVHAY TGSQNLMDGP NGKP.RRRRA AAENIIPTST

fly GAAKAVGKVI PALNGKLTGM AFRVPTPNVS VVDLTVRLGK GASYDEIKAK
human GAAKAVGKVI PELNGKLTGM AFRVPTANVS VVDLTCRLEK PAKYDDIKKV
plant GAAKAVGKVL PELNGKLTGM AFRVPTSNVS VVDLTCRLEK GASYEDVKAA
bacterium GAAKAVGKVL PELNGKLTGM AFRVPTPNVS VVDLTVRLEK AATYEQIKAA
yeast GAAKAVGKVL PELQGKLTGM AFRVPTVDVS VVDLTVKLNK ETTYDEIKKV
archaeon GAAQAATEVL PELEGKLDGM AIRVPVPNGS ITEFVVDLDD DVTESDVNAA

Множественное выравнивание последовательностей
глицеральдегид 3-фосфат дегидрогеназ:
пример очень высокого консерватизма

Кафедра биоинформатики МБФ РНИМУfly    GAKKVIISAP SAD.APM..F VCGVNLDAYK PDMKVVSNAS CTTNCLAPLA human   GAKRVIISAP SAD.APM..F

Слайд 27Кафедра биоинформатики МБФ РНИМУ
Emile Zuckerkandl и Linus Pauling (1965) посчитали

частоту замен в 18 глобинах (миоглобины и гемоглобины от человека

до миноги).

Черный: Идентичные
Серые: очень консервативные замены (частота >40%)
Белые: слабо консервативные замены (частота >21%)
Red: замен не наблюдалось

lys обнаружен в 58% сайтов arg

Два белка с 50% идентичностью могут иметь 80 изменений среди 100 остатков. (Почему? Потому что, любой остаток может быть предметом обратных мутаций.)

Кафедра биоинформатики МБФ РНИМУEmile Zuckerkandl и Linus Pauling (1965) посчитали частоту замен в 18 глобинах (миоглобины и

Слайд 28Кафедра биоинформатики МБФ РНИМУ

Кафедра биоинформатики МБФ РНИМУ

Слайд 29Матрицы замен
Матрица замен содержит значения, пропорциональные вероятности того, что аминокислота

i мутирует в аминокислоту j для всех пар аминокислот.
Матрицы замен

строятся путем соединения большого и разнообразного набора проверенных попарных выравниваний (или множественных выравниваний) аминокислот.
Матрицы замен должны отражать истинные вероятности мутаций, происходящих в течении эволюции.
PAM и BLOSUM - два основных типа матриц замен.

Кафедра биоинформатики МБФ РНИМУ

Матрицы заменМатрица замен содержит значения, пропорциональные вероятности того, что аминокислота i мутирует в аминокислоту j для всех

Слайд 30Кафедра биоинформатики МБФ РНИМУ
Основные матрицы замен, применяемые в исследованиях
PAM

(Percentage of Acceptable Point Mutations) или матрица Dayhoff. Исходная матрица

PAM рассчитана по набору глобальных выравниваний близкородственных белков (>85% идентичность) со средней вероятностью мутации в 1%. Остальные матрицы получены путем возведения матрицы в соответствующую степень. Наиболее часто используется матрица PAM250.
Матрицы серии BLOSUM рассчитаны на основе блоков, составленных из непрерывных выравненных фрагментов. Матрица BLOSUM62 рассчитана по выравненным наборам с идентичностью не менее 62%.
Кафедра биоинформатики МБФ РНИМУОсновные матрицы замен, применяемые в исследованиях PAM (Percentage of Acceptable Point Mutations) или матрица

Слайд 31Кафедра биоинформатики МБФ РНИМУ
Мы можем варьировать:
от PAM250 = (PAM1)250,

оценочная матрица, которая присваивает баллы и прощает несоответствия…
(+17 для замены

W на W
или -5 для замены W на T)
Кафедра биоинформатики МБФ РНИМУМы можем варьировать: от PAM250 = (PAM1)250, оценочная матрица, которая присваивает баллы и прощает

Слайд 32Кафедра биоинформатики МБФ РНИМУ
… к целому ряду скоринговых матриц, таких

как PAM10, строгих и не терпящих несоответствия
(+13 для замены W

на W
или -19 для замены W на T)
Кафедра биоинформатики МБФ РНИМУ… к целому ряду скоринговых матриц, таких как PAM10, строгих и не терпящих несоответствия(+13

Слайд 3334 белковых надсемейства Dayhoff
Кафедра биоинформатики МБФ РНИМУ
Белок PAMs за 100 млн.

лет

Ig kappa chain 37
Kappa casein 33
luteinizing hormone b 30
lactalbumin 27
complement component 3 27
epidermal growth

factor 26
proopiomelanocortin 21
pancreatic ribonuclease 21
haptoglobin alpha 20
serum albumin 19
phospholipase A2, group IB 19
prolactin 17
carbonic anhydrase C 16
Hemoglobin a 12
Hemoglobin b 12
34 белковых надсемейства DayhoffКафедра биоинформатики МБФ РНИМУБелок					PAMs за 100 млн. летIg kappa chain					37Kappa casein					33luteinizing hormone b 			30lactalbumin					27complement

Слайд 3434 белковых надсемейства Dayhoff
Кафедра биоинформатики МБФ РНИМУ
Белок PAMs за 100 млн.

лет

Ig kappa chain 37
Kappa casein 33
luteinizing hormone b 30
lactalbumin 27
complement component 3 27
epidermal growth

factor 26
proopiomelanocortin 21
pancreatic ribonuclease 21
haptoglobin alpha 20
serum albumin 19
phospholipase A2, group IB 19
prolactin 17
carbonic anhydrase C 16
Hemoglobin a 12
Hemoglobin b 12

human (NP_005203) versus mouse (NP_031812)

34 белковых надсемейства DayhoffКафедра биоинформатики МБФ РНИМУБелок					PAMs за 100 млн. летIg kappa chain					37Kappa casein					33luteinizing hormone b 			30lactalbumin					27complement

Слайд 35Кафедра биоинформатики МБФ РНИМУ
34 белковых надсемейства Dayhoff
Белок PAMs за 100 млн.

лет

apolipoprotein A-II 10
lysozyme 9.8
gastrin 9.8
myoglobin 8.9
nerve growth factor 8.5
myelin basic protein 7.4
thyroid stimulating hormone b

7.4
parathyroid hormone 7.3
parvalbumin 7.0
trypsin 5.9
insulin 4.4
calcitonin 4.3
arginine vasopressin 3.6
adenylate kinase 1 3.2

Кафедра биоинформатики МБФ РНИМУ34 белковых надсемейства DayhoffБелок					PAMs за 100 млн. летapolipoprotein A-II 				10lysozyme					9.8gastrin						9.8myoglobin					8.9nerve growth factor				8.5myelin basic protein				7.4thyroid

Слайд 36Кафедра биоинформатики МБФ РНИМУ
34 белковых надсемейства Dayhoff
Белок PAMs за 100 млн.

лет

triosephosphate isomerase 1 2.8
vasoactive intestinal peptide 2.6
glyceraldehyde phosph. dehydrogease 2.2
cytochrome c 2.2
collagen 1.7
troponin C, skeletal

muscle 1.5
alpha crystallin B chain 1.5
glucagon 1.2
glutamate dehydrogenase 0.9
histone H2B, member Q 0.9
ubiquitin 0
Кафедра биоинформатики МБФ РНИМУ34 белковых надсемейства DayhoffБелок					PAMs за 100 млн. летtriosephosphate isomerase 1			2.8vasoactive intestinal peptide			2.6glyceraldehyde phosph. dehydrogease	2.2cytochrome

Слайд 37Парное выравнивание человеческого (NP_005203) и мышиного (NP_031812) убиквитина
Кафедра биоинформатики МБФ

РНИМУ

Парное выравнивание человеческого (NP_005203)  и мышиного (NP_031812) убиквитинаКафедра биоинформатики МБФ РНИМУ

Слайд 38Подход Dayhoff позволяет посчитать оценку замены для любых двух выровненных

аминокислотных остатков
Кафедра биоинформатики МБФ РНИМУ
Dayhoff определяет оценку двух выровненных остатков

I, J, как 10 кратный логарифм отношения, частоты их совпадения в природе q (на основе известных последовательностей) на вероятность совпадения этих аминокислот случайно p.
Подход Dayhoff позволяет посчитать оценку замены для любых двух выровненных аминокислотных остатковКафедра биоинформатики МБФ РНИМУDayhoff определяет оценку

Слайд 39Число "принимаемых точечных мутаций": какие аминокислотные замены происходят в белках?
Кафедра

биоинформатики МБФ РНИМУ

Число

Слайд 40Относительная мутабельность аминокислотных остатков
Кафедра биоинформатики МБФ РНИМУ

Относительная мутабельность аминокислотных остатковКафедра биоинформатики МБФ РНИМУ

Слайд 41Нормализованная частота аминокислотных замен
Кафедра биоинформатики МБФ РНИМУ
Gly 8.9% Arg 4.1%
Ala 8.7% Asn 4.0%
Leu 8.5% Phe 4.0%
Lys 8.1% Gln 3.8%
Ser 7.0% Ile 3.7%
Val 6.5% His 3.4%
Thr 5.8% Cys 3.3%
Pro 5.1% Tyr 3.0%
Glu 5.0% Met 1.5%
Asp 4.7% Trp 1.0%

синий = 6

кодонов; красный = 1 кодон

Нормализованная частота аминокислотных заменКафедра биоинформатики МБФ РНИМУGly	8.9%			Arg	4.1%Ala	8.7%			Asn	4.0%Leu	8.5%			Phe	4.0%Lys	8.1%			Gln	3.8%Ser	7.0%			Ile	3.7%Val	6.5%			His	3.4%Thr	5.8%			Cys	3.3%Pro	5.1%			Tyr	3.0%Glu	5.0%			Met	1.5%Asp	4.7%			Trp	1.0% синий = 6 кодонов; красный = 1 кодон

Слайд 42PAM1 (Point-Accepted Mutations) матрица частоты мутаций
Кафедра биоинформатики МБФ РНИМУ
PAM1 -

Встречается одно изменение аминокислоты на 100 а.к.

PAM1 (Point-Accepted Mutations)  матрица частоты мутацийКафедра биоинформатики МБФ РНИМУPAM1 - Встречается одно изменение аминокислоты на 100

Слайд 43PAM1 (Point-Accepted Mutations) матрица вероятности мутаций
Кафедра биоинформатики МБФ РНИМУ
PAM1 -

Встречается одно изменение аминокислоты на 100 а.к.

PAM1 (Point-Accepted Mutations)  матрица вероятности мутацийКафедра биоинформатики МБФ РНИМУPAM1 - Встречается одно изменение аминокислоты на 100

Слайд 44Множественное выравнивание последовательностей глицеральдегид 3-фосфат дегидрогеназ: колонки остатков могут иметь высокую

или низкую консервативность
Кафедра биоинформатики МБФ РНИМУ
fly GAKKVIISAP

SAD.APM..F VCGVNLDAYK PDMKVVSNAS CTTNCLAPLA
human GAKRVIISAP SAD.APM..F VMGVNHEKYD NSLKIISNAS CTTNCLAPLA
plant GAKKVIISAP SAD.APM..F VVGVNEHTYQ PNMDIVSNAS CTTNCLAPLA
bacterium GAKKVVMTGP SKDNTPM..F VKGANFDKY. AGQDIVSNAS CTTNCLAPLA
yeast GAKKVVITAP SS.TAPM..F VMGVNEEKYT SDLKIVSNAS CTTNCLAPLA
archaeon GADKVLISAP PKGDEPVKQL VYGVNHDEYD GE.DVVSNAS CTTNSITPVA

fly KVINDNFEIV EGLMTTVHAT TATQKTVDGP SGKLWRDGRG AAQNIIPAST
human KVIHDNFGIV EGLMTTVHAI TATQKTVDGP SGKLWRDGRG ALQNIIPAST
plant KVVHEEFGIL EGLMTTVHAT TATQKTVDGP SMKDWRGGRG ASQNIIPSST
bacterium KVINDNFGII EGLMTTVHAT TATQKTVDGP SHKDWRGGRG ASQNIIPSST
yeast KVINDAFGIE EGLMTTVHSL TATQKTVDGP SHKDWRGGRT ASGNIIPSST
archaeon KVLDEEFGIN AGQLTTVHAY TGSQNLMDGP NGKP.RRRRA AAENIIPTST

fly GAAKAVGKVI PALNGKLTGM AFRVPTPNVS VVDLTVRLGK GASYDEIKAK
human GAAKAVGKVI PELNGKLTGM AFRVPTANVS VVDLTCRLEK PAKYDDIKKV
plant GAAKAVGKVL PELNGKLTGM AFRVPTSNVS VVDLTCRLEK GASYEDVKAA
bacterium GAAKAVGKVL PELNGKLTGM AFRVPTPNVS VVDLTVRLEK AATYEQIKAA
yeast GAAKAVGKVL PELQGKLTGM AFRVPTVDVS VVDLTVKLNK ETTYDEIKKV
archaeon GAAQAATEVL PELEGKLDGM AIRVPVPNGS ITEFVVDLDD DVTESDVNAA

Множественное выравнивание последовательностей глицеральдегид 3-фосфат дегидрогеназ: колонки остатков могут иметь высокую или низкую консервативностьКафедра биоинформатики МБФ РНИМУfly

Слайд 45Кафедра биоинформатики МБФ РНИМУ

Кафедра биоинформатики МБФ РНИМУ

Слайд 46Кафедра биоинформатики МБФ РНИМУ

Кафедра биоинформатики МБФ РНИМУ

Слайд 47PAM250 матрица вероятности мутаций Встречается 250 изменений на 100 а.к. остатков
Кафедра

биоинформатики МБФ РНИМУ

PAM250 матрица вероятности мутаций Встречается 250 изменений на 100 а.к. остатков Кафедра биоинформатики МБФ РНИМУ

Слайд 48Кафедра биоинформатики МБФ РНИМУ
PAM250 логарифмов вероятности замен

Кафедра биоинформатики МБФ РНИМУPAM250 логарифмов вероятности замен

Слайд 49Почему мы используем вместо матрицы вероятностей мутаций, матрицу логарифмической вероятности

мутаций?
Оценочная матрица должна быть удобной для попарного выравнивания (или поиска

BLAST) и оценки двух выровненных аминокислотных остатков.
Логарифмы легче использовать для системы оценки. Они позволяют нам суммировать баллы выравненных остатков вместо того, чтобы умножить их.

Кафедра биоинформатики МБФ РНИМУ

Почему мы используем вместо матрицы вероятностей мутаций, матрицу логарифмической вероятности мутаций?Оценочная матрица должна быть удобной для попарного

Слайд 50Переход от матрицы вероятности замен к логарифмической матрице
Оценка S для

выравнивания остатков a,b:

S(a,b) = 10 log10 (Mab/pb)
Mab - вероятность замены

а на b; pb - частота замены а.к. b

Например, триптофан:

S(trp,trp) = 10 log10 (0.55/0.010) = 17.4

Кафедра биоинформатики МБФ РНИМУ

Переход от матрицы вероятности замен к логарифмической матрицеОценка S для выравнивания остатков a,b:S(a,b) = 10 log10 (Mab/pb)Mab

Слайд 51Что означают числа логарифмической матрицы?
Счет 2 показывает, что замена аминокислоты

происходит в 1,6 раза чаще, чем ожидалось случайно.
Счет 0 является

нейтральным.
Счет -10 означает, что замена аминокислоты в выравнивании происходит в 10 раз медленней, чем ожидалось случайно.

Кафедра биоинформатики МБФ РНИМУ

Что означают числа логарифмической матрицы?Счет 2 показывает, что замена аминокислоты происходит в 1,6 раза чаще, чем ожидалось

Слайд 52Кафедра биоинформатики МБФ РНИМУ
Глобин крысы и мыши
Глобин крысы и бактерии
Более

консервативный
Менее консервативный

Кафедра биоинформатики МБФ РНИМУГлобин крысы и мышиГлобин крысы и бактерииБолее консервативныйМенее консервативный

Слайд 53Кафедра биоинформатики МБФ РНИМУ
Два практически идентичных белка
Два отдаленно родственных белка

Кафедра биоинформатики МБФ РНИМУДва практически идентичных белкаДва отдаленно  родственных белка

Слайд 54Матрица BLOSUM (Block substitution matrix)
Основана на локальном выравнивании
Основана на

рассмотрении только консервативных участков (блоков) не близкородственных последовательностей
BLOSUM62 - матрица

вычисленная из сравнения последовательностей с не менее чем 62% -ым расхождением

Кафедра биоинформатики МБФ РНИМУ

Матрица BLOSUM (Block substitution matrix) Основана на локальном выравниванииОснована на рассмотрении только консервативных участков (блоков) не близкородственных

Слайд 55BLOSUM
Кафедра биоинформатики МБФ РНИМУ
100
62
30
Процент идентичности а.к. остатков
BLOSUM62
100
62
30
BLOSUM30
100
62
30
BLOSUM80
объединение
объединение
объединение

BLOSUMКафедра биоинформатики МБФ РНИМУ1006230Процент идентичности а.к. остатковBLOSUM621006230BLOSUM301006230BLOSUM80объединениеобъединениеобъединение

Слайд 56BLOSUM62
Кафедра биоинформатики МБФ РНИМУ

BLOSUM62Кафедра биоинформатики МБФ РНИМУ

Слайд 57Две случайно расходящиеся последовательности белка изменяются обратно экспоненциально
Кафедра биоинформатики МБФ

РНИМУ
Percent identity
Эволюционное расстояние PAMs
“сумеречная зона”

Две случайно расходящиеся последовательности белка изменяются обратно экспоненциальноКафедра биоинформатики МБФ РНИМУPercent identityЭволюционное расстояние PAMs“сумеречная зона”

Слайд 58Алгоритмы выравнивания: Ниделмана-Вунша (Needleman-Wunsch) и Смита-Уотермана (Smith-Waterman)
Алгоритм глобального выравнивания Ниделмана-Вунша

(1970)
Алгоритм локального выравнивания Смита-Уотермана (1981)
BLAST (Basic Local Alignment Search Tool),

эвристическая версия Смита-Уотермана

Кафедра биоинформатики МБФ РНИМУ

Алгоритмы выравнивания: Ниделмана-Вунша (Needleman-Wunsch) и Смита-Уотермана (Smith-Waterman)Алгоритм глобального выравнивания Ниделмана-Вунша (1970)Алгоритм локального выравнивания Смита-Уотермана (1981)BLAST (Basic Local

Слайд 59Алгоритм глобального выравнивания Ниделмана-Вунша
Две последовательности сравниваются в матрице с

осями Х и Y (каждая из осей является соответствующей последовательностью)
Если

остатки в позиции одинаковые, то путь в этой ячейке рисуется в виде диагонали
Поиск оптимальных подпутей, и их добавление для достижения лучшего результата. Включает:
Добавление если нужно пробелов
Разрешение консервативных замен
Изменение системы оценки (скоринга)
Гарантирует нахождение оптимального выравнивания

Кафедра биоинформатики МБФ РНИМУ

Алгоритм глобального выравнивания Ниделмана-Вунша Две последовательности сравниваются в матрице с осями Х и Y (каждая из осей

Слайд 60Три шага в глобальном выравнивании алгоритмом Ниделмана-Вунша
Построить матрицу
Оценка матрицы
Выбрать оптимальное

выравнивание
Кафедра биоинформатики МБФ РНИМУ

Три шага в глобальном выравнивании алгоритмом Ниделмана-ВуншаПостроить матрицуОценка матрицыВыбрать оптимальное выравниваниеКафедра биоинформатики МБФ РНИМУ

Слайд 61Четыре возможных исхода при выравнивании двух последовательностей
Кафедра биоинформатики МБФ РНИМУ
[1]

идентичность (оставаться вдоль диагонали)
[2] несовпадение (оставаться вдоль диагонали)
[3] пробел в

одной последовательности (передвижение по вертикали!)
[4] пробел в другой последовательности (передвижение по горизонтали!)
Четыре возможных исхода при выравнивании двух последовательностейКафедра биоинформатики МБФ РНИМУ[1] идентичность  (оставаться вдоль диагонали)[2] несовпадение

Слайд 62Кафедра биоинформатики МБФ РНИМУ

Кафедра биоинформатики МБФ РНИМУ

Слайд 63Заполнение матрицы с использованием «динамического программирования»
Кафедра биоинформатики МБФ РНИМУ

Заполнение матрицы с использованием «динамического программирования»Кафедра биоинформатики МБФ РНИМУ

Слайд 64Кафедра биоинформатики МБФ РНИМУ
Заполнение матрицы с использованием «динамического программирования»
Алгоритм начинается

с построения матрицы идентичности

Кафедра биоинформатики МБФ РНИМУЗаполнение матрицы с использованием «динамического программирования»Алгоритм начинается с построения  матрицы идентичности

Слайд 65Кафедра биоинформатики МБФ РНИМУ
Заполнение матрицы с использованием «динамического программирования»

Кафедра биоинформатики МБФ РНИМУЗаполнение матрицы с использованием «динамического программирования»

Слайд 66Кафедра биоинформатики МБФ РНИМУ
Заполнение матрицы с использованием «динамического программирования»

Кафедра биоинформатики МБФ РНИМУЗаполнение матрицы с использованием «динамического программирования»

Слайд 67Кафедра биоинформатики МБФ РНИМУ
Заполнение матрицы с использованием «динамического программирования»

Кафедра биоинформатики МБФ РНИМУЗаполнение матрицы с использованием «динамического программирования»

Слайд 68Нахождение оптимального (лучшего) попарного выравнивания
Кафедра биоинформатики МБФ РНИМУ

Нахождение оптимального (лучшего) попарного выравниванияКафедра биоинформатики МБФ РНИМУ

Слайд 69Кафедра биоинформатики МБФ РНИМУ
Queries:
beta globin (NP_000509)
alpha globin (NP_000549)
http://www.ebi.ac.uk/emboss/align/

Кафедра биоинформатики МБФ РНИМУQueries:beta globin (NP_000509)alpha globin (NP_000549)http://www.ebi.ac.uk/emboss/align/

Слайд 70Кафедра биоинформатики МБФ РНИМУ

Кафедра биоинформатики МБФ РНИМУ

Слайд 71Глобальное vs. локальное выравнивания
Глобальное выравнивание (Ниделмана-Вунша) проходит от одного конца

каждой последовательности к другому концу.
Локальное выравнивание находит регионы с оптимальным

соответствием в двух последовательностях ("подпоследовательности").
Локальное выравнивание почти всегда используется для поиска в базах данных, таких как BLAST. Оно полезно для поиска доменов (или ограниченных областей гомологии) внутри последовательностей.
Смит и Уотерман (1981) решили проблему выполнения оптимального локального выравнивания последовательностей. Другие методы (BLAST, FASTA) быстрее, но менее тщательны.


Кафедра биоинформатики МБФ РНИМУ

Глобальное vs. локальное выравниванияГлобальное выравнивание (Ниделмана-Вунша) проходит от одного конца каждой последовательности к другому концу.Локальное выравнивание находит

Слайд 72Глобальное выравнивание (верх) включает совпадения, игнорируемые локальным выравниванием (низ)
Кафедра биоинформатики

МБФ РНИМУ
NP_824492, NP_337032
15% identity
30% identity

Глобальное выравнивание (верх) включает совпадения, игнорируемые локальным выравниванием (низ)Кафедра биоинформатики МБФ РНИМУNP_824492, NP_33703215% identity30% identity

Слайд 73Алгоритм локального выравнивания Смита-Уотермана
Создание матрицы между двумя белками (размер m

+ 1, n + 1)
Нет отрицательных значений в скоринговой матрице!

S> 0
Счет в каждой клетке максимальный из четырех значений:
[1] s(i-1, j-1) + новая оценка [i,j] (совпадение или несовпадение)
[2] s(i,j-1) – gap penalty
[3] s(i-1,j) – gap penalty
[4] 0

Кафедра биоинформатики МБФ РНИМУ

Алгоритм локального выравнивания Смита-УотерманаСоздание матрицы между двумя белками (размер m + 1, n + 1)Нет отрицательных значений

Слайд 74Алгоритм Смита-Уотермана позволяет выравнивать подпоследовательности
Кафедра биоинформатики МБФ РНИМУ

Алгоритм Смита-Уотермана позволяет выравнивать подпоследовательностиКафедра биоинформатики МБФ РНИМУ

Слайд 75Кафедра биоинформатики МБФ РНИМУ
Queries:
beta globin (NP_000509)
alpha globin (NP_000549)
http://fasta.bioch.virginia.edu/

Кафедра биоинформатики МБФ РНИМУQueries:beta globin (NP_000509)alpha globin (NP_000549)http://fasta.bioch.virginia.edu/

Слайд 76Dot matrix (Точечная матрица)
Кафедра биоинформатики МБФ РНИМУ

Dot matrix (Точечная матрица)Кафедра биоинформатики МБФ РНИМУ

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика