Быстрые пути эволюции белков. Эволюционный домен . БД ...
DESCRIPTION
Быстрые пути эволюции белков. Эволюционный домен . БД PFAM. План. Белок – продукт гена Пути эволюции белков Мутации ДНК и их следствия для последовательностей белков Наблюдаемые явления в последовательностях белков локальные мутации повторы эволюционные домены - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/1.jpg)
Быстрые пути эволюции белков. Эволюционный домен.
БД PFAM.
![Page 2: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/2.jpg)
План • Белок – продукт гена• Пути эволюции белков
– Мутации ДНК и их следствия для последовательностей белков– Наблюдаемые явления в последовательностях белков
• локальные мутации• повторы• эволюционные домены• мотивы и циклические перестановки
– ДНК-метилтрансферазы– [эндонуклеазы рестрикции]– RdRP
• БД Pfam• Другие ресурсы
![Page 3: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/3.jpg)
«Продукт» гена
ГЕН
mRNA (зрелая)
Белок -предшественник
Зрелые rRNA, tRNA и др. RNA
Белок 2
Белок 3
РНК-предшественник
процессинг (модификация РНК)
ГЕН
пре-мРНК (предшественник)
Сплайсинг (у эукариот)
транскрипция
Зрелый белок 1(mature protein)
Альтернативный
сплайсинг mRNA (зрелая)
Посттрансляционная модификация
Белок -предшественник
mRNA (зрелая)
ГЕН
пре-мРНК (предшественник)
Белок -предшественник
Трансляция
Что определяет последовательность белка:• сигнал начала трансляции• сигналы сплайсинга (эукариоты)• стоп-кодон• (редкие сигналы: запланированный сдвиг рамки, ….)• кодирующая последовательность
![Page 4: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/4.jpg)
Мутации ДНК и их следствия для последовательности белка
• Мутации соматические и мутации наследуемые
• Пресс отбора• Аллельные варианты (эукариоты)
![Page 5: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/5.jpg)
Мутации ДНК и их следствия для последовательности белка
• Локальные мутации в сигналах– потеря стоп-кодона:
• удлинение на С-конце за счет “случайной” последовательности • слияние белков (прокариоты)
– потеря сайта инициации трансляции:• удлинение на N-конце за счет “случайной” последовательности • потеря части N-концевой последовательности
– потеря донорного сайта сплайсинга (эукариоты) :• вставки “случайной” последовательности за счет включения интрона • замена C-концевой последовательности на случайную (при сдвиге рамки из-за
вставки интрона в экзон)
– потеря акцепторного сайта сплайсинга (эукариоты) :• делеция части последовательности из-за потери экзона • делеция части последовательности с заменой последующей C-концевой
последовательности на случайную (при сдвиге рамки из-за потери экзона)
Примечание. Варианты усложняются при альтернативном сплайсинге
![Page 6: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/6.jpg)
Мутации ДНК и их следствия для последовательности белка
• Локальные мутации в кодирующей последовательности– замена нуклеотида:
• последовательность белка без изменений• замена аминокислотного остатка
– мутация типа indel без сдвига рамки: • делеция/вставка аминокислотных остатков
– мутация типа indel со сдвигом рамки: • замена C-концевого участка на “случайную” последовательность• слияние белков (прокариоты)
– образование стоп-кодона: • потеря C-концевой последовательности
– двойная мутация типа indel с восстановлением рамки: • замена участка на “случайную” последовательность
– образование нового сайта сплайсинга, донорного или акцепторного (эукариоты):
• вставки “случайной” последовательности или делеции участков (много вариантов)
![Page 7: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/7.jpg)
Нелокальные мутации ДНК, которые могут изменять последовательности
белков• Дупликация фрагмента ДНК
– образование паралога– образование повтора в белке
• Нерепликативная транспозиция – образование нового белка из частей старых– перестановка частей одного белка
• Инверсия фрагмента ДНК
![Page 8: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/8.jpg)
Гомология нуклеотидных и аминокислотных последовательностей
• При перечисленных видах мутаций ДНК, кроме вставок нескольких нуклеотидов, прослеживается потомком какого нуклеотида генома предка является данный нуклеотид.
• При многих видах мутаций (но не всех!) то же верно и для аминокислотных остатков
• Поэтому можно говорить о гомологичности последовательностей и их “букв”
• Как правило, о гомологичности приходится судить по сходству последовательностей
![Page 9: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/9.jpg)
Частоты мутаций
• Точечные: 10-11 --- 10-6 на сайт на поколение• Рекомбинация: ???
• при сравнении геномов бруцелл пара процентов замен ДНК ( 10000 замен на 1 млн. п.н.) и, очень грубо, несколько 1000 рекомбинаций (1000? на 1млн п.н.)
![Page 10: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/10.jpg)
Примеры сравнений геномов
![Page 11: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/11.jpg)
У далеких видов – E.coli и H.influenza – остаются общие гены и, иногда, порядок следования
нескольких генов, но не более того!
![Page 12: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/12.jpg)
et al.
Сравнение двух штаммов
![Page 13: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/13.jpg)
Вывод:
• Наследуемые рекомбинации бактериальных геномов происходят достаточно часто; хотя по числу их и меньше, чем замен.
Что же происходит с белками?
![Page 14: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/14.jpg)
Наблюдаемые события в эволюции белков
• Замены, вставки, делеции остатков• Эволюционные домены:
– протяженные сходные последовательности в разных белках, окруженные негомологичными участками
– часто (но не всегда) участвующие в “премешивании доменов”
– часто (но не всегда) последовательность изолированного домена имеет стабильную пространственную структуру
– часто (но не всегда) домену можно приписать функцию
![Page 15: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/15.jpg)
Белки, содержащие два эволюционных домена: гомеодомени OAR домен (N-концевые участки не показаны)
![Page 16: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/16.jpg)
Гомеодомены активно перемешивались в эволюции.
• Об этом можно судить по 65(!) различным доменным архитектурам гомеобелков, представленным в банке Pfam
Гомеодомен
Парный домен и гомеодомен
Lim домены и гомеодомен
Гомеодомен, продолженный Лейциновой молниейPOU домен и гомеодомен
Два гомеодомена
PBX-домен и гомеодомен
![Page 17: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/17.jpg)
Домены, найденные в последовательностях, часто, но далеко не всегда совпадают со структурными
доменами.
![Page 18: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/18.jpg)
Накопленные данные показывают
что существуют “структурные единицы” наследуемой рекомбинации – эволюционные домены; они переставляются/вставляются/удаляются, как правило, целиком
Бывают исключения: пример - ДНК метилтрансферазы
![Page 19: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/19.jpg)
Вывод:
• Домены – структурные единицы эволюции, структуры и функции белка
![Page 20: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/20.jpg)
Ортологи — последовательности, возникшие из одного общего предшественника в процессе видообразования. Ортологи, как правило, имеют одну и ту же функцию
Паралоги — последовательности, возникшие из одного общего предшественника в результате дупликации одного гена в одном организме. Паралоги, как правило, имеют разные функции.
![Page 21: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/21.jpg)
Словарик
Типы мотивов Типы подписей
Сайт(site) -
Мотив (motif) –
Повтор (repeat)–
Домен (domain) –
Семейство –
Суперсемейство -
Паттерн (pattern) –
Профиль–PSSM –
Профиль–HМM -
…..
CCHC- цинксвязывающий мотив
Подпись типа паттерн –
CX2CX4HX4C
Простой пример:
![Page 22: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/22.jpg)
Ничто удачное не должно пропасть даром
• Точечные мутации медленный путь эволюции• Быстрый путь дупликация• Дуплицируются короткие фрагменты, домены, гены, кластеры
генов, хромосомы, геномы• Вторая копия может приобрести новые функции
Почему это интересно?
![Page 23: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/23.jpg)
• 25 белков
• 9 белков
• 2 белка
• 12 белков
223 белка
243 белка
507 белков ЕС 2.5.1.15
ЕС 4.1.2.25
ЕС 2.7.6.3
Пример доменных перестроек: не только дупликации!
![Page 24: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/24.jpg)
Пример 4
![Page 25: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/25.jpg)
Pfam• http://pfam.sanger.ac.uk
• Большая коллекция семейств доменов Для каждого семейства есть множественное выравнивание и профиль-HMM .
• Состоит из 2-х частей:
PfamA – курируемая часть, покрывает 76% UniProt
PfamB – большое число маленьких семейств из автоматически сгенерированной базы доменов, не вошедших в PfamA (раньше – ProDom, теперь – ADDA) .
• Удобна для анализа доменной структуры белков.
![Page 26: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/26.jpg)
Язык Pfam :
Семейство – коллекция гомологичных белков.
Домен – структурная единица, которую можно найти во множественном выравнивании.
Повтор – короткая единица, нестабильная сама по себе, но образует стабильные структуры, если есть много копий.
Мотив – короткая единица структуры вне глобулярных доменов.
Клан – группа родственных записей.
![Page 27: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/27.jpg)
PfamProsite PrintsBlocks
Smart
(ProDom, PIRaln, ProClass, Systers, Picasso etc. not shown)
Сравните
![Page 28: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/28.jpg)
Создание интегрированной базы данных
InterPro
PROSITE
PFAM
PRINTSInterPro
entries
IPR000001-
IPR011000
Интегрирование
родственных подписей
«вручную»
ProDom
SMARTTIGRFAMs
PIRSF
SUPERFAMILY
InterPro- an integrated resource of protein families, domains and functional sites.
![Page 29: Быстрые пути эволюции белков. Эволюционный домен . БД PFAM](https://reader035.vdocuments.site/reader035/viewer/2022081420/568151c1550346895dbff68d/html5/thumbnails/29.jpg)
Collagen alpha-1(III) chain (HUMAN)
… GPP GPA GFP GAP GQN GEP GGK GER GAP GEK GEG GPP GVA GPP GGS GPA GPP GPQ GVK GER GSP GGP GAA GFP …
Гипотеза: коллагены возникли врезультате тандемных дупликацийдевятки пар нуклеотидов (?)