Скоблов Михаил Юрьевич
Молекулярная биология
Лекция 4. Функции нуклеиновых кислот. Часть 2.
Часть 2. Функции нуклеиновых кислот
Состав РНК в клетке Клетка млекопитающего содержит около 20-30 пикограмм РНК, что составляет около 1% массы клетки.
Тотальная РНК
мРНК Около 4%
Рибосомальная РНК
Около 80%
Транспортная РНК
Около 15%
• Транскрипт — молекула РНК, образующаяся в результате транскрипции участка ДНК.
• Транскрипто́м — совокупность всех транскриптов, синтезируемых одной клеткой или группой клеток, включая мРНК и некодирующие РНК.
• Транскриптомика изучает структуру и динамику транскриптома
Основные понятия
Транскрибирующаяся часть генома по разным оценкам транскрибируется от 50% до 80% геномной ДНК, из которой 2% транслируется в белки, а оставшиеся 98% являются не-кодирующими РНК (ncRNAs) причем большей частью консервативной
3 May 2002 Vol 296 Science
Геном «любит» экспрессироваться
• Промоторы расположены повсеместно, с большинства из них экспрeссируются некодирующие РНК, функции которых большей частью неизучены.
• Наблюдение: в опухолях экспрессируется много некодирующих РНК, а также опухоль-специфичных изоформ известных генов.
• Общая эпигенетическая «разболтанность» опухолевой клетки высока
Гены любят транскрибироваться
1. Уровень экспрессии (от нескольких копий на клетку до 10 тысяч)
2. Патер экспрессии, тканеспецифичность
3. Альтернативные варианты транскрипта.
Степени свободы экспрессии гена:
Малые: • miRNA • rasiRNA • piRNA • ….
Транскриптом
Белок-кодирующие РНК
Белок-некодирующие РНК
Большие: • antisense • long ncRNA • pseudogenes • ….
Разделение условно
Классическая структура мРНК эукариот
5’ UTR CDS 3’UTR polyA
CAP
Регуляция трансляции
Регуляция транскрипции
Экспериментатор получает нуклеотидную последовательность транскрипта….
UTR – untranslated region CDS – coding sequence
Два основных критерия трансляции:
1. Кодирующая рамка более 300 нуклеотидов
2. Консервативность аминокислотной последовательности
Определение кодирующего потенциала РНК происходит с помощью биоинформатического анализа.
Экспериментальная проверка – очень долгий путь….
~40% случаев изменений концентрации белка может быть объяснено за счет знания о количестве mRNA
Реализация кодирующего потенциала РНК
Цель проекта Протеом: инвентаризация всех белков человека и выяснение взаимодействий между ними. Российская часть проекта – определение протеома 18-й хромосомы человека.
Из 300 белок кодирующих генов с помощью масспектрометрических подходов идентифицировано 80% белков.
Реализация кодирующего потенциала РНК
Транскриптом
«ПолиА+» РНК «ПолиА-» РНК
Малые: • miRNA • rasiRNA • piRNA • ….
Транскриптом
Белок-кодирующие РНК
Белок-некодирующие РНК
Большие: • antisense • long ncRNA • pseudogenes • ….
Andrew Z. Fire & Craig C. Mello
The Nobel Prize in Physiology or Medicine 2006
"for their discovery of RNA interference - gene silencing by double-stranded RNA"
Nature 382, 713 - 716 (22 August 1996);
Repression of gene expression in the embryonic germ lineage of C. elegans Geraldine Seydoux*†, Craig C. Mello‡§, Jonathan Pettitt§ , William B. Wood , James R. Priess‡ & Andrew Fire* THE distinction between soma and germline was recognized more than a century ago: somatic cells form the body of an organism, whereas germ cells serve to produce future generations1. In Caenorhabditis elegans, the separation of soma and germline occurs through a series of asymmetrical divisions, in which embryonic germline blastomeres divide unequally to produce one somatic daughter and one germline daughter2. Here we show that after each asymmetrical division, embryonically transcribed RNAs are detected in somatic, but not germline, blastomeres. This asymmetry depends on the activity of the germline-specific factor, PIE-1. In the absence of PIE-1, embryonically transcribed RNAs are detected in both somatic and germline blastomeres. Furthermore, ectopic expression of PIE-1 in somatic blastomeres can significantly reduce the accumulation of new transcripts in these cells. Taken together, these results suggest that germ-cell fate depends on an inhibitory mechanism that blocks new gene expression in the early embryonic germ lineage.
RNA-интерференция – это подавление
экспрессии генов у эукариот (замалчивание
генов) на посттранскрипционном уровне,
индуцированное короткими
интерферирующими RNA (siRNA)
Механизм RNA-интерференции
RNA-интерференцию обнаружили у большинства эукариотических организмов
в частности у
простейших
кишечнополостных
насекомых
грибов
растений
млекопитающих
• разрезание матричной RNA (mRNA)
• репрессия трансляции
• ремоделирование хроматина
Регуляция экспрессии генов на
транскрипционном и
посттранскрипционном уровнях
происходит с помощью малых RNA
Молекулярные механизмы RNA-интерференции
siRNA
- двуцепочечные
- 21-25 п. н.
- 5’-фосфатный, 3’-гидроксильный
концы
- 2 неспаренных нуклеотида на 3’-
конце
miRNA экспрессируются в виде: отдельных генов - 60% в составе кластеров - 15% в интронах - 25%
Транскрипция miRNA
Биологическая роль RNA-интерференции
Репрессия чужеродных последовательностей
- ДНК- и RNA-содержащих вирусов
- мобильных элементов
Подобие иммунной системы на уровне
последовательностей нуклеиновых кислот
RNA-интерференция
“Эндогенные”
последовательности Транспозоны Вирусы Трансгены
dsRNA
miRNA/siRNA
Репрессия
трансляции Разрезание
mRNA
Метилирование
(ДНК/гистоны)
Замалчивание
транспозонов
Ремоделирование
хроматина
Экзосомы
Экзосомы и миРНК
Норма – клеточное общение, взаимодействие…. Патология – инвазия опухолеспецифичного набора миРНК
• Одна miRNA может изменять экспрессию нескольких сотен mRNA (mRNA
degradation)
• Одна miRNA может блокировать трансляцию нескольких сотен mRNA
(translation suppression)
• Одна miRNA может регулировать белковый синтез нескольких тысяч
генов (напрямую + опосредованно)
Andrew Z. Fire Craig C. Mello
2006 Нобелевская премия по
Физиологии и Медицине за
“их открытие РНК
интерференции – генного
замалчивания с помощью
двухцепочечной РНК”
На сегодняшний день по данным базы данных miRBase у человека описано 721 miRNA (Release 14.0).
Новый класс ceRNA
Новый класс ceRNA
Новый класс ceRNA
Новый класс ceRNA
Природные антисмысловые транскрипты
Парой смысловой-антисмысловой транскрипты называется пара чьи последовательности мРНК комплементарны.
Цис-антисмысловой транскрипт экспрессируется в одном геномном локусе со смысловым транскриптом.
Транс-антисмысловой транскрипт экспрессируется с другого геномного
локуса чем смысловой транскрипт.
смысловой – sense
антисмысловой - antisense
условное деление
Более 70% цис-ПАТ имеют сходящийся тип (перекрывание 3’ концов), в то время как только 15% имеют расходящийся тип. Оставшиеся 15% принадлежат ПАТ с полным перекрыванием или с отсутствием такового (интронные). Ориентация ПАТ конец к концу является в 5 раз более эволюционно консерватиной.
Сходящиеся (конец к концу)
Расходящиеся (голова к голове)
Неперекрывающиеся природные антисмысловые транскрипты
Перекрывающиеся природные антисмысловые транскрипты
Виды Перекрывающиеся
транскрипты
Всего
транскриптов Доля (%)
Human 5,880 26,741 22 Mouse 12,519 43,553 29
Rat 548 11,332 5
Chicken 356 7,390 5
Drosophila 2,054 13,379 15
Rice 1,374 20,477 7
Arabidopsis 2,680 29,993 9
Nematode 76 14,406 0.5
Yeast 610 7,598 8
Встречаемость цис-ПАТ в нескольких эукариотических организмах
цис-ПАТ
транс-ПАТ
Транс-антисмысловая регуляция
Встречаемость транс-ПАТ в нескольких
эукариотических организмах
Антисмысловая регуляция
вовлечена в различные клеточные процессы
Транскрипция
Процессинг РНК и транспорт
Стабильность РНК и трансляция
Геномный импринтинг и инактивация Х хромосомы
Модификации ДНК и хроматина
Метилирование генома
Альтернативные: инициация транскрипции, сплайсинг,
полиаденилирование, терминация.
РНК редактирование
РНК интерференция
Заболевания человека связанные с ПАТами
Сенс-Антисенс пары Заболевание Ссылка
BACE1 & BACE1-AS Alzheimer’s Disease (Faghihi, Modarresi et al. 2008)
FMR1, FMR4 & ASFMR1 Fragile X mental retardation, Fragile X-associated
tremor and ataxia syndrome (FXTAS)
(Ladd, Smith et al. 2007; Khalil,
Faghihi et al. 2008)
PINK1 & naPINK1 Parkinson disease, Mitochondrial disorders (Scheele, Petrovic et al. 2007)
C6orf37 & C6orf37OS Diffuse panbronchiolitis (Matsuzaka, Tounai et al. 2002)
FGF-2 & GFG
Endometriosis, Carcinogenic progression
(Mihalich, Reina et al. 2003; Baguma-
Nibasheka, Li et al. 2007; Zhang,
Barclay et al. 2007)
HIF-1α & aHIF Poor prognosis marker in breast and renal cancer (Thrash-Bingham and Tartof 1999)
Survivin & EPR-1 Colon cancer (Yamamoto, Manome et al. 2002)
WT1 and WT1-AS Wilms’ tumor
(Malik, Salpekar et al. 2000; Dallosso,
Hancock et al. 2007)
α-globulin & LUC7L α- Thalassemia (Tufarelli, Stanley et al. 2003)
KvLQT1 Beckwith-Wiedemann syndrome (Smilinich, Day et al. 1999)
SNURF-SNRPN &
UBE3A Prader-Willi and Angelman syndrom
(Rougeulle, Cardoso et al. 1998)
Bcl-2 & IgH Follicular B-cell lymphoma (Capaccioli, Quattrone et al. 1996)
Zeb2 & Zeb2 NAT Epithelial- mesenchymal transition
Colon cancer, Hirschsprung’s disease
(Nelles, Van de Putte et al. 2003;
Beltran, Puig et al. 2008)
RMRP Cartilage-hair hypoplasia (Hermanns, Bertuch et al. 2005)
Консервативность цис-ПАТов
Более 40% транс-ПАТ и 22% цис-ПАТ являются хорошо консервативными
между человеком и мышью и имеют идентичные спектры экспрессии.
Большинство из них образованы перекрыванием 3’-концов.
Примато-специфичные ПАТы:
BDNF-AS, FMR4, Anti-NOS2A, BMC…
Человеко-специфичные ПАТы:
HAR1, CBR3, AFAP1.
• Экспрессионный чип на 5’652 потенциальных ПАТов мыши: • 11.9% ПАТов экспрессировались только в образце РНК из
почки • 10.1% ПАТов экспрессировались только в образце РНК из
мозга • около 50% ПАТов была обнаружена одновременно в обоих
тканях
• Для цис-ПАТов человека и мыши показано, что уровень экспрессии понижается с увеличением длинны перекрывания.
• 33% консервативных ПАТ демонстрируют идентичные паттерны экспрессии у человека и мыши
Экспрессия цис-ПАТов
? сравнение
Антисмысловые транскрипты:
кодирующие или некодирующие?
Тип транскриптов Виды Всего Код./код. Код./некод. Некод./некод.
Природные
антисмысловые
транскрипты
Мышь 1948 пар 48,5% 42,5% 9%
Человек 1486 пар 80% 18% 2%
Консервативные
ПАТ Мышь/Человек 291 пары 70,5% 26,5% 3%
Результат работы проекта FANTOM3
Механизмы регуляции экспрессии генов с помощью ПАТов
Транскрипционная
интерференция
РНК
маскирование
Двух-цепочечное
РНК-зависимое
замалчивание
Моделирование
хроматина Нег
ати
вная
рег
уляц
ия
1. Beltran M, Puig I, Peña C, García JM, Alvarez AB, Peña R, Bonilla F, de Herreros AG. A natural antisense transcript regulates Zeb2/Sip1 gene expression during Snail1-induced epithelial-mesenchymal transition. Genes Dev. 2008 Mar 15;22(6):756-69.
Антисмысловой транскрипт к гену Zeb2 маскирует сайт сплайсинга и приводит к удержанию интрона в пре-мРНК смыслового гена, что изменяет характер инициации трансляции и сопровождается значительной ее активацией.
2. Mahmoudi S, Henriksson S, Corcoran M, Méndez-Vidal C, Wiman KG, Farnebo M. Wrap53, a natural p53 antisense transcript required for p53 induction upon DNA damage. Mol Cell. 2009 Feb 27;33(4):462-71.
Стабилизация или активация экспрессии смыслового транскрипта p53 с помощью антисмысловой РНК Wrap53. Показано что in vivo формирование дуплекса между смысловым и антисмысловым транскриптами в области 5′-нетранслируемой области мРНК TP53, что вызывает как транскрипционную, так и трансляционную активацию экспрессии смыслового гена p53. Нокдаун Wrap53 ведет к значительному снижению уровня смысловой мРНК и супрессии активации белка p53 при повреждении ДНК. Нарушение формирования дуплекса между транскриптами с помощью антисмысловых олигонуклеотидов приводит к практически тем же последствиям. И наоборот, при гиперэкспрессии Wrap53 повышается уровень мРНК смыслового гена, и клетки становятся более чувствительны к p53-опосредованному апоптозу.
Позитивная регуляция антисмысловыми транскриптами
Изучение принципов регуляции антисмысловых транскриптов
Антисмысловая регуляция
Негативная
AS↑ ═> S↓
Позитивная
AS↑ ═> S ↑
Отсутствие
Вопросы:
1. Чем определяется выбор регуляции?
2. Какова эффективность регуляции?
[Shendure J. and Church G.M., 2002]
ПАТы ассоциированые с раком
CIDEB cell-death inducing
DFFA-like effector B
Уровень антисмысловой РНК коррелирует со степенью злокачественности опухоли
Уровни антисмысловых интронных не-кодирующих РНК коррелируют со
степенью дифференциации рака простаты
Reis et al., 2004
ПАТы ассоциированые с раком
1. Среди 24’968 белок-кодирующих mRNA человека, все имели как минимум одно перекрывние с транс-антисмысловым транскриптом.
2. Плотность коротких перекрываний в 5'-UTR 3'-UTR районах выше чем в кодирующей части.
3. Уровень экспрессии имеет негативную корреляцию с количеством перекрываний для данной мРНК.
4. Количество перекрываний ждя тканеспецифичных генов значительно выше чем для генов домашнего хозяйства
5. Пониженная плотность SNP в перекрываниях.
Антисмысловая регуляция короткими перекрываниями от 15 до 25 нуклеотидов
Wrap53
long noncoding RNAs - lincRNA
9277 в ручную аннотированных генов продуцируемых 14,880 транскриптов
Один из основных критериев GENCODE: LincRNA – межгенные некодирующие РНК с длиной более 200 н.п.
long noncoding RNAs - lincRNA
Характеристики lincRNA
Распределение размеров транскриптов Гистограмма количества альтернативных изоформ
Экспрессия lincRNA
• Piwi-interacting RNA (piRNA) – самый большой класс малых РНК, экспрессируемых в клетках животных. И у позвоночных, и у беспозвоночных.
• piРНК — короткие молекулы длиной в 24–30 нуклеотидов, закодированные в центромерных и теломерных областях хромосомы. Последовательности многих из них комплементарны известным мобильным генетическим элементам, однако есть множество других piРНК, совпадающих с участками рабочих генов или с фрагментами генома, функции которых неизвестны.
• Образуют комплексы с белками Piwi.
• Одноцепочечные и в основном комплеменарны транспозонам. Обычно U на 5’ конце, 5’ монофосфат и 3’ O-метильная группа. Значительное число идентифицированных piРНК имеет А в 10й позиции.
piРНК
• По предварительным оценкам, у млекопитающих сотни тысяч видов. У мыши уже известно более 50000 уникальных последовательностей piРНК, у Drosophila более 13000
• Кодируются в кластерах на протяжении всего генома
• У млекопитающих встречаются только в мужских половых клетках, около 1млн. копий на клетку. У беспозвоночных и в женских, и в мужских половых клетках.
Визуализация piРНК– содержащих комплексов на хромосомах Drosophila
piРНК
Один из предполагаемых механизмов биогенеза –”Ping Pong” (не у всех объектов объектов):
• Первичные piРНК узнают комплементарные им мишени (транскрипты с транспозонов и других повторов) и их комплекс привлекает белки Piwi.
• Piwi расщепляет мишень в позиции 10 н. от 5’ конца первичной piРНК, образуется вторичная piРНК, которая включается в Piwi.
piРНК
• Одноцепочечные короткие РНК - 24- 29 нук. • Выявлены у Drosophila и некоторых одноклеточных эукариот. У млекопитающих до
сих пор не обнаружены. • Предполагается участие в формировании клеток зародышевого пути. • Предполагаемый предшественник – дцРНК, образующаяся в результате
транскрипции с обеих цепей повторенных элементов генома. Биогенез не требует участия Dicer, но требуется белок Ago3 (Argonaute, Piwi и Piwi- подобный белок Aub (от Aubergine –мутация у Drosophila), у растений нет Piwi белков, но есть rasiРНК, образующиеся с участием Dcl-белков.
• Мутации белков Piwi, ассоциированных с rasiРНК у Drosophila, приводят к стерильности и отсутствию формирования клеток зародышевого пути у особей обоего пола.
• Возможно, являются разновидностью piРНК
rasiРНК Repeat associated small interfering RNA
Виды Количество
генов
Количество
процессированных
псевдогенов
%
Arabidopsis 33583 4260 13
Caenorhabditis elegans 21187 2445 12
Drosophila melanogaster 22372 2208 10
Danio rerio 34291 16357 48
Gallus gallus 22720 5539 24
Canis lupus familiaris 24953 12852 52
Rattus norvegicus 42743 13962 33
Mus musculus 58433 19119 33
Pan troglodytes 32989 16785 51
Homo sapiens 42000 17609 42
Процессированные псевдогены
• Образованы 10% кодирующих генов • Около 80% примато-специфичные • Значительная фракция псевдогенов (до 20%) транскрипционно активна…
функциональность
?
miR-17 miR-21 miR-214 miR-19 miR-26
• В нормальных образцах и рака простаты найдена прямая корреляция экспрессии между PTEN и PTENP1 • Локус PTENP1 селективно теряется при раке •3’ UTR PTENP1 проявляет активность опухолевого супрессора
“PTEN is a functionally haploinsufficient tumour suppressor gene”.
Псевдогены и miRNA
Консервативность подтвержденных сайтов связывания miRNA в генах связанных с раком
Псевдогены и miRNA
Функция вторичной структуры РНК
Транспортная тРНК
Структурная Рибосомальная РНК
Ферментативная Рибозимы
Регуляторная Разные РНК
Потенциал вторичной структуры РНК
Более чем для 3000 транскриптов определены элементы вторичной структуры, что составляет около 50% всех генов Saccharomyces cerevisiae.