inżynieria białek i wykład 1 (2014/20155) wyklady... · najczęściej wykorzystywane systemy...
TRANSCRIPT
Inżynieria białek I Wykład 1 (2014/20155)
Magdalena Tworzydło Zakład Biochemii Fizycznej, WBBiB UJ
► Twórca kursu prof. dr hab. Zygmunt Wasylewski (1942–2006)
► Cel przeprowadzić studentów biotechnologii/biologii przez całą „trasę”, od zaprojektowania genu, poprzez produkcję białka rekombinowanego w wybranym systemie ekspresyjnym, jego oczyszczanie, aż do badań strukturalnych
► Koordynator kursu dr Magdalena Tworzydło
► 13 wykładów dr Magdalena Tworzydło (10) i dr Andrzej Górecki (3)
► 12 ćwiczeń dr Ewelina Fic, dr Sylwia Łukasiewicz dr Magdalena Tworzydło
Kurs Inżynieria białek I
Strona: www.zbf.wbbib.uj.edu.pl
Tworzenie konstruktów do produkcji białek rekombinowanych: • PCR, termostabilne polimerazy • modyfikacje genów: mutageneza punktowa, delecje, insercje, wprowadzanie miejsc cięcia dla enzymów restrykcyjnych, tworzenie genów fuzyjnych • enzymy restrykcyjne, klonowanie, wektory plazmidowe
Oczyszczanie i renaturacja białek rekombinowanych: • izolacja białek z komórek gospodarza • etykietki wykorzystywane w procesie oczyszczania • czynniki denaturujące i renaturujące wykorzystywane przy refałdowaniu białek Synteza i sekwencjonowanie DNA:
• synteza DNA metodą triestrów fosforynu • sekwencjonowanie DNA metodą Sangera
Tematy wykładów
Najczęściej wykorzystywane systemy ekspresyjne: bakteryjne, drożdżowe, owadzie, ssacze, bezkomórkowe (cell-free systems)
Produkcja białek rekombinowanych: • regulacja ekspresji genów • wektory i szczepy ekspresyjne • warunki hodowli
Definicje
Ukierunkowana mutageneza (ang. site-directed/site-specific mutagenesis) Technika, umożliwiająca wprowadzenie mutacji w ściśle określonym miejscu łańcucha DNA. Aby można ją było zastosować, konieczna jest znajomość wyjściowej sekwencji nukleotydów w genie. Obecnie, ukierunkowaną mutagenezę przeprowadza się standardowo w oparciu o łańcuchową reakcję polimerazy (PCR) i odpowiednio zmodyfikowane oligonukleotydy (startery).
Białka rekombinowane (ang. recombinant proteins, r-proteins) Białka, które powstały w żywych organizmach (lub liniach komórkowych) w wyniku ekspresji rekombinowanego DNA. Rekombinowany DNA jest efektem złożenia za pomocą wybranych technik laboratoryjnych fragmentów materiału genetycznego pochodzących z różnych źródeł/organizmów. Utworzone w ten sposób sekwencje DNA nie występują naturalnie w przyrodzie. Jednak dzięki obecności odpowiednich elementów regulatorowych mogą być powielane oraz mogą ulegać ekspresji po wprowadzeniu do komórek gospodarza.
PCR Powielany fragment DNA
Cykl 2
3’ 5’ 3
’
5’
5’
3’ 3
’ 5’ 3’
5’ 3
’ 5’ 5
’ 3’
5’
3’
matrycowy DNA produkt reakcji z cyklu 1 produkt reakcji z cyklu 2 produkt reakcji z cyklu 3
Cykl 3
5’ 3’
3’ 5’
5’ 3’
3’ 5’
5’ 3
’ 5’
3’
5’ 3
’
3’ 5’
3’ 5’
5’ 3
’
5’ 3’
5’
3’
3’
5’
3’ 5’
5’ 3’
5’
3’
5’ 5’ 3’
3’ 5’
3’ 5’ 3’ 5’
5’ 3’ 3’ 5’
Cykl 1 powielany odcinek DNA
Denaturacja (95°C)
przyłączenie starterów (45-65°C) i wydłużanie nici DNA
(72°C)
PCR, w praktyce wygląda to tak… Powielany fragment DNA
5’ 3’
3’ 5’
3’ 5’ 3’ 5’
5’ 3’ 3’ 5’
Sekwencja startera 2 (reverse, right) pokrywa się z sekwencją nici antysensownej (matrycowej)
sekwencja startera 1 (forward, left) pokrywa się z sekwencją nici sensownej (kodującej)
Mutageneza ukierunkowana, Overlap extension PCR
OE PCR, metoda wydłużania nakładających się odcinków
3’ 5’5’ 3’
5’3’3’5’
3’5’5’3’
PCR 1
A
C
5’3’3’5’
3’5’5’3’
PCR 2 B
D
3’5’
5’3’3’5’5’3’
PCR 3
A
B
Mutageneza ukierunkowana, Overlap extension PCR
OE PCR, metoda wydłużania nakładających się odcinków
3’ 5’5’ 3’
5’3’3’5’
3’5’5’3’
PCR 1
A
C
5’3’3’5’
3’5’5’3’
PCR 2 B
D
3’5’
5’3’3’5’5’3’
PCR 3
A
B
reakcja 1 reakcja 2
starter A starter D
starter C starter B
produkt reakcji 1 produkt reakcji 2 zmieszanie
denaturacja rehybrydyzacja
dNTP, polimeraza, startery B i A
nie ulega wydłużeniu
ulega wydłużeniu
produkt reakcji 3
5’ 3’
3’ 5’
3’ 5’
5’ 3’
3’ 5’
5’ 3’
5’ 3’
3’ 5’
3’ 5’ 3’ 5’
3’ 5’ 5’ 3’
5’ 3’
3’ 5’
5’ 3’
3’ 5’
3’
3’
3’
3’
Mutageneza ukierunkowana, Megaprimer PCR
3’5’
5’3’
3’5’3’5’
5’3’
3’ 5’
3’5’5’3’
3’5’
5’3’
5’ 3’3’ 5’
PCR1
Megaprimer = produkt PCR1
PCR2
Produkt PCR2
Wprowadzanie modyfikacji na końcach genów
3’5’
5’3’
5’3’3’5’
3’5’
5’3’
5’3’3’5’
Wykorzystanie zmodyfikowanych starterów do wprowadzania mutacji na 5’ i 3’ końcu genu
Wprowadzenie/usuwanie sekwencji Shine-Dalgarno/Kozak, kodonu STOP, kodonu START, miejsc cięcia dla enzymów restrykcyjnych
3’5’
5’3’
5’3’
3’5’
Na początku lub na końcu genu
W środku genu
3’5’
3’5’
5’3’
5’3’
5’3’
3’5’
3’5’3’5’
5’3’
5’3’
A
C
D
B PCR 1 – startery A i C PCR 2 – startery D i B
PCR 3 – startery A i B
Modyfikacje DNA, wprowadzanie delecji przy pomocy PCR
Mutageneza ukierunkowana c.d., metoda Quik Change ®
Większość szczepów E. coli prowadzi metylację dam+. Endonukleaza DpnI rozpoznaje i trawi jedynie metylowaną sekwencję 5´-Gm6ATC-3´.
1. Wektor z genem wyizolowany z bakterii dam+, docelowe miejsce wprowadzenia mutacji
2. Startery wprowadzające mutację są do siebie komplementarne
3. Powielanie dwóch nici wektora, wprowadzenie mutacji
4. Trawienie bakteryjnego DNA, usunięcie nici nie zawierających mutacji
Stratagene
Quik Change ® – warunki reakcji
W wysokiej temperaturze DNA może ulegać depurynacji. Proporcjonalnie, dłuższe matryce będą bardziej uszkodzone niż krótkie. Przy powielaniu długich fragmentów DNA istotne jest skrócenie czasu denaturacji oraz obniżenie temperatury wydłużania.
1A – denat. 94°C/60 sek. 2A – denat. 94°C/30min/bez DNA matrycowego/test. aktywności polimerazy 3A – denat. 94°C/10 sek./z DNA matrycowym
A B
Etap Cykl Temperatura Czas
1 1 95°C 30 sek. 2 12–18 95°C
55°C 68°C
30 sek. 1 min 1 min/1kz DNA
Etap Cykl Temperatura Czas
1 1 95°C 3 min 2 25–30 95°C
55°C 72°C
30 sek. 1 min 1 min/1kz DNA
QC PCR
Normalny PCR
Klonowanie klasyczne
wektor
wektor pocięty enzymami restrykcyjnymi BamHI i EcoRI
wektor po wklonowaniu wstawki – rekombinowanego DNA
fragment DNA zawierający interesujący nas gen
fragment DNA (wstawka) po trawieniu enzymami restrykcyjnymi BamHI i EcoRI
ligacja (ligaza DNA)
Metoda OE PCR cloning – klonowanie przy pomocy PCR
Wektor, do którego
chcemy wprowadzić
gen
Gen, który chcemy wprowadzić do wektora
Projektujemy startery, częściowo komplementarne do genu a częściowo komplementarne do wektora
W wyniku reakcji PCR otrzymujemy gen, na którego końcach
znajdują się sekwencje
komplementarne do wektora
Tak zmodyfikowany gen wykorzystywany jest w kolejnej reakcji PCR, gdzie służy za starter
Po zakończeniu reakcji zmetylowany wektor,
który służył jako matryca zostaje pocięty
za pomocą enzymu DpnI
Namnożony,niezmetylowany wektor z wklonowanym
genem zostaje wprowadzony
do komórek gospodarza,
gdzie gen może ulec ekspresji
Enzymy restrykcyjne a metylacja DNA
Enzymy restrykcyjne (endonukleazy) wystę-pują naturalnie u sinic i bakterii. Razem z komplementarnymi metylazami tworzą system restrykcji-modyfikacji, dzięki któremu mikroorganizmy bronią się przed wnikaniem obcego DNA, np. bakteriofagów.
Specyficzna metylacja własnego DNA służy ochronie przed restryktazami syntetyzowanymi przez organizm – obcy DNA, niemetylowany według określonego wzoru, ulega degradacji.
Enzymy restrykcyjne – klasyfikacja uproszczona
WŁAŚCIWOŚĆ TYP I TYP II TYP III
RESTRYKCJA i MODYFIKACJA
Jedno białko posiada obie aktywności
Metylaza i endonukleaza występują osobno
Osobne enzymy wymieniające się wspólną podjednostką
STRUKTURA NUKLEAZY
Heterotrimer Homodimer Heterodimer
KOFAKTORY ATP, Mg2+, SAM (S-adenozylometionina)
Mg2+
Mg2+, SAM
SEKWENCJA/E ROZPOZNAWANE PRZEZ NUKLEAZĘ
Dwie sekwencje w dowolnej orientacji
Pojedyncza sekwencja palindromowa (4–8 nukl.)
Dwie sekwencje obok siebie, w przeciwnej orientacji
MIEJSCE CIĘCIA DNA Przypadkowe, około 1000 zasad od miejsca rozpoznawanego przez nukleazę
W obrębie (lub blisko miejsca) rozpoznawanego przez nukleazę
24-26 nukleotydów od miejsca rozpoznawanego przez nukleazę, po stronie 3’
MIEJCE METYLACJI DNA
W obrębie sekwencji rozpoznawanej przez nukleazę
W obrębie sekwencji rozpoznawanej przez nukleazę
W obrębie sekwencji rozpoznawanej przez nukleazę
Ze względu na swoją charakterystykę w biotechnologii wykorzystywane są jedynie enzymy typu II.
Enzymy restrykcyjne
EcoRI
EcoRV
PstI
Izoschizomery – enzymy pochodzące z różnych organizmów, rozpoznające te same sekwencje i tnące je w ten sam sposób, np. MspI i HpaII 5'...C^C G G...3' 3'...G G C^C...5'
Neoizoschizomery – enzymy pochodzące z różnych organizmów, rozpoznające te same sekwencje, ale tnące je w różny sposób, np. SmaI 5'...C C C^G G G...3‘ i XmaI 5'...C^C C G G G...3‘ 3'...G G G^C C C...5‘ 3'...G G G C C^C...5‘
Metylacja Dam i Dcm u E. coli
Metylaza Dam rozpoznaje sekwencję 5’-GATC-3’ i metyluje adeninę w pozycji N6.
Metylaza Dcm rozpoznaje sekwencje 5’-CCAGG-3’ i 5’-CCTGG-3’ i metyluje drugą cytozynę w pozycji C5.
Przykładem szczepu nie przeprowadzającego opisanych powyżej metylacji jest E. coli GM2163 (dam–, dcm–).
Niektóre enzymy restrykcyjne rozpoznają wyłącznie sekwencje metylowane (np. DpnI), inne – oba rodzaje sekwencji (np. BamHI), jeszcze inne – wyłącznie sekwencje niemetylowane (np. XbaI, MboI itd.). W tym ostatnim przypadku, pojawienie się metylacji Dam i Dcm w obrębie miejsc restrykcyjnych rozpoznawanych przez taki enzym, zaburzy jego działanie.
Metylazy przenoszą grupę metylową z S-adenozylo-metioniny (SAM) na określony nukleotyd w rozpoznawanej przez siebie sekwencji.
Termostabilne polimerazy DNA
Polimeraza Pochodzenie Aktyw. 5’ – 3’
egzonukl.
Aktyw. 3’ – 5’
egzonukl.
Częstość błędów [1x10-6]a
Wydłu- żanie
3’-końca Termo-
stabilność Proce-
sywnośćb
Taq 1976 Thermus aquaticus tak nie 22 tak 9’ w 97,5°C 50
Pwo Pyrococcus
woesei nie tak 3,2 nie >2h w 100°C 20–30
Pfu 1991 Pyrococcus
furiosus nie tak 2,6 nie 4h w 95°C
DeepVent Pyrococcus
szczep GB-D nie tak 5 nie 8h w 100°C
Phusion nie tak 0,44 nie
a częstość błędów: ilość błędów/pz/cykl b ilość nukleotydów przyłączonych zanim polimeraza odłączy się od matrycy
PCR – ogólne zasady projektowanie starterów
Długość starterów – od 18 do 30 zasad, krótsze startery mogą się niespecyficznie wiązać z matrycą
3’ koniec startera – nie powinien zawierać więcej niż 3 zasady G i/lub C, gdyż mogą one stabilizować niespecyficzne oddziaływania starter–matryca
5’ koniec startera – jest mniej krytyczny dla specyficznego przyłączania startera do matrycy dlatego może być modyfikowany
Zawartość GC – zasady GC powinny stanowić od 40 do 60 % sekwencji
Hybrydyzacja – 3’ koniec starterów nie powinien tworzyć struktury spinki do włosów, startery używane w reakcji nie powinny tworzyć homo- i/lub heterodupleksów
Temperatura topnienia – startery używane w reakcji powinny mieć zbliżoną temperaturę topnienia (różnica 2–5°C), optymalnie – nieco powyżej 60°C
hybrydyzacja starterów na końcu 3’
Optymalizacja warunków PCR
Stężenie starterów: końcowe stężenie każdego ze starterów powinno się zawierać w przedziale między 0,1 a 0,5 µM (6×1012 – 3×1013 cząsteczek). Wyższe – zwiększa prawdopodobieństwo powstania niespecyficznych produktów
Stężenie matrycy DNA: ilość używanego matrycowego DNA zależy od jego pochodzenia. Zwykle stosuje się 100–250 ng genomowego i 20–50 ng plazmidowego DNA na 50 µl reakcji
Stężenie nukleotydów: końcowe stężenie poszczególnych nukleotydów powinno wynosić ok. 0,2 mM (ilość, która pozwala uzyskać ok. 6–6,5 µg DNA)
Ilość cykli – od 25 do 35, w zależności od pochodzenia DNA i ilości matrycy
Czas wydłużania starterów – zwykle przyjmuje się regułę 60 sek/1000 zasad
Bufor – standardowy bufor zawiera 50 mM KCl i 10 mM Tris-HCl, pH 8,3. Podniesienie stężenia KCl do 70–100 mM może zwiększyć wydajność syntezy fragmentów o długości <500 pz. Niektóre bufory obok jednowartościowych jonów K+
zawierają jony NH4+ (obecność jonów NH4
+ minimalizuje potrzebę optymalizacji stężenia jonów Mg2+ oraz temperatury przyłączania starterów.
Critical Factors, for Successful PCR, Users Manual, Qiagen
temp °C
produkt PCR
niespecyficzne produkty PCR
Temperatura przyłączania starterów (annealing temperature) – im wyższa, tym bardziej specyficzny produkt reakcji
Optymalizacja warunków PCR
Stężenie jonów magnezu – im wyższe, tym większa wydajność reakcji ale także ilość produktów niespecyficznych
Obliczanie temperatury topnienia starterów
Dla starterów liczących nie więcej niż 20 nukleotydów temperaturę topnienia (melting temperature) można wyliczyć wg empirycznej zasady Wallace’a: Tm = 2°C × (A + T) + 4°C × (G + C)
Dla dłuższych oligonukleotydów (do 70 zasad), gdy stężenie kationów jest ≤ 0,4 M można zastosować równanie: Tm = 81°C + 16,6 (log10 [K+]) + 0,41(%[G + C])
Temperatura hybrydyzacji (annealing temperature) jest na ogół o 5–10°C niższa od Tm, należy ją ustalić empirycznie.
Abso
rban
cja pr
zy 26
0 nm
Tm=69 °C
Dwuniciowy DNA
Częściowo rozwinięty DNA
Jednoniciowy DNA
Temperatura [°C]
Czynniki wpływające negatywnie na PCR
Wysoka zawartość zasad GC jest odpowiedzialna za powstawanie struktur drugorzędowych w obrębie DNA, co prowadzić może do zahamowania aktywności polimerazy. Glicerol, DMSO (2–10%), chlorek tetrametyloamonu (0,01–10 mM), formamid (5–20%) poprawiają wydajność tego typu reakcji PCR.
Zanieczyszczenia związkami używanymi przy oczyszczaniu matrycowego DNA Do związków hamujących aktywność polimerazy należą: SDS (>0,005% w/v), fenol (>0,2% v/v), etanol (> 1% v/v), izopropanol (>1% v/v), octan sodu (>5 mM), EDTA (> 0,5 mM).
Czystość starterów zależy od sposobu ich oczyszczenia po syntezie. Standardowo startery oczyszcza się stosując sączenie molekularne. Startery o długości powyżej 70 zasad powinny być oczyszczane za pomocą HPLC.
Kilka dat z historii
• 1953 W „Nature” ukazuje się praca Jamesa Watsona i Francisa Cricka
opisująca dwuniciową, helikalną strukturę DNA • 1956 Arthur Kornberg odkrywa i izoluje polimerazę DNA • 1959 Francois Jacob i Jacques Monod odkrywają w obrębie chromosomu
bakteryjnego istnienie sekwencji regulujących ekspresję genów: nazywają je represorem i operonem
• 1961 Marshall Nirenberg i Heinrich Matthaei łamią kod genetyczny • 1961
Naukowcy stwierdzają, że geny oporności na antybiotyki są u bakterii często przenoszone w małych wielokopijnych „chromosomach”. Nazwa plazmid zostaje zaproponowana już w roku 1952 przez J. Joshuę Laderberga na określenie wszystkich pozachromosomalnych elementów dziedziczności.
Kilka dat z historii c.d.
Otrzymywanie białek rekombinowanych stało się możliwe dzięki przełomowym osiągnięciom w dziedzinie inżynierii genetycznej do jakich doszło w ostatnich 25 latach XX wieku.
• 1970 opisanie i izolacja „pierwszego” enzymu restrykcyjnego (dokładniej,
pierwszego enzymu typu II) – HindII (Hamilton Smith) • 1974 w „Proceedings of the National Academy of Sciences” ukazuje się
praca Stanleya Cohena (Stanford University) i Herberta Boyera (UCSF), w której uczeni pokazują ekspresję obcego DNA wprowadzonego do bakterii Escherichia coli za pomocą technik rekombinacji DNA (fragmenty kodujące RNA 18S i 28S z Xenopus laevis)
• 1976 Herbert Boyer i Robert Swanson zakładają Genentech Inc., firmę
biotechnologiczną, której celem jest tworzenie i sprzedaż produktów opartych o technologię rekombinacji DNA
• 1980 Sąd Najwyższy USA postanowia, że organizmy zmodyfikowane genetycznie mogą podlegać prawu patentowemu • 1982 Amerykańska Agencja ds. Żywności i Leków (Food and Drug Administration) dopuszcza do obrotu ludzką insulinę produkowaną w bakteriach • 1983 Kary Mullis pracujący w Cetus Corporaration wpada na pomysł powielania DNA in vitro (PCR). Trzy lata później udoskonala reakcję wprowadzając termostabilną polimerazę. Cetus opatentowuje reakcję i w 1991 roku sprzedaje ją firmie Hoffman–LaRoche za 300 mln dolarów
• 1978 Geny kodujące 2 łańcuchy insuliny zostały po raz pierwszy sklonowane i wprowadzone do komórek Escherichia coli przez zespół Arthura Riggsa i Keichiego Itakury z Genentech Inc.
Kilka dat z historii c.d.
Wykorzystanie białek rekombinowanych
• w przemyśle farmaceutycznym • w przemyśle spożywczym • w procesach technologicznych • w biotechnologii • w badaniach naukowych
Wykorzystanie białek rekombinowanych
Parametry poddawane zmianom
CEL WYMAGANA ILOŚĆ BIAŁKA badanie funkcji białka mg wytworzenie przeciwciał mg badanie struktury białka mg diagnostyka i terapia mg-kg przemysł kg-t
FIZYKOCHEMICZNE termostabilność rozpuszczalność kinetyka fałdowania zdolność wiązania ligandów specyficzność wiązania ligandów własności fluorescencyjne
BIOLOGICZNE I FARMAKOLOGICZNE okres półtrwania w surowicy aktywność immunogenność toksyczność podatność na działanie proteaz specyficzność oddziaływania
z chorymi tkankami
Inżynieria białek I Wykład 2 (2014/2015)
Magdalena Tworzydło Zakład Biochemii Fizycznej, WBBiB UJ
E. coli: idealny system ... czasami
Pomimo ciągłych prac nad rozwojem nowych systemów ekspresyjnych E. coli pozostaje nadal najczęściej używanym organizmem.
Wykorzystywana jest z powodzeniem do produkcji enzymów stosowanych w diagnostyce, analityce i w celach przemysłowych, a także do produkcji leków, o ile tylko nie posiadają one budowy podjednostkowej i nie wymagają pełnej obróbki potranslacyjnej.
Dla potrzeb laboratoriów i przemysłu stworzonych zostało szereg szczepów oraz kilkaset wektorów umożliwiających ścisłą kontrolę regulacji ekspresji białek, oraz ułatwiających prawidłowe fałdowanie i oczyszczanie syntetyzowanych protein.
Theodor Escherich (1857–1911)
lekarz-pediatra odkrywca E. coli
(1885 r.)
Nadal jednak optymalizacja procesu ekspresji genów a następnie otrzymywania poszczególnych białek rekombinowanych bywa czasochłonna i kosztowna nie zależy bowiem jedynie od właściwości samego systemu, ale przede wszystkim od indywidualnych właściwości białka.
Zalety i wady bakteryjnego systemu ekspresyjn
System ekspresyjny
Klasyfikacja
Tworzenie wiązań S-S
Glikozylacja
Wydzielanie
Koszt hodowli
Antybiotyki
Koszty bezpieczeństwa
Produkty na rynku 1 zależny od promotora 2 brak końcowej α1,3 mannozy 3 brak dokładnej charakterystyki, 4 końcowa fukoza (6-dezoksygalaktoza)
Na podstawie Production of recombinant proteins, Gerd Gellisen 2005 Wiley-Vch Verlag GmbH & Co. Weinheim
Escherichia coli
bakteria gram-ujemna
tak (w peryplazmie)
nie
do peryplazmy
niski/średni1
raczej tak
niskie
tak
― stworzone na potrzeby klonowania i/lub ekspresji genów ― posiadają m. in:
• polilinker, MCS (multi cloning site) • ori (origin) miejsce startu replikacji • marker selekcyjny: np. gen oporności na antybiotyk • promotor
Wektory plazmidowe
― naturalnie występujące u bakterii pozachromosomalne, koliste, dwuniciowe cząsteczki DNA, 1–200 kpz.
― ich replikacja przebiega niezależnie od chromosomalnego DNA ― posiadają mechanizmy umożliwiające zachowanie stałej liczby cząsteczek
w komórce gospodarza oraz odpowiednią segregację do komórek potomnych
― replikacja i transkrypcja genów plazmidowych przebiega zwykle w oparciu o enzymy gospodarza
― w plazmidach naturalnych zawarta jest informacja decydująca o: oporności/produkcji antybiotyków, syntezie bakteriocyn, enterotoksyn, wytwarzaniu enzymów restrykcyjnych, rozkładzie złożonych związków organicznych, oporności na jony metali ciężkich, zdolności do koniugacji, itp.
Plazmidy
Wektory plazmidowe
Replikon – liczący kilkaset par zasad obszar DNA, w skład którego wchodzi ori oraz elementy regulujące start replikacji. W wektorach plazmidowych najczęściej spotykane są replikony z plazmidów pMB1 lub ColE1. Niezmodyfikowane, utrzymują ilość kopii plazmidu na poziomie 20 szt./kom.
Plazmidy nisko- i wysokopijne
-500 -300 -100 100 300 500 ori
białko ROP, homodimer, 68 aa, negatywny regulator replikacji DNA (stabilizuje oddziaływanie RNA I z RNA II
RNA I, negatywny regulator replikacji DNA, (blokuje oddziaływanie RNA II z DNA)
RNA II, pozytywny regulator replikacji DNA, (oddziałuje z DNA i inicjuje replikację) pre RNA II jest trawiony przez
RNA-zę H do postaci RNA II
rop RNA I
pre RNA II
kierunek replikacji DNA
RNA II
Plazmidy posiadające taki sam replikon są niekompatybilne – nie mogą wspólnie występować w jednej komórce bakteryjnej pod nieobecność czynników selekcyjnych. Współzawodnictwo o te same elementy zwiększające ilość kopii danego plazmidu, prowadzi z czasem do eliminacji jednego z nich. Replikony należące do tej samej grupy kompatybilności co pMB1/ColE1, to p15A, R6K oraz F.
PLAZMID/ WEKTOR REPLIKON ILOŚĆ KOPII
CZYNNIK NEGATYWNEJ KONTROLI ILOŚCI KOPII PLAZMIDU/WEKTORA
pBR322 pMB1 30 – 40 RNA I, białko Rop
pUC zmodyfikowany pMB1 500 – 700 RNA I
pACYC p15A 15 – 20 powtórzone sekwencje DNA (iterony), białko RepA
pSC101 pSC101 ~5 powtórzone sekwencje DNA (iterony), białko Rep A
colE1 colE1 20 – 30 RNA I
Plazmidy nisko- i wysokokopijne
pBR322 – wektor plazmidowy 1-szej generacji (Bolivar at al., Gene 1977)
pierwsze wektory posiadające MCS (Vieira i Messing, Gene 1982) – seria pUC
Przykładowe nazewnictwo wektorów p – plazmid BR – inicjały konstruktorów (Bolivar, Rodriguez) 322 – numer plazmidu w kolekcji UC – msce powstania (University of California)
Pierwsze wektory
Test α-komplementacji (blue-white screening)
aktywny tetramer β-galaktozydazy
aminokwasy 42–1173
gen lacZΔM15 (chromosom)
białko ω – nieaktywny dimer
X-gal (5-bromo-4-chloro-3-indol-beta-D-galaktozyd)
galaktoza
5-bromo-4-chloro-indoksyl
DIMERYZACJA OKSYDACJA
Barwny precypitat
+ =
aminokwasy 1–62
peptyd α
(wektor)
Promotory – inicjacja transkrypcji
Promotory E. coli rozpoznawane są przed podjednostkę sigma polimerazy RNA. Istnieje 7 typów podjednostek σ, a co za tym idzie 7 typów promotorów. Najczęściej spotykane promotory oddziałują z czynnikiem σ70. Inicjacja procesu transkrypcji przebiega w 4 etapach: i) rozpoznanie sekwencji promotorowej przez holoenzym RNA (α2, β, β’, ω, σ70) ii) przejście kompleksu zamkniętego w otwarty, rozpoczęcie syntezy mRNA (tworzenie transkryptów poronnych) iii) uwolnienie podjednostki σ, izomeryzacja do kompleksu elongacyjnego iv) uwolnienie promotora. Każdy z etapów wpływa na szybkość całego procesu co oznacza, że promotory o podobnej sile mogą mieć różne sekwencje, w zależności od tego, który z czterech etapów jest w nich zoptymalizowany. W silnych promotorach obszary -35 i -10 są najbardziej zbliżone do sekwencji konsensusowych.
Silny promotor = częsta inicjacja transkrypcji
16–19 pz
-35 -10 +1 TATAAT TTGACA
-42 +20
Promotory
Najczęściej spotykanym mechanizmem regulacji ekspresji genów jest wiązanie się białek regulatorowych w obrębie operonu:
• w systemach regulowanych pozytywnie albo sekwencja -35 (-10) odbiega znacznie od sekwencji konsensusowej, albo odległość pomiędzy obszarami -10 i -35 nie jest optymalna, w związku z czym białko aktywatorowe ułatwia polimerazie RNA rozpoznanie promotora i zwią-zanie się z nim, • w systemach regulowanych negatywnie białko represorowe wiąże się poniżej lub bezpośrednio w obrębie promotora uniemożliwiając polimerazie RNA wiązanie do DNA lub wydłużanie mRNA.
Oba rodzaje promotorów mogą być kontrolowane na dwa sposoby: • przez indukcję – efektor łączy się z represorem i hamuje jego wiązanie do operatora, aktywator łączy się z miejscem docelowym tylko w obecności efektora, • przez represję – nieaktywny represor ulega aktywacji dopiero w obecności cząsteczki efektorowej, aktywator jest inaktywowany pod wpływem przyłączenia liganda.
16–19 pz
-35 -10 +1 TATAAT TTGACA
-42 +20
Promotor lac z operonu laktozowego
Przykład regulacji negatywnej sterowanej przez indukcję
Pod nieobecność laktozy represor (homotetramer) jest związany z operatorem i uniemożliwia transkrypcję genów z, y, a. Po związaniu induktora (allolaktoza, IPTG – izopropylotiogalaktozyd) represor traci powi-nowactwo do miejsca operatorowego.
Przykład regulacji pozytywnej Białko CRP (homodimer) związane z cAMP przyłącza się do DNA powyżej promotora i ułatwia polimerazie RNA oddziaływanie z kwasem nukleinowym.
Represja kataboliczna Komórki E. coli rosnące w obecności glukozy charakteryzują się niskim stężeniem enzymów katabolicznych, m. in. β-galaktozydazy.
W przypadku operonu lac 1) Glukoza blokuje napływ laktozy przez kanały permeazy do wnętrza komórki i uniemożliwia galaktozydazie przekształcenie laktozy w allolaktozę. 2) glukoza hamuje powstawanie cAMP potrze-bnego do aktywacji CRP.
TTTACA -----17pz-----TATGTT
msce wiązania represora
i z y a represor galaktozydaza permeaza acetylaza
msce wiązania CRP
i promotor lac promotor
Przeciekanie promotora lac
W popularnych, niezmodyfikowanych szczepach E. coli dochodzi do minimalnej ekspresji genu lacI kodującego represor: ilość białka w komórce nie przekracza 10 cząsteczek. Po transformacji wysokokopijnym wektorem z promotorem laktozowym, większość miejsc operatorowych nie zostaje obsadzona, w związku z czym ma miejsce konstytutywna ekspresja rekombinowanego genu.
Jednym ze sposobów rozwiązania tego problemu jest wprowadzenie do bakterii genu lacIq ze zmienionym promotorem. Pojedyncza mutacja w obrębie promotora lacI pozwala 10-krotnie zwiększyć ilość cząsteczek represora w komórce.
~10 cząsteczek represora
20 – 500 kopii plazmidu
msce wiązania CRP
msce wiązania represora
lac promotor
System pET – polimeraza RNA i promotor ø10 faga T7
Indukcja IPTGIndukcja IPTG
Polimeraza RNA E. coli
Polimeraza RNA faga T7
represor lac
represor lac
gen Ilac gen Ilac
DNA chromosomalne
pET
T7 RNA po limeraza Gen T7
promotor lac operator lac operator lac
promotor T7
NIEKTYWNA
gen lyzozymu T7
lyzozym T7
DE3
pLysSElub
KOMÓRKAGOSPODARZA
Polimeraza RNA faga T7, monomer o masie 99 kDa. Odporna na działanie rifampicyny (w przypadku bakterii antybiotyk oddziałuje z podjednostką β polimerazy i hamuje syntezę 1-szego wiązania fosfodiestrowego w mRNA), rozpoznaje jedynie swoje własne promotory, jest wysoce procesywna − 230 nt/s (polimeraza RNA z E. coli – 50 nt/s).
TAATACGACTCACTATAGGGAGA -12 -8 +1 +3
System pET jest chroniony patentami nr: 4,952,496; 5,693,489 i 5,869,320.
Operon arabinozowy – przykład regulacji pozytywnej
CTGACG -----18pz-----TACTGT
Białko araC jest negatywnym regulatorem swojej własnej transkrypcji, łącząc się z operatorem araO1 blokuje promotor pC. Promotor pBAD podlega represji katabolicznej. Pod nieobecność L-arabinozy produkt genu araC – cząsteczki białka araC – łączą się z miejscami operatorowymi araO2 i araI1, w wyniku czego powstaje pętla DNA, która uniemożliwia polimerazie RNA transkrypcję genów BAD spod promotora pBAD.
W obecności arabinozy cząsteczki białka araC zmieniają konformację, jedna z nich opuszcza operator araO2 i łączy się z miejscem operatorowym araI2. Do pełnej aktywacji promotora pBAD konieczna jest obecność białka CRP związanego z cAMP. CRP oraz 2 cząsteczki białka ara C (z arabinozą) w pozycjach araI1 i araI2 ułatwiają polimerazie rozpoznanie promotora pBAD i związanie się z nim.
promotor pBAD
araD araO2 araC araO1 araI1araI2 araB araA araC
miejsce miejsce wiązania CAP
Promotor trp z operonu tryptofanowego
Przykład negatywnej regulacji sterowanej przez represję
W obecności tryptofanu represor (dimer) jest związany z operatorem i uniemożliwia transkrypcję sekwencji liderowej L oraz genów E, D, C, B i A. Brak aminokwasu uruchamia ekspresję enzymów potrzeb-nych do jego syntezy.
Zalety Silny, indukowalny promotor.
i wady … Podobnie jak promotor laktozowy ma tendencje do przeciekania. Niewielka ilość pożywek nadających się do hodowli. Konieczność usunięcia tryptofanu w momencie wzmożonej syntezy białka.
Promotory hybrydowe
Promotory tac i trc zawierają sekwencje –35 z promotora trp i –10 z promotora lacUV5 oddzielone fragmentami liczącymi odpowiednio 16 i 17 pz.
Promotory te nie wymagają do pełnej aktywacji białka CRP. Promotor tac jest 5 razy silniejszy od plac
msce wiązania represora
TTGACA -----17pz-----TTAACT
trp promotor
L E D C B A trp represor
Promotory faga λ
N P cI P cro QL R
białka główki ogonka regulacja replikacja DNA liza
Faza lityczna przebiega w trzech etapach: wczesnym, opóźnionym i późnym. Sekwencyjnie dochodzi do ekspresji enzymów niezbędnych do replikacji i rekombinacji DNA, syntezy białek główki oraz ogonka wirusa, a na końcu – białek koniecznych do wywołania lizy komórki.
W fazie lizogenicznej wyróżnia się etap integracji, trwania i uwalniania. Na etapie profaga ekspresji ulega jedynie gen cI kodujący represor l, który po przyłączeniu do promotorów L i R zabiega ekspresji białek wczesnej fazy, a tym samym ekspresji wszystkich białek faga.
Promotory faga λ
N P cI P cro QL R
białka główki ogonka regulacja replikacja DNA liza
W systemach ekspresyjnych wykorzystywana jest najczęściej zmutowana, termolabilna wersja represora I, blokująca promotory pL i pR tylko w obniżonej temperaturze (28–30° C). Wykorzystując wektory z promotorem pL (jest silniejszy od pR) należy dodatkowo używać bakterii posiadających gen cIts857 dla zmutowanej wersji represora. Problemy związane ze stosowaniem termicznie indukowanych promotorów mogą wynikać z faktu, że podwyższona temperatura aktywuje także geny szoku cieplnego, z których część koduje proteazy. Dodatkowo, niektóre z syntetyzowane białek rekombinowanych mogą ulegać termicznej denaturacji i wytrącać się w postaci agregatów. Aby wyeliminować problem powstawania białek szoku cieplnego można wykorzystać szczep bakterii ze zmodyfikowanym genem rpoH – kodującym podjednostkę σ32 polimerazy RNA. Innym sposobem indukcji promotora λpL jest użycie szczepu bakterii, w którym gen cI jest umieszczony pod kontrolą promotora trp. Po dodaniu do pożywki tryptofanu, dochodzi do zahamowania transkrypcji genu cI i, w konsekwencji, do aktywacji indukcji λpL.
Terminacja transkrypcji, stabilność mRNA
Sygnał terminacji transkrypcji, palindro-mowy rejon RNA bogaty w pary G–C, tworzy strukturę spinki do włosów i poprzedza sekwencję oligo-U. Działa niezależnie od obecności białka Rho. Destabilizuje oddziaływanie pomiędzy DNA a matrycowym mRNA.
G CA UC GG CC GC GC G U U U U 3’5’
Pętla na końcu 3’ mRNA najprawdopodobniej chroni je przed działaniem 3’–5’ egzonukleaz. Stabilność mRNA zależy także od wydajności procesu translacji, jaki zachodzi przy jego udziale. Rybosomy chronią mRNA przed degradacyjnym działaniem RNA-zy E (endonuklaza).
Ekspresja genów białek heterogenicznych w komórkach E. coli zależy nie tylko od siły promotora, lecz także od wydajności procesów transkrypcji i translacji.
Stabilność mRNA
Okres półtrwania mRNA komórkach E. coli wynosi od kilku sekund do 20 minut.
Degradacja mRNA jest inicjowana między innymi przez endonukleazę – RNazę E. RNaza E jest homodimerem zaangażowanym w proces dojrzewania rybosomowego RNA.
Aktywność katalityczna enzymu związana jest z jego domeną N-końcową. Domena C-końcowa stanowi „rusztowanie” dla degradosomu złożonego z RNazy II, enolazy, helikazy RhlB i fosforylazy polinukleotydowej (PnPase).
Degradosom łączy się z jednoniciowym ufosforylowanym końcem 5’ mRNA.
Jednym ze sposobów ochrony 5’-końca jest dołączenie do niego sekwencji genu ompA tworzącego strukturę spinki.
Inicjacja translacji
• sekwencja Shine-Dalgarno (SD box, rbs – ribosome binding site), sekwencja komplementarna do 3’ końca rybosomowego RNA 16S, 4–9 nukleotydów
• kodony START: AUG (fMet) – wykorzystywany w 83% genów (pozostałe: GUG (Val) – 14%
oraz UUG (Leu) – 3%) • powstawanie struktur drugorzędowych w obrębie sekwencji SD, kodonu
START i ok. 20 nukleotydów poniżej kodonu START wpływa negatywnie na inicjację translacji
Restryktazy użyteczne przy klonowaniu: NdeI (CA*TATG), SphI (GCATG*C), NcoI (C*CATGG)
promotor +1 rbs (konsensus) 11(8) pz START AGGAGGT ATG
„Dialekty” w kodzie genetycznym
Kod genetyczny jest zdegenerowany – kilka różnych kodonów koduje jeden aminokwas. Pomiędzy organizmami istnieją różnice w częstości występowaniu kodonów dla poszczególnych aminokwasów. Częstość wykorzystania danego kodonu znajduje odzwierciedlenie w ilości odpowiadającego mu tRNA. Konsekwencją istnienia „dialektów” może być:
obniżona stabilność mRNA przedwczesna terminacja translacji przesunięcia w ramce odczytu, wystąpienie delecji,
wprowadzenie błędnych aminokwasów (np. Lys w miejsce Arg)
zahamowanie syntezy białka
Rzadkie kodony u E. coli to: AGG/AGA (Arg), AUA (Ile), CUA (Leu) i CCC (Pro).
Rzadkie kodony
Osiem najrzadziej używanych kodonów u E. coli, drożdży, Drosophila melanogaster i naczelnych
E. coli Drożdże Drosophila Naczelne Aminokwas
AGG AGG ARGININA
AGA AGA ARGININA
AUA AUA IZOLEUCYNA
CUA LEUCYNA
CGA CGA CGA CGA ARGININA
CGG CGG CGG CGG ARGININA
CCC PROLINA
UCG UCG SERYNA
CGC CGC ARGININA
CCG CCG PROLINA
CUC LEUCYNA
GCG GCG ALANINA
ACG ACG TREONINA
UUA LEUCYNA
GGG GLICYNA
AGU SERYNA
UGU CYSTEINA
CGU ARGININA
Dwójki kodonów (codon pairs)
Również częstość występowania określonych par kodonów odbiega od wartości przewidywanych dla rozkładu losowego. Pojawienie się nadreprezentowanej pary kodonów w sekwencji mRNA działa jak przecinek w zdaniu – obniża szybkość syntezy łańcucha polipeptydowego. Najprawdopodobniej jest to mechanizm ułatwiający właściwe fałdowanie białek. Sygnały opóźnienia translacji są różne dla poszczególnych organizmów.
Terminacja translacji
Sygnałem zakończenia translacji jest pojawienie się jednego z 3 kodonów: UAA (ochre, 63%), UAG (opal, 29%) UGA (amber, 8%) Wydajność terminacji translacji zależy także od nukleotydu występującego bezpośrednio za kodonem STOP i jest najwyższa w przypadku sekwencji UAAU a najniższa dla sekwencji UAGC.
Rola mutacji cichych (silent mutations)
Inżynieria translacyjna
Inżynieria translacyjna wykorzystuje programy komputerowe w celu optymalizacji sekwencji nukleotydowej genu heterologicznego białka i dopasowaniu jej do „dialektu” używanego przez gospodarza.
Synteza genów de novo
Cennik od 0,23 $ do 0,35 $ – za zasadę 299 $ – wklonowanie do wektora komercyjnego
Czas realizacji Od 0 do 1000 pz – od 5 dni roboczych Od 1001 do 2000 pz – od 7 dni roboczych
http://www.genscript.com/
gen (1300 pz) + wklonowanie do wektora = 2000 PLN