inżynieria białek i wykład 1 (2014/20155) wyklady... · najczęściej wykorzystywane systemy...

Inżynieria białek I Wykład 1 (2014/20155)

Magdalena Tworzydło Zakład Biochemii Fizycznej, WBBiB UJ

► Twórca kursu prof. dr hab. Zygmunt Wasylewski (1942–2006)

► Cel przeprowadzić studentów biotechnologii/biologii przez całą „trasę”, od zaprojektowania genu, poprzez produkcję białka rekombinowanego w wybranym systemie ekspresyjnym, jego oczyszczanie, aż do badań strukturalnych

► Koordynator kursu dr Magdalena Tworzydło

► 13 wykładów dr Magdalena Tworzydło (10) i dr Andrzej Górecki (3)

► 12 ćwiczeń dr Ewelina Fic, dr Sylwia Łukasiewicz dr Magdalena Tworzydło

Kurs Inżynieria białek I

Strona: www.zbf.wbbib.uj.edu.pl

Tworzenie konstruktów do produkcji białek rekombinowanych: • PCR, termostabilne polimerazy • modyfikacje genów: mutageneza punktowa, delecje, insercje, wprowadzanie miejsc cięcia dla enzymów restrykcyjnych, tworzenie genów fuzyjnych • enzymy restrykcyjne, klonowanie, wektory plazmidowe

Oczyszczanie i renaturacja białek rekombinowanych: • izolacja białek z komórek gospodarza • etykietki wykorzystywane w procesie oczyszczania • czynniki denaturujące i renaturujące wykorzystywane przy refałdowaniu białek Synteza i sekwencjonowanie DNA:

• synteza DNA metodą triestrów fosforynu • sekwencjonowanie DNA metodą Sangera

Tematy wykładów

Najczęściej wykorzystywane systemy ekspresyjne: bakteryjne, drożdżowe, owadzie, ssacze, bezkomórkowe (cell-free systems)

Produkcja białek rekombinowanych: • regulacja ekspresji genów • wektory i szczepy ekspresyjne • warunki hodowli

Definicje

Ukierunkowana mutageneza (ang. site-directed/site-specific mutagenesis) Technika, umożliwiająca wprowadzenie mutacji w ściśle określonym miejscu łańcucha DNA. Aby można ją było zastosować, konieczna jest znajomość wyjściowej sekwencji nukleotydów w genie. Obecnie, ukierunkowaną mutagenezę przeprowadza się standardowo w oparciu o łańcuchową reakcję polimerazy (PCR) i odpowiednio zmodyfikowane oligonukleotydy (startery).

Białka rekombinowane (ang. recombinant proteins, r-proteins) Białka, które powstały w żywych organizmach (lub liniach komórkowych) w wyniku ekspresji rekombinowanego DNA. Rekombinowany DNA jest efektem złożenia za pomocą wybranych technik laboratoryjnych fragmentów materiału genetycznego pochodzących z różnych źródeł/organizmów. Utworzone w ten sposób sekwencje DNA nie występują naturalnie w przyrodzie. Jednak dzięki obecności odpowiednich elementów regulatorowych mogą być powielane oraz mogą ulegać ekspresji po wprowadzeniu do komórek gospodarza.

PCR Powielany fragment DNA

Cykl 2

3’ 5’ 3

’

5’

5’

3’ 3

’ 5’ 3’

5’ 3

’ 5’ 5

’ 3’

5’

3’

matrycowy DNA produkt reakcji z cyklu 1 produkt reakcji z cyklu 2 produkt reakcji z cyklu 3

Cykl 3

5’ 3’

3’ 5’

5’ 3’

3’ 5’

5’ 3

’ 5’

3’

5’ 3

’

3’ 5’

3’ 5’

5’ 3

’

5’ 3’

5’

3’

3’

5’

3’ 5’

5’ 3’

5’

3’

5’ 5’ 3’

3’ 5’

3’ 5’ 3’ 5’

5’ 3’ 3’ 5’

Cykl 1 powielany odcinek DNA

Denaturacja (95°C)

przyłączenie starterów (45-65°C) i wydłużanie nici DNA

(72°C)

PCR, w praktyce wygląda to tak… Powielany fragment DNA

5’ 3’

3’ 5’

3’ 5’ 3’ 5’

5’ 3’ 3’ 5’

Sekwencja startera 2 (reverse, right) pokrywa się z sekwencją nici antysensownej (matrycowej)

sekwencja startera 1 (forward, left) pokrywa się z sekwencją nici sensownej (kodującej)

Mutageneza ukierunkowana, Overlap extension PCR

OE PCR, metoda wydłużania nakładających się odcinków

3’ 5’5’ 3’

5’3’3’5’

3’5’5’3’

PCR 1

A

C

5’3’3’5’

3’5’5’3’

PCR 2 B

D

3’5’

5’3’3’5’5’3’

PCR 3

A

B

Mutageneza ukierunkowana, Overlap extension PCR

OE PCR, metoda wydłużania nakładających się odcinków

3’ 5’5’ 3’

5’3’3’5’

3’5’5’3’

PCR 1

A

C

5’3’3’5’

3’5’5’3’

PCR 2 B

D

3’5’

5’3’3’5’5’3’

PCR 3

A

B

reakcja 1 reakcja 2

starter A starter D

starter C starter B

produkt reakcji 1 produkt reakcji 2 zmieszanie

denaturacja rehybrydyzacja

dNTP, polimeraza, startery B i A

nie ulega wydłużeniu

ulega wydłużeniu

produkt reakcji 3

5’ 3’

3’ 5’

3’ 5’

5’ 3’

3’ 5’

5’ 3’

5’ 3’

3’ 5’

3’ 5’ 3’ 5’

3’ 5’ 5’ 3’

5’ 3’

3’ 5’

5’ 3’

3’ 5’

3’

3’

3’

3’

Mutageneza ukierunkowana, Megaprimer PCR

3’5’

5’3’

3’5’3’5’

5’3’

3’ 5’

3’5’5’3’

3’5’

5’3’

5’ 3’3’ 5’

PCR1

Megaprimer = produkt PCR1

PCR2

Produkt PCR2

Wprowadzanie modyfikacji na końcach genów

3’5’

5’3’

5’3’3’5’

3’5’

5’3’

5’3’3’5’

Wykorzystanie zmodyfikowanych starterów do wprowadzania mutacji na 5’ i 3’ końcu genu

Wprowadzenie/usuwanie sekwencji Shine-Dalgarno/Kozak, kodonu STOP, kodonu START, miejsc cięcia dla enzymów restrykcyjnych

3’5’

5’3’

5’3’

3’5’

Na początku lub na końcu genu

W środku genu

3’5’

3’5’

5’3’

5’3’

5’3’

3’5’

3’5’3’5’

5’3’

5’3’

A

C

D

B PCR 1 – startery A i C PCR 2 – startery D i B

PCR 3 – startery A i B

Modyfikacje DNA, wprowadzanie delecji przy pomocy PCR

Mutageneza ukierunkowana c.d., metoda Quik Change ®

Większość szczepów E. coli prowadzi metylację dam+. Endonukleaza DpnI rozpoznaje i trawi jedynie metylowaną sekwencję 5´-Gm6ATC-3´.

1. Wektor z genem wyizolowany z bakterii dam+, docelowe miejsce wprowadzenia mutacji

2. Startery wprowadzające mutację są do siebie komplementarne

3. Powielanie dwóch nici wektora, wprowadzenie mutacji

4. Trawienie bakteryjnego DNA, usunięcie nici nie zawierających mutacji

Stratagene

Quik Change ® – warunki reakcji

W wysokiej temperaturze DNA może ulegać depurynacji. Proporcjonalnie, dłuższe matryce będą bardziej uszkodzone niż krótkie. Przy powielaniu długich fragmentów DNA istotne jest skrócenie czasu denaturacji oraz obniżenie temperatury wydłużania.

1A – denat. 94°C/60 sek. 2A – denat. 94°C/30min/bez DNA matrycowego/test. aktywności polimerazy 3A – denat. 94°C/10 sek./z DNA matrycowym

A B

Etap Cykl Temperatura Czas

1 1 95°C 30 sek. 2 12–18 95°C

55°C 68°C

30 sek. 1 min 1 min/1kz DNA

Etap Cykl Temperatura Czas

1 1 95°C 3 min 2 25–30 95°C

55°C 72°C

30 sek. 1 min 1 min/1kz DNA

QC PCR

Normalny PCR

Klonowanie klasyczne

wektor

wektor pocięty enzymami restrykcyjnymi BamHI i EcoRI

wektor po wklonowaniu wstawki – rekombinowanego DNA

fragment DNA zawierający interesujący nas gen

fragment DNA (wstawka) po trawieniu enzymami restrykcyjnymi BamHI i EcoRI

ligacja (ligaza DNA)

Metoda OE PCR cloning – klonowanie przy pomocy PCR

Wektor, do którego

chcemy wprowadzić

gen

Gen, który chcemy wprowadzić do wektora

Projektujemy startery, częściowo komplementarne do genu a częściowo komplementarne do wektora

W wyniku reakcji PCR otrzymujemy gen, na którego końcach

znajdują się sekwencje

komplementarne do wektora

Tak zmodyfikowany gen wykorzystywany jest w kolejnej reakcji PCR, gdzie służy za starter

Po zakończeniu reakcji zmetylowany wektor,

który służył jako matryca zostaje pocięty

za pomocą enzymu DpnI

Namnożony,niezmetylowany wektor z wklonowanym

genem zostaje wprowadzony

do komórek gospodarza,

gdzie gen może ulec ekspresji

Enzymy restrykcyjne a metylacja DNA

Enzymy restrykcyjne (endonukleazy) wystę-pują naturalnie u sinic i bakterii. Razem z komplementarnymi metylazami tworzą system restrykcji-modyfikacji, dzięki któremu mikroorganizmy bronią się przed wnikaniem obcego DNA, np. bakteriofagów.

Specyficzna metylacja własnego DNA służy ochronie przed restryktazami syntetyzowanymi przez organizm – obcy DNA, niemetylowany według określonego wzoru, ulega degradacji.

Enzymy restrykcyjne – klasyfikacja uproszczona

WŁAŚCIWOŚĆ TYP I TYP II TYP III

RESTRYKCJA i MODYFIKACJA

Jedno białko posiada obie aktywności

Metylaza i endonukleaza występują osobno

Osobne enzymy wymieniające się wspólną podjednostką

STRUKTURA NUKLEAZY

Heterotrimer Homodimer Heterodimer

KOFAKTORY ATP, Mg2+, SAM (S-adenozylometionina)

Mg2+

Mg2+, SAM

SEKWENCJA/E ROZPOZNAWANE PRZEZ NUKLEAZĘ

Dwie sekwencje w dowolnej orientacji

Pojedyncza sekwencja palindromowa (4–8 nukl.)

Dwie sekwencje obok siebie, w przeciwnej orientacji

MIEJSCE CIĘCIA DNA Przypadkowe, około 1000 zasad od miejsca rozpoznawanego przez nukleazę

W obrębie (lub blisko miejsca) rozpoznawanego przez nukleazę

24-26 nukleotydów od miejsca rozpoznawanego przez nukleazę, po stronie 3’

MIEJCE METYLACJI DNA

W obrębie sekwencji rozpoznawanej przez nukleazę



Ze względu na swoją charakterystykę w biotechnologii wykorzystywane są jedynie enzymy typu II.

Enzymy restrykcyjne

EcoRI

EcoRV

PstI

Izoschizomery – enzymy pochodzące z różnych organizmów, rozpoznające te same sekwencje i tnące je w ten sam sposób, np. MspI i HpaII 5'...C^C G G...3' 3'...G G C^C...5'

Neoizoschizomery – enzymy pochodzące z różnych organizmów, rozpoznające te same sekwencje, ale tnące je w różny sposób, np. SmaI 5'...C C C^G G G...3‘ i XmaI 5'...C^C C G G G...3‘ 3'...G G G^C C C...5‘ 3'...G G G C C^C...5‘

Metylacja Dam i Dcm u E. coli

Metylaza Dam rozpoznaje sekwencję 5’-GATC-3’ i metyluje adeninę w pozycji N6.

Metylaza Dcm rozpoznaje sekwencje 5’-CCAGG-3’ i 5’-CCTGG-3’ i metyluje drugą cytozynę w pozycji C5.

Przykładem szczepu nie przeprowadzającego opisanych powyżej metylacji jest E. coli GM2163 (dam–, dcm–).

Niektóre enzymy restrykcyjne rozpoznają wyłącznie sekwencje metylowane (np. DpnI), inne – oba rodzaje sekwencji (np. BamHI), jeszcze inne – wyłącznie sekwencje niemetylowane (np. XbaI, MboI itd.). W tym ostatnim przypadku, pojawienie się metylacji Dam i Dcm w obrębie miejsc restrykcyjnych rozpoznawanych przez taki enzym, zaburzy jego działanie.

Metylazy przenoszą grupę metylową z S-adenozylo-metioniny (SAM) na określony nukleotyd w rozpoznawanej przez siebie sekwencji.

Termostabilne polimerazy DNA

Polimeraza Pochodzenie Aktyw. 5’ – 3’

egzonukl.

Aktyw. 3’ – 5’

egzonukl.

Częstość błędów [1x10-6]a

Wydłu- żanie

3’-końca Termo-

stabilność Proce-

sywnośćb

Taq 1976 Thermus aquaticus tak nie 22 tak 9’ w 97,5°C 50

Pwo Pyrococcus

woesei nie tak 3,2 nie >2h w 100°C 20–30

Pfu 1991 Pyrococcus

furiosus nie tak 2,6 nie 4h w 95°C

DeepVent Pyrococcus

szczep GB-D nie tak 5 nie 8h w 100°C

Phusion nie tak 0,44 nie

a częstość błędów: ilość błędów/pz/cykl b ilość nukleotydów przyłączonych zanim polimeraza odłączy się od matrycy

PCR – ogólne zasady projektowanie starterów

Długość starterów – od 18 do 30 zasad, krótsze startery mogą się niespecyficznie wiązać z matrycą

3’ koniec startera – nie powinien zawierać więcej niż 3 zasady G i/lub C, gdyż mogą one stabilizować niespecyficzne oddziaływania starter–matryca

5’ koniec startera – jest mniej krytyczny dla specyficznego przyłączania startera do matrycy dlatego może być modyfikowany

Zawartość GC – zasady GC powinny stanowić od 40 do 60 % sekwencji

Hybrydyzacja – 3’ koniec starterów nie powinien tworzyć struktury spinki do włosów, startery używane w reakcji nie powinny tworzyć homo- i/lub heterodupleksów

Temperatura topnienia – startery używane w reakcji powinny mieć zbliżoną temperaturę topnienia (różnica 2–5°C), optymalnie – nieco powyżej 60°C

hybrydyzacja starterów na końcu 3’

Optymalizacja warunków PCR

Stężenie starterów: końcowe stężenie każdego ze starterów powinno się zawierać w przedziale między 0,1 a 0,5 µM (6×1012 – 3×1013 cząsteczek). Wyższe – zwiększa prawdopodobieństwo powstania niespecyficznych produktów

Stężenie matrycy DNA: ilość używanego matrycowego DNA zależy od jego pochodzenia. Zwykle stosuje się 100–250 ng genomowego i 20–50 ng plazmidowego DNA na 50 µl reakcji

Stężenie nukleotydów: końcowe stężenie poszczególnych nukleotydów powinno wynosić ok. 0,2 mM (ilość, która pozwala uzyskać ok. 6–6,5 µg DNA)

Ilość cykli – od 25 do 35, w zależności od pochodzenia DNA i ilości matrycy

Czas wydłużania starterów – zwykle przyjmuje się regułę 60 sek/1000 zasad

Bufor – standardowy bufor zawiera 50 mM KCl i 10 mM Tris-HCl, pH 8,3. Podniesienie stężenia KCl do 70–100 mM może zwiększyć wydajność syntezy fragmentów o długości <500 pz. Niektóre bufory obok jednowartościowych jonów K+

zawierają jony NH4+ (obecność jonów NH4

+ minimalizuje potrzebę optymalizacji stężenia jonów Mg2+ oraz temperatury przyłączania starterów.

Critical Factors, for Successful PCR, Users Manual, Qiagen

temp °C

produkt PCR

niespecyficzne produkty PCR

Temperatura przyłączania starterów (annealing temperature) – im wyższa, tym bardziej specyficzny produkt reakcji

Optymalizacja warunków PCR

Stężenie jonów magnezu – im wyższe, tym większa wydajność reakcji ale także ilość produktów niespecyficznych

Obliczanie temperatury topnienia starterów

Dla starterów liczących nie więcej niż 20 nukleotydów temperaturę topnienia (melting temperature) można wyliczyć wg empirycznej zasady Wallace’a: Tm = 2°C × (A + T) + 4°C × (G + C)

Dla dłuższych oligonukleotydów (do 70 zasad), gdy stężenie kationów jest ≤ 0,4 M można zastosować równanie: Tm = 81°C + 16,6 (log10 [K+]) + 0,41(%[G + C])

Temperatura hybrydyzacji (annealing temperature) jest na ogół o 5–10°C niższa od Tm, należy ją ustalić empirycznie.

Abso

rban

cja pr

zy 26

0 nm

Tm=69 °C

Dwuniciowy DNA

Częściowo rozwinięty DNA

Jednoniciowy DNA

Temperatura [°C]

Czynniki wpływające negatywnie na PCR

Wysoka zawartość zasad GC jest odpowiedzialna za powstawanie struktur drugorzędowych w obrębie DNA, co prowadzić może do zahamowania aktywności polimerazy. Glicerol, DMSO (2–10%), chlorek tetrametyloamonu (0,01–10 mM), formamid (5–20%) poprawiają wydajność tego typu reakcji PCR.

Zanieczyszczenia związkami używanymi przy oczyszczaniu matrycowego DNA Do związków hamujących aktywność polimerazy należą: SDS (>0,005% w/v), fenol (>0,2% v/v), etanol (> 1% v/v), izopropanol (>1% v/v), octan sodu (>5 mM), EDTA (> 0,5 mM).

Czystość starterów zależy od sposobu ich oczyszczenia po syntezie. Standardowo startery oczyszcza się stosując sączenie molekularne. Startery o długości powyżej 70 zasad powinny być oczyszczane za pomocą HPLC.

Kilka dat z historii

• 1953 W „Nature” ukazuje się praca Jamesa Watsona i Francisa Cricka

opisująca dwuniciową, helikalną strukturę DNA • 1956 Arthur Kornberg odkrywa i izoluje polimerazę DNA • 1959 Francois Jacob i Jacques Monod odkrywają w obrębie chromosomu

bakteryjnego istnienie sekwencji regulujących ekspresję genów: nazywają je represorem i operonem

• 1961 Marshall Nirenberg i Heinrich Matthaei łamią kod genetyczny • 1961

Naukowcy stwierdzają, że geny oporności na antybiotyki są u bakterii często przenoszone w małych wielokopijnych „chromosomach”. Nazwa plazmid zostaje zaproponowana już w roku 1952 przez J. Joshuę Laderberga na określenie wszystkich pozachromosomalnych elementów dziedziczności.

Kilka dat z historii c.d.

Otrzymywanie białek rekombinowanych stało się możliwe dzięki przełomowym osiągnięciom w dziedzinie inżynierii genetycznej do jakich doszło w ostatnich 25 latach XX wieku.

• 1970 opisanie i izolacja „pierwszego” enzymu restrykcyjnego (dokładniej,

pierwszego enzymu typu II) – HindII (Hamilton Smith) • 1974 w „Proceedings of the National Academy of Sciences” ukazuje się

praca Stanleya Cohena (Stanford University) i Herberta Boyera (UCSF), w której uczeni pokazują ekspresję obcego DNA wprowadzonego do bakterii Escherichia coli za pomocą technik rekombinacji DNA (fragmenty kodujące RNA 18S i 28S z Xenopus laevis)

• 1976 Herbert Boyer i Robert Swanson zakładają Genentech Inc., firmę

biotechnologiczną, której celem jest tworzenie i sprzedaż produktów opartych o technologię rekombinacji DNA

• 1980 Sąd Najwyższy USA postanowia, że organizmy zmodyfikowane genetycznie mogą podlegać prawu patentowemu • 1982 Amerykańska Agencja ds. Żywności i Leków (Food and Drug Administration) dopuszcza do obrotu ludzką insulinę produkowaną w bakteriach • 1983 Kary Mullis pracujący w Cetus Corporaration wpada na pomysł powielania DNA in vitro (PCR). Trzy lata później udoskonala reakcję wprowadzając termostabilną polimerazę. Cetus opatentowuje reakcję i w 1991 roku sprzedaje ją firmie Hoffman–LaRoche za 300 mln dolarów

• 1978 Geny kodujące 2 łańcuchy insuliny zostały po raz pierwszy sklonowane i wprowadzone do komórek Escherichia coli przez zespół Arthura Riggsa i Keichiego Itakury z Genentech Inc.

Kilka dat z historii c.d.

Wykorzystanie białek rekombinowanych

• w przemyśle farmaceutycznym • w przemyśle spożywczym • w procesach technologicznych • w biotechnologii • w badaniach naukowych

Wykorzystanie białek rekombinowanych

Parametry poddawane zmianom

CEL WYMAGANA ILOŚĆ BIAŁKA badanie funkcji białka mg wytworzenie przeciwciał mg badanie struktury białka mg diagnostyka i terapia mg-kg przemysł kg-t

FIZYKOCHEMICZNE termostabilność rozpuszczalność kinetyka fałdowania zdolność wiązania ligandów specyficzność wiązania ligandów własności fluorescencyjne

BIOLOGICZNE I FARMAKOLOGICZNE okres półtrwania w surowicy aktywność immunogenność toksyczność podatność na działanie proteaz specyficzność oddziaływania

z chorymi tkankami

Inżynieria białek I Wykład 2 (2014/2015)

Magdalena Tworzydło Zakład Biochemii Fizycznej, WBBiB UJ

E. coli: idealny system ... czasami

Pomimo ciągłych prac nad rozwojem nowych systemów ekspresyjnych E. coli pozostaje nadal najczęściej używanym organizmem.

Wykorzystywana jest z powodzeniem do produkcji enzymów stosowanych w diagnostyce, analityce i w celach przemysłowych, a także do produkcji leków, o ile tylko nie posiadają one budowy podjednostkowej i nie wymagają pełnej obróbki potranslacyjnej.

Dla potrzeb laboratoriów i przemysłu stworzonych zostało szereg szczepów oraz kilkaset wektorów umożliwiających ścisłą kontrolę regulacji ekspresji białek, oraz ułatwiających prawidłowe fałdowanie i oczyszczanie syntetyzowanych protein.

Theodor Escherich (1857–1911)

lekarz-pediatra odkrywca E. coli

(1885 r.)

Nadal jednak optymalizacja procesu ekspresji genów a następnie otrzymywania poszczególnych białek rekombinowanych bywa czasochłonna i kosztowna nie zależy bowiem jedynie od właściwości samego systemu, ale przede wszystkim od indywidualnych właściwości białka.

Zalety i wady bakteryjnego systemu ekspresyjn

System ekspresyjny

Klasyfikacja

Tworzenie wiązań S-S

Glikozylacja

Wydzielanie

Koszt hodowli

Antybiotyki

Koszty bezpieczeństwa

Produkty na rynku 1 zależny od promotora 2 brak końcowej α1,3 mannozy 3 brak dokładnej charakterystyki, 4 końcowa fukoza (6-dezoksygalaktoza)

Na podstawie Production of recombinant proteins, Gerd Gellisen 2005 Wiley-Vch Verlag GmbH & Co. Weinheim

Escherichia coli

bakteria gram-ujemna

tak (w peryplazmie)

nie

do peryplazmy

niski/średni1

raczej tak

niskie

tak

― stworzone na potrzeby klonowania i/lub ekspresji genów ― posiadają m. in:

• polilinker, MCS (multi cloning site) • ori (origin) miejsce startu replikacji • marker selekcyjny: np. gen oporności na antybiotyk • promotor

Wektory plazmidowe

― naturalnie występujące u bakterii pozachromosomalne, koliste, dwuniciowe cząsteczki DNA, 1–200 kpz.

― ich replikacja przebiega niezależnie od chromosomalnego DNA ― posiadają mechanizmy umożliwiające zachowanie stałej liczby cząsteczek

w komórce gospodarza oraz odpowiednią segregację do komórek potomnych

― replikacja i transkrypcja genów plazmidowych przebiega zwykle w oparciu o enzymy gospodarza

― w plazmidach naturalnych zawarta jest informacja decydująca o: oporności/produkcji antybiotyków, syntezie bakteriocyn, enterotoksyn, wytwarzaniu enzymów restrykcyjnych, rozkładzie złożonych związków organicznych, oporności na jony metali ciężkich, zdolności do koniugacji, itp.

Plazmidy

Wektory plazmidowe

Replikon – liczący kilkaset par zasad obszar DNA, w skład którego wchodzi ori oraz elementy regulujące start replikacji. W wektorach plazmidowych najczęściej spotykane są replikony z plazmidów pMB1 lub ColE1. Niezmodyfikowane, utrzymują ilość kopii plazmidu na poziomie 20 szt./kom.

Plazmidy nisko- i wysokopijne

-500 -300 -100 100 300 500 ori

białko ROP, homodimer, 68 aa, negatywny regulator replikacji DNA (stabilizuje oddziaływanie RNA I z RNA II

RNA I, negatywny regulator replikacji DNA, (blokuje oddziaływanie RNA II z DNA)

RNA II, pozytywny regulator replikacji DNA, (oddziałuje z DNA i inicjuje replikację) pre RNA II jest trawiony przez

RNA-zę H do postaci RNA II

rop RNA I

pre RNA II

kierunek replikacji DNA

RNA II

Plazmidy posiadające taki sam replikon są niekompatybilne – nie mogą wspólnie występować w jednej komórce bakteryjnej pod nieobecność czynników selekcyjnych. Współzawodnictwo o te same elementy zwiększające ilość kopii danego plazmidu, prowadzi z czasem do eliminacji jednego z nich. Replikony należące do tej samej grupy kompatybilności co pMB1/ColE1, to p15A, R6K oraz F.

PLAZMID/ WEKTOR REPLIKON ILOŚĆ KOPII

CZYNNIK NEGATYWNEJ KONTROLI ILOŚCI KOPII PLAZMIDU/WEKTORA

pBR322 pMB1 30 – 40 RNA I, białko Rop

pUC zmodyfikowany pMB1 500 – 700 RNA I

pACYC p15A 15 – 20 powtórzone sekwencje DNA (iterony), białko RepA

pSC101 pSC101 ~5 powtórzone sekwencje DNA (iterony), białko Rep A

colE1 colE1 20 – 30 RNA I

Plazmidy nisko- i wysokokopijne

pBR322 – wektor plazmidowy 1-szej generacji (Bolivar at al., Gene 1977)

pierwsze wektory posiadające MCS (Vieira i Messing, Gene 1982) – seria pUC

Przykładowe nazewnictwo wektorów p – plazmid BR – inicjały konstruktorów (Bolivar, Rodriguez) 322 – numer plazmidu w kolekcji UC – msce powstania (University of California)

Pierwsze wektory

Test α-komplementacji (blue-white screening)

aktywny tetramer β-galaktozydazy

aminokwasy 42–1173

gen lacZΔM15 (chromosom)

białko ω – nieaktywny dimer

X-gal (5-bromo-4-chloro-3-indol-beta-D-galaktozyd)

galaktoza

5-bromo-4-chloro-indoksyl

DIMERYZACJA OKSYDACJA

Barwny precypitat

+ =

aminokwasy 1–62

peptyd α

(wektor)

Promotory – inicjacja transkrypcji

Promotory E. coli rozpoznawane są przed podjednostkę sigma polimerazy RNA. Istnieje 7 typów podjednostek σ, a co za tym idzie 7 typów promotorów. Najczęściej spotykane promotory oddziałują z czynnikiem σ70. Inicjacja procesu transkrypcji przebiega w 4 etapach: i) rozpoznanie sekwencji promotorowej przez holoenzym RNA (α2, β, β’, ω, σ70) ii) przejście kompleksu zamkniętego w otwarty, rozpoczęcie syntezy mRNA (tworzenie transkryptów poronnych) iii) uwolnienie podjednostki σ, izomeryzacja do kompleksu elongacyjnego iv) uwolnienie promotora. Każdy z etapów wpływa na szybkość całego procesu co oznacza, że promotory o podobnej sile mogą mieć różne sekwencje, w zależności od tego, który z czterech etapów jest w nich zoptymalizowany. W silnych promotorach obszary -35 i -10 są najbardziej zbliżone do sekwencji konsensusowych.

Silny promotor = częsta inicjacja transkrypcji

16–19 pz

-35 -10 +1 TATAAT TTGACA

-42 +20

Promotory

Najczęściej spotykanym mechanizmem regulacji ekspresji genów jest wiązanie się białek regulatorowych w obrębie operonu:

• w systemach regulowanych pozytywnie albo sekwencja -35 (-10) odbiega znacznie od sekwencji konsensusowej, albo odległość pomiędzy obszarami -10 i -35 nie jest optymalna, w związku z czym białko aktywatorowe ułatwia polimerazie RNA rozpoznanie promotora i zwią-zanie się z nim, • w systemach regulowanych negatywnie białko represorowe wiąże się poniżej lub bezpośrednio w obrębie promotora uniemożliwiając polimerazie RNA wiązanie do DNA lub wydłużanie mRNA.

Oba rodzaje promotorów mogą być kontrolowane na dwa sposoby: • przez indukcję – efektor łączy się z represorem i hamuje jego wiązanie do operatora, aktywator łączy się z miejscem docelowym tylko w obecności efektora, • przez represję – nieaktywny represor ulega aktywacji dopiero w obecności cząsteczki efektorowej, aktywator jest inaktywowany pod wpływem przyłączenia liganda.

16–19 pz

-35 -10 +1 TATAAT TTGACA

-42 +20

Promotor lac z operonu laktozowego

Przykład regulacji negatywnej sterowanej przez indukcję

Pod nieobecność laktozy represor (homotetramer) jest związany z operatorem i uniemożliwia transkrypcję genów z, y, a. Po związaniu induktora (allolaktoza, IPTG – izopropylotiogalaktozyd) represor traci powi-nowactwo do miejsca operatorowego.

Przykład regulacji pozytywnej Białko CRP (homodimer) związane z cAMP przyłącza się do DNA powyżej promotora i ułatwia polimerazie RNA oddziaływanie z kwasem nukleinowym.

Represja kataboliczna Komórki E. coli rosnące w obecności glukozy charakteryzują się niskim stężeniem enzymów katabolicznych, m. in. β-galaktozydazy.

W przypadku operonu lac 1) Glukoza blokuje napływ laktozy przez kanały permeazy do wnętrza komórki i uniemożliwia galaktozydazie przekształcenie laktozy w allolaktozę. 2) glukoza hamuje powstawanie cAMP potrze-bnego do aktywacji CRP.

TTTACA -----17pz-----TATGTT

msce wiązania represora

i z y a represor galaktozydaza permeaza acetylaza

msce wiązania CRP

i promotor lac promotor

Przeciekanie promotora lac

W popularnych, niezmodyfikowanych szczepach E. coli dochodzi do minimalnej ekspresji genu lacI kodującego represor: ilość białka w komórce nie przekracza 10 cząsteczek. Po transformacji wysokokopijnym wektorem z promotorem laktozowym, większość miejsc operatorowych nie zostaje obsadzona, w związku z czym ma miejsce konstytutywna ekspresja rekombinowanego genu.

Jednym ze sposobów rozwiązania tego problemu jest wprowadzenie do bakterii genu lacIq ze zmienionym promotorem. Pojedyncza mutacja w obrębie promotora lacI pozwala 10-krotnie zwiększyć ilość cząsteczek represora w komórce.

~10 cząsteczek represora

20 – 500 kopii plazmidu

msce wiązania CRP


lac promotor

System pET – polimeraza RNA i promotor ø10 faga T7

Indukcja IPTGIndukcja IPTG

Polimeraza RNA E. coli

Polimeraza RNA faga T7

represor lac

represor lac

gen Ilac gen Ilac

DNA chromosomalne

pET

T7 RNA po limeraza Gen T7

promotor lac operator lac operator lac

promotor T7

NIEKTYWNA

gen lyzozymu T7

lyzozym T7

DE3

pLysSElub

KOMÓRKAGOSPODARZA

Polimeraza RNA faga T7, monomer o masie 99 kDa. Odporna na działanie rifampicyny (w przypadku bakterii antybiotyk oddziałuje z podjednostką β polimerazy i hamuje syntezę 1-szego wiązania fosfodiestrowego w mRNA), rozpoznaje jedynie swoje własne promotory, jest wysoce procesywna − 230 nt/s (polimeraza RNA z E. coli – 50 nt/s).

TAATACGACTCACTATAGGGAGA -12 -8 +1 +3

System pET jest chroniony patentami nr: 4,952,496; 5,693,489 i 5,869,320.

Operon arabinozowy – przykład regulacji pozytywnej

CTGACG -----18pz-----TACTGT

Białko araC jest negatywnym regulatorem swojej własnej transkrypcji, łącząc się z operatorem araO1 blokuje promotor pC. Promotor pBAD podlega represji katabolicznej. Pod nieobecność L-arabinozy produkt genu araC – cząsteczki białka araC – łączą się z miejscami operatorowymi araO2 i araI1, w wyniku czego powstaje pętla DNA, która uniemożliwia polimerazie RNA transkrypcję genów BAD spod promotora pBAD.

W obecności arabinozy cząsteczki białka araC zmieniają konformację, jedna z nich opuszcza operator araO2 i łączy się z miejscem operatorowym araI2. Do pełnej aktywacji promotora pBAD konieczna jest obecność białka CRP związanego z cAMP. CRP oraz 2 cząsteczki białka ara C (z arabinozą) w pozycjach araI1 i araI2 ułatwiają polimerazie rozpoznanie promotora pBAD i związanie się z nim.

promotor pBAD

araD araO2 araC araO1 araI1araI2 araB araA araC

miejsce miejsce wiązania CAP

Promotor trp z operonu tryptofanowego

Przykład negatywnej regulacji sterowanej przez represję

W obecności tryptofanu represor (dimer) jest związany z operatorem i uniemożliwia transkrypcję sekwencji liderowej L oraz genów E, D, C, B i A. Brak aminokwasu uruchamia ekspresję enzymów potrzeb-nych do jego syntezy.

Zalety Silny, indukowalny promotor.

i wady … Podobnie jak promotor laktozowy ma tendencje do przeciekania. Niewielka ilość pożywek nadających się do hodowli. Konieczność usunięcia tryptofanu w momencie wzmożonej syntezy białka.

Promotory hybrydowe

Promotory tac i trc zawierają sekwencje –35 z promotora trp i –10 z promotora lacUV5 oddzielone fragmentami liczącymi odpowiednio 16 i 17 pz.

Promotory te nie wymagają do pełnej aktywacji białka CRP. Promotor tac jest 5 razy silniejszy od plac


TTGACA -----17pz-----TTAACT

trp promotor

L E D C B A trp represor

Promotory faga λ

N P cI P cro QL R

białka główki ogonka regulacja replikacja DNA liza

Faza lityczna przebiega w trzech etapach: wczesnym, opóźnionym i późnym. Sekwencyjnie dochodzi do ekspresji enzymów niezbędnych do replikacji i rekombinacji DNA, syntezy białek główki oraz ogonka wirusa, a na końcu – białek koniecznych do wywołania lizy komórki.

W fazie lizogenicznej wyróżnia się etap integracji, trwania i uwalniania. Na etapie profaga ekspresji ulega jedynie gen cI kodujący represor l, który po przyłączeniu do promotorów L i R zabiega ekspresji białek wczesnej fazy, a tym samym ekspresji wszystkich białek faga.

Promotory faga λ

N P cI P cro QL R

białka główki ogonka regulacja replikacja DNA liza

W systemach ekspresyjnych wykorzystywana jest najczęściej zmutowana, termolabilna wersja represora I, blokująca promotory pL i pR tylko w obniżonej temperaturze (28–30° C). Wykorzystując wektory z promotorem pL (jest silniejszy od pR) należy dodatkowo używać bakterii posiadających gen cIts857 dla zmutowanej wersji represora. Problemy związane ze stosowaniem termicznie indukowanych promotorów mogą wynikać z faktu, że podwyższona temperatura aktywuje także geny szoku cieplnego, z których część koduje proteazy. Dodatkowo, niektóre z syntetyzowane białek rekombinowanych mogą ulegać termicznej denaturacji i wytrącać się w postaci agregatów. Aby wyeliminować problem powstawania białek szoku cieplnego można wykorzystać szczep bakterii ze zmodyfikowanym genem rpoH – kodującym podjednostkę σ32 polimerazy RNA. Innym sposobem indukcji promotora λpL jest użycie szczepu bakterii, w którym gen cI jest umieszczony pod kontrolą promotora trp. Po dodaniu do pożywki tryptofanu, dochodzi do zahamowania transkrypcji genu cI i, w konsekwencji, do aktywacji indukcji λpL.

Terminacja transkrypcji, stabilność mRNA

Sygnał terminacji transkrypcji, palindro-mowy rejon RNA bogaty w pary G–C, tworzy strukturę spinki do włosów i poprzedza sekwencję oligo-U. Działa niezależnie od obecności białka Rho. Destabilizuje oddziaływanie pomiędzy DNA a matrycowym mRNA.

G CA UC GG CC GC GC G U U U U 3’5’

Pętla na końcu 3’ mRNA najprawdopodobniej chroni je przed działaniem 3’–5’ egzonukleaz. Stabilność mRNA zależy także od wydajności procesu translacji, jaki zachodzi przy jego udziale. Rybosomy chronią mRNA przed degradacyjnym działaniem RNA-zy E (endonuklaza).

Ekspresja genów białek heterogenicznych w komórkach E. coli zależy nie tylko od siły promotora, lecz także od wydajności procesów transkrypcji i translacji.

Stabilność mRNA

Okres półtrwania mRNA komórkach E. coli wynosi od kilku sekund do 20 minut.

Degradacja mRNA jest inicjowana między innymi przez endonukleazę – RNazę E. RNaza E jest homodimerem zaangażowanym w proces dojrzewania rybosomowego RNA.

Aktywność katalityczna enzymu związana jest z jego domeną N-końcową. Domena C-końcowa stanowi „rusztowanie” dla degradosomu złożonego z RNazy II, enolazy, helikazy RhlB i fosforylazy polinukleotydowej (PnPase).

Degradosom łączy się z jednoniciowym ufosforylowanym końcem 5’ mRNA.

Jednym ze sposobów ochrony 5’-końca jest dołączenie do niego sekwencji genu ompA tworzącego strukturę spinki.

Inicjacja translacji

• sekwencja Shine-Dalgarno (SD box, rbs – ribosome binding site), sekwencja komplementarna do 3’ końca rybosomowego RNA 16S, 4–9 nukleotydów

• kodony START: AUG (fMet) – wykorzystywany w 83% genów (pozostałe: GUG (Val) – 14%

oraz UUG (Leu) – 3%) • powstawanie struktur drugorzędowych w obrębie sekwencji SD, kodonu

START i ok. 20 nukleotydów poniżej kodonu START wpływa negatywnie na inicjację translacji

Restryktazy użyteczne przy klonowaniu: NdeI (CA*TATG), SphI (GCATG*C), NcoI (C*CATGG)

promotor +1 rbs (konsensus) 11(8) pz START AGGAGGT ATG

„Dialekty” w kodzie genetycznym

Kod genetyczny jest zdegenerowany – kilka różnych kodonów koduje jeden aminokwas. Pomiędzy organizmami istnieją różnice w częstości występowaniu kodonów dla poszczególnych aminokwasów. Częstość wykorzystania danego kodonu znajduje odzwierciedlenie w ilości odpowiadającego mu tRNA. Konsekwencją istnienia „dialektów” może być:

obniżona stabilność mRNA przedwczesna terminacja translacji przesunięcia w ramce odczytu, wystąpienie delecji,

wprowadzenie błędnych aminokwasów (np. Lys w miejsce Arg)

zahamowanie syntezy białka

Rzadkie kodony u E. coli to: AGG/AGA (Arg), AUA (Ile), CUA (Leu) i CCC (Pro).

Rzadkie kodony

Osiem najrzadziej używanych kodonów u E. coli, drożdży, Drosophila melanogaster i naczelnych

E. coli Drożdże Drosophila Naczelne Aminokwas

AGG AGG ARGININA

AGA AGA ARGININA

AUA AUA IZOLEUCYNA

CUA LEUCYNA

CGA CGA CGA CGA ARGININA

CGG CGG CGG CGG ARGININA

CCC PROLINA

UCG UCG SERYNA

CGC CGC ARGININA

CCG CCG PROLINA

CUC LEUCYNA

GCG GCG ALANINA

ACG ACG TREONINA

UUA LEUCYNA

GGG GLICYNA

AGU SERYNA

UGU CYSTEINA

CGU ARGININA

Dwójki kodonów (codon pairs)

Również częstość występowania określonych par kodonów odbiega od wartości przewidywanych dla rozkładu losowego. Pojawienie się nadreprezentowanej pary kodonów w sekwencji mRNA działa jak przecinek w zdaniu – obniża szybkość syntezy łańcucha polipeptydowego. Najprawdopodobniej jest to mechanizm ułatwiający właściwe fałdowanie białek. Sygnały opóźnienia translacji są różne dla poszczególnych organizmów.

Terminacja translacji

Sygnałem zakończenia translacji jest pojawienie się jednego z 3 kodonów: UAA (ochre, 63%), UAG (opal, 29%) UGA (amber, 8%) Wydajność terminacji translacji zależy także od nukleotydu występującego bezpośrednio za kodonem STOP i jest najwyższa w przypadku sekwencji UAAU a najniższa dla sekwencji UAGC.

Rola mutacji cichych (silent mutations)

Inżynieria translacyjna

Inżynieria translacyjna wykorzystuje programy komputerowe w celu optymalizacji sekwencji nukleotydowej genu heterologicznego białka i dopasowaniu jej do „dialektu” używanego przez gospodarza.

Synteza genów de novo

Cennik od 0,23 $ do 0,35 $ – za zasadę 299 $ – wklonowanie do wektora komercyjnego

Czas realizacji Od 0 do 1000 pz – od 5 dni roboczych Od 1001 do 2000 pz – od 7 dni roboczych

http://www.genscript.com/

gen (1300 pz) + wklonowanie do wektora = 2000 PLN

inżynieria białek i wykład 1 (2014/20155) wyklady... · najczęściej wykorzystywane systemy...

Documents