genexpression in bakterien und hefen · bcii-praktikum am georg-speyer-haus 13.01.+ 03.02.2008...
TRANSCRIPT
1
GenexpressionGenexpression inin Bakterien Bakterien und Hefen und Hefen
Dr. Kurt SchönfeldDr. Kurt SchönfeldAG Wels
MethodenseminarBCII-Praktikum am Georg-Speyer-Haus13.01.+ 03.02.2008
Produktion von Produktion von rekombinantenrekombinanten Proteinen Proteinen
⇒ zahlreiche Expressionssysteme mit einer Reihe gut bekannter Organismen oder Zelllinien und verschiedenen Expressionsvektoren .
= die gezielte Synthese (großer Mengen) eines gewünschten fremden Genprodukts in einer lebenden Zelle
Ablauf: Einführen des für das rekombinante Protein kodierende Gen in einen Vektor (Plasmid)
Transformation/Transfektion der gewählten Zielzelle
Kultivierung der Wirtszelle
Expression des Gens konstitutiv oder induziert ab einem best. Zeitpunkt
Reinigung des rekombinanten Proteins
2
GenexpressionssystemeGenexpressionssysteme
prokaryontische Expressionssysteme
Escherichia coli (E. coli)Lactococcus lactisandere Bakterien (z.B. Bacillus subtilis)
eukaryontische Expressionssysteme
Hefe: Saccharomyces cerevisiaePichia pastorisHansenula polymorpha
Insektenzellen: Baculovirus-Systemstabile, das rekombinante Protein exprimierende Zelllinien
Säugetierzellen: stabile, das rekombinante Protein exprimierende Zelllinien induzierbare Systeme
SucheSuche nach einem geeigneten Expressionssystem nach einem geeigneten Expressionssystem
Die Kombination aus Wirtszelle und Expressionsvektor richtet sich nachdem späteren Verwendungszweck des Proteins d.h. nach den Anforderungen an das Expressionsprodukt:
• Bioaktivität bzw. posttranslationelle Modifikation gewünscht bzw. erforderlich?
• Hohe Ausbeute wichtig?
• Protein evt. zytotoxisch?
• Expressionssysteme einfach und schnell zu etablieren?
• Expressionsbedingungen einfach und schnell zu optimieren?
• Wie hoch sind Aufwand und Kosten der Kultivierung der Wirtszelle?
• Evt. Vorerfahrungen mit den Wirtszellen?
• Expressionsprodukte einfach zu reinigen?
⇒ Abwägung der Vor- und Nachteile des jeweiligen Systems führt zur Wahl des für das interessierende Protein geeigneten Expressionssystems
3
bakterielle Expressionssystemebakterielle Expressionssysteme
Vorteile
• hohe Ausbeute
• einfache, billige Kultivierung
• gute Raum-/Zeit-Ausbeute
• Organismus umfassend bekannt, einfach zu handhaben und zu manipulieren
• zahlreiche Kontrollelemente auf Transkriptions- und Translationsebene bekannt
Nachteile
• keine posttranslationale Modifikation und
Sekretionsmechanismen eukaryontischer Zellen
⇒ häufig keine bioaktiven Proteine
• Expressionsprodukte evt. schwerlöslich in Form von „inclusion bodies“
Escherichia coliEscherichia coli
gram-negatives Bakterium (Enterobacteriaceae) Entdecker: Theodor Escherich, 1919 einer der am besten untersuchten Organismen der Welt
E. coliE. coli
relativ kleines Genom (ca.4,6 Millionen Basenpaare = ca. 5000 Gene) wurde als eines der ersten vollständig sequenziert (1997; E. coli Stamm K-12, MG1655)
der am häufigsten verwendete Organismus für die heterologe Proteinexpression Standard für die Produktion von diagnostischen und analytischen Enzymen industrielle Biosynthese von Insulin, Aminosäuren und pharmazeutisch relevanter Proteine (Einschränkung: Proteine dürfen nicht aus mehreren Untereinheiten bestehen oder posttranslationelle Modifikationen benötigen)
⇒ Es gibt viele verschiedene Stämme, die für die Proteinexpression eingesetzt werden, und hunderte verschiedener Expressionsvektoren mit unterschiedlichen Promotoren, Selektionsmarkern und evt. Fusionspartnern.
4
Escherichia coliEscherichia coli
Die meisten E. coli Stämme im Labor gehen auf den E. coli K-12 Stamm zurück.E. coliE. coli
keine Toxinekeine Adhäsionsfaktorenkeine Invasionsfaktorenkein Eisen-Transport-Systemkeine Kapselkeine Plasmidekleineres Genomrauer Kolonietyp(unvollständiges LPS)
Eisentransport
Toxine Kapsel Adhesion
Invasion
Andere häufig verwendete Stämme stammen von E. coli B ab;
ebenfalls ohne Pathogenitätsfaktoren.
Mühldorfer & Hacker (1994). Microbial Pahtogenesis 16, 171.
Kuhnert et al. (1997). Appl. Environ. Microbiol. 63(2), 703.
pathogener E. coliE. coli K-12
Sicherheitsmerkmale von E. coli K-12:
Aufbau eines Expressionsvektors für Aufbau eines Expressionsvektors für E. coliE. coli
Replikationsursprung(Origin of replication; Ori)
Selektionsmarker(z.B. Resistenzgen)
Expressionskassette für eineregulierte Transkription und Translation Promoter Transkriptionsterminator Ribosomenbindungsstelle mit Shine-Dalgarno Sequenz Start- und Stoppkodon
Multiple Klonierungsstelle
optional: Sequenz für Fusionsprotein, N- und/oder C-terminalen Tag regulatorisches Gen (z.B. Repressorgen)
E. coliE. coli
5
ReplikationsursprungReplikationsursprung
Die Initiation der DNA-Replikation beginnt bei Prokaryoten stets an einer
best. Stelle des DNA-Moleküls, die als Ursprung der Replikation bezeichnet wird:
origin of replication (Ori)
kontrolliert die Anzahl der Kopien eines Plasmids
(= Anzahl der Plasmid-Moleküle pro Zelle)
Viele Expressionssysteme basieren auf den ColE1-Typ des origin of replication
(multicopy Plasmid).
Der Verlust dieser best. Sequenz führt zum Verlust der Fähigkeit, sich selbst zu replizieren.
E. coliE. coli
SelektionsmarkerSelektionsmarker
Antibiotika-Resistenz-Gen
Nachweis und Selektion transformierter Bakterien
SelektionsdruckFehlender Selektionsdruck kann zum Verlust des Expressionsplasmids führen.
E. coliE. coli
6
PromotorPromotor
= Basensequenz, an die die RNA-Polymerase bindet (Transkriptionsinitiation)
steuert die Herstellung großer Mengen mRNA des interessierenden Gens
E. coliE. coli
Ein guter Promoter sollte folgende Eigenschaften mitbringen:
1. stark (10-30 % des Gesamtproteins sollte rekombinantes Protein sein)
2. gut regulierbar (nur geringe basale Transkription)
• Hohe konstitutive heterologe Expressionsraten beeinträchtigen häufig
den Zellmetabolismus und führen dadurch zum Absterben der Zellen.
(metabolischer Stress und genetische Instabilität)
• exprimiertes Protein könnte toxisch sein
Regulation der Promotor-AktivitätRegulation der Promotor-Aktivität
E. coliE. coli
⇒ Einsatz von induzierbaren Expressionssystemen
Induktion der Genexpression durch Metabolitzugabe
Entfernen bestimmter Kohlenstoffquellen
Temperaturveränderung
⇒ Regulation durch Expression eines Repressors
Promotoren von Expressionsvektoren sollten während der Wachstumsphase inaktivund erst nach Induktion der Genexpression aktiv sein.
7
häufig verwendete häufig verwendete induzierbareinduzierbare Promotoren Promotoren
E. coliE. coliPromotor Induktion durch
lac-Promotoren IPTG (Isopropyl-β-D-1-thiogalactopyranoside; lac Lactose-Derivat) lac/UV5 tac trc
T7 IPTG
trp Tryptophanmangel
araB Arabinose
phoA Phosphatmangel
lac-PromotorenRepressorprotein ist durch das lac I-Gen codiert.
Der lac-Repressor ist bei Abwesenheit des Effektormoleküls aktiv und bindet an den Promotor.
Das Effektormolekül/Induktor (hier IPTG) bindet an den Repressor und
löst die Bindung des Repressors an die Operator-Sequenz auf.
Regulation der Promotor-AktivitätRegulation der Promotor-Aktivität
E. coliE. coliMinimierung der basalen Transkription durch die Anwesenheit eines Repressorsz.B. durch Bindung von Regulatorproteinen an den Promoter
Der lac I-Gen liegt entweder auf dem Expressionsvektor (bei high copy Plasmiden)
oder im E. coli Genom.
z.T. werden E. coli Stämme mit einer mutierten Form des lac I Allels (lacIq) verwendet,
was zu einer 10fach höheren Repressorproduktion führt.
8
pET (plasmid for expression by T7 RNA-Polymerase)
sehr häufig verwendetes, sehr gut regulierbares Expressionssystem
pET-Vektoren besitzen den sehr starken T7-Promotor (aus dem Bakteriophagen T7)
der von der T7-RNA-Polymerase erkannt wird.
pET-SystempET-System ((NovagenNovagen))
E. coliE. coli
Regulation der Expression durch die Verwendung von E. coli Stämmen, bei denen das Gen
der T7-Phagen-RNA-Polymerase (hier des Prophagen DE3) unter der Kontrolle
des Lac/UV5-Promotors ins Chromosom integriert ist.
zum Teil auch T7 lac-Promotor T7-Promoter mit zusätzlicher downstream lac-Operator-Sequenz
pET-SystempET-System ((NovagenNovagen))
E. coliE. coli
lacI = lac-Repressor-Gen
9
Sequenz, die zur Termination der Transkription führt.
Ausbildung einer haarnadelförmigen Sekundärstruktur innerhalb der RNA,
die den Transkriptionsapparat behindert, so dass die Transkription zum Erliegen kommt.
Zusätzlich ist die mRNA dadurch stabilisiert und vor Exonukleasen geschützt.
TranskriptionsterminatorTranskriptionsterminator
E. coliE. colitranscription terminator (TT)
Initiation der Translation:
Ribosomenbindungsstelle (RBS) mit Shine-Dalgarno Sequenz (SD)
Die Shine-Dalgarno Sequenz ist 5-13 Nukleotide upstream des Startkodons lokalisiert.
(optimaler Abstand: 8 Nukleotide).
Konsensus-Sequenz: 5’-TAAGGAGG-3’.
bindet die ribosomale 16S rRNA.
Startkodon
(Translationsinitiationskodon)
Termination der Translation:
Stoppkodon (UAA in E. coli)
TranslationTranslation
E. coliE. coli
stopcodon
10
Multiple Multiple KlonierungsstelleKlonierungsstelle
multiple cloning site (MCS)
im Anschluss an die Kontrollregionen des Expressionsvektors
Sequenz mit verschiedenen Schnittstellen für Restriktionsendonukleasen
zum Einbringen einer Gensequenz in den Expressionsvektor
Schnittstellen sind einzigartig auf dem Vektor und
sollten in der das rekombinante Protein kodierenden DNA-Sequenz nicht vorkommen.
Aus den verschiedenen Restriktionsschnittstellen kann die jeweils am besten passende
ausgewählt und verwendet werden.
E. coliE. coli
Detektion und ReinigungDetektion und Reinigung
Zur Erleichterung der Detektion und der Reinigung der rekombinanten Proteine
beinhalten die Expressionsvektoren oft Sequenzen für eine/ein
• N-terminale oder C-terminale kurze Peptidsequenz (tag)• Fusionsprotein
Tags und Fusionsproteine können z.T. mit Hilfe von geeigneten spezifischen Proteasen wieder
abgespalten werden.
Vektoren weisen oft Linkerregionen auf, die für Protease-Erkennungssequenzen kodieren.
E. coliE. coli
Tags (Bsp.): Polyhistidin ⇒ Detektion, AufreinigungMyc ⇒ DetektionStrep ⇒ Detektion, Aufreinigung
Fusionsprotein (Bsp.): Glutathion-S-Transferase ⇒ Detektion, Aufreinigung
11
Kritische Punkte bei der ProteinexpressionKritische Punkte bei der Proteinexpression
Proteolyse
Disulfidverbrückung und Faltung
Toxizität
Aggregation und Bildung von Inclusion Bodies (Einschlusskörpern)
Abweichungen in der Kodon-Auswahl (Codon Usage)
E. coliE. coli
Niedrige Ausbeuten sind häufig Folge proteolytischen Abbaus
während der Kultivierung oder während der Reinigung.
⇒ Verwendung von Protease-defizienten E. coli Stämmen
E. coli BL21
defizient für lon Protease (intrazellulär)
ompT Protease (äußere Membran)
⇒ niedrige Kultivierungstemperaturen
⇒ kurze Inkubationszeiten
⇒ Stabilisierung des Proteins durch weniger anfälligen Aminoterminus
⇒ Sekretion in den periplasmatischen Raum
Vermeidung von Vermeidung von ProteolyseProteolyse
E. coliE. coli
12
DisulfidverbrückungDisulfidverbrückung und Faltung und Faltung
Viele Proteine benötigen die Ausbildung von Disulfidbrücken für die richtige Faltung und Aktivität
⇒ Transport/Sekretion in ein oxidierendes Zellkompartiment, das Periplasma
⇒ Verwendung von E. coli Stämmen mit veränderten Redoxbedingungen im Cytosol,
die die Ausbildung von Disulfidbrücken im Cytosol erlauben.
z.B. durch Inaktivierung der Thioredoxin-Reduktase
erhältlich E. coli Stämme:
AD494: Mutation der Thioredoxin-Reduktase (trxB).
Origami: Mutation der Thioredoxin-Reduktase und Glutathione-Reduktase (gor)
E. coliE. coli
PeriplasmatischePeriplasmatische Expression Expression
Die Sekretion von rekombinantem Protein in das Periplasma wird durch eine
Fusion mit einem N-terminalen Leader- oder Signalpeptid erreicht
z.B. das von OmpT, OmpA oder PelB.
Das Periplasma ist ein Zellkompartiment zwischen Cytoplasmamembran und
äußerer Membran gram-negativer Bakterien.
E. coliE. coli
13
PeriplasmatischePeriplasmatische Expression Expression
Vorteile• Expression von nativem Protein mit entsprechender Faltung möglich
• oxidierende Bedingungen im Periplasma gram-negativer Bakterien erlauben die Ausbildung von
Disulfidbrücken (≠ Cytoplasma: reduzierende Bedingungen)
• korrekte Ausbildung von Disulfidbrücken durch die im Periplasma anwesenden Foldasen,
Oxidasen und Protein-Disulfid-Isomerasen (z.B. DsbA, DsbC)
• Aggregatbildung kann unterdrückt werden
• reduzierte Proteolyse (weniger Proteine anwesend)
• im Cytoplasma toxische Proteine können im Periplasma akkumuliert werden.
E. coliE. coli
Nachteile• relativ niedriges Expressionsniveau
• durch den limitierenden Membrantransport z.T. Akkumulation von Vorläuferproteinen
im Cytoplasma
InclusionInclusion BodiesBodies (Einschlusskörper) (Einschlusskörper)
Intrazelluläre Aggregate von zumeist
fehlerhaft oder unvollständig gefalteten Proteinen
(bis zu 50% des gesamten Proteingehalts)
Eines der Hauptprobleme bei der Expression v.a. hydrophober rekombinanter
Proteine unter einem starken Promotor
Proteine in Inclusion Bodies sind meist inaktiv und denaturiert.
E. coliE. coli
Vorteile• Expression sehr großer Proteinmengen möglich
v.a. von Vorteil, wenn Protein renaturierbar ist oder denaturiert verwendet werden kann
• Inclusion Bodies enthalten häufig exklusiv das rekombinante Protein.
• Inclusion Bodies verleihen den Proteinen einen gewissen Schutz vor proteolytischem Abbau.
• Auch toxische Proteine können so in relativ großen Mengen im Cytosol exprimiert werden.
14
InclusionInclusion BodiesBodies
E. coliE. coliReinigung rekombinanter Proteine aus Inclusion Bodiesbei gleichzeitiger Wiederherstellung der biologischen Aktivität (kritischer Punkt)
1 Isolation der Inclusion Bodies durch Zentrifugation nach Zellaufschluss
2. Lösung der aggregierten Proteine mit denaturierenden Agenzien
(8M Urea, 6M Guanidine-HCl).
3. Renaturierung der Proteine durch Dialyse
4. Reinigung des nativen Proteins
Erhöhung der Löslichkeit Erhöhung der Löslichkeit rekombinanterrekombinanter Proteine Proteine
E. coliE. coli• Sekretion ins Periplasma
• Vermeidung der Ausbildung von Inclusion Bodies:
⇒ Expression zusammen mit einem Fusionsprotein, dass die Löslichkeit des
rekombinanten Proteins erhöbt
z.B. Glutathion-S-Transferase (GST)
N utilizations substance A (NusA)
⇒ Reduktion der Temperatur während der Proteinexpression auf 20°C
15
Kodon-AuswahlKodon-Auswahl ( (codoncodon usageusage))
= Häufigkeit der Verwendung bestimmter Kodons und der damit verbundenen
Anpassung der Expression der entsprechenden tRNAs
• nicht alle 61 möglichen mRNA Kodons werden von verschiedenen Spezies
mit der gleichen Frequenz verwendet
• Konzentration bestimmter tRNAs kann dadurch für eine effiziente Expression des
gewünschten Proteins zum limitierenden Faktor werden.
⇒ Seltene Kodons können den Translationsprozess verlangsamen
und zur Anhäufung verkürzter Formen des gewünschten Proteins führen.
E. coliE. coli
Kodon-AuswahlKodon-Auswahl ( (codoncodon usageusage))
E. coliE. coliKodons, die mit Translationsproblemen in E. coli assoziiert sind:
Mittlerweile erhältliche E. coli Stämme,die von einem Helferplasmid seltene tRNAs exprimieren:
16
Hefen-ExpressionssystemeHefen-Expressionssysteme
Vorteile• Organismus gut bekannt
• Kultivierung und Manipulation ausführlich beschrieben
• einfache Handhabung
• kurze Generationszeit
• einfache und kostengünstige Medien (im Vergleich zu Medien für Insekten- und Säugerzellen)
• fast alle posttranslationale Modifikationen, Proteinprozessierungen- und Sekretionsmechanismen höherer eukaryontischer Zellen
(korrekte Faltung der Proteine, Bildung von Disulfidbrücken, Glykosylierungen,
Phosphorylierungen etc.)
Nachteile• einige posttranslationelle Glykosylierungen abweichend von Säugerzellen
• Ausbeuten niedriger als z.B. bei E. coli
PichiaPichia pastorispastoris versusversus SaccharomycesSaccharomyces cerevisiaecerevisiae
Nachteile der Proteinexpression in Saccharomyces cerevisiae:
• kein starker, induzierbarer Promotor
• vergleichsweise niedrige Produktausbeute (1-5 % des Gesamtproteins)
• heterologe Expression des Proteins während der Wachstumsphase behindert das Wachstum
• z.T. Hyperglykosylierung von rekombinanten Proteinen
⇒ Probleme mit der Immunogenität und reduzierte Aktivität
• häufig nur schwache Sekretion von Fremdproteinen in den Kulturüberstand.
17
Vorteile der Proteinexpression in Pichia pastoris (1)
• Pichia pastoris kann unter ähnlichen Konditionen kultiviert werden wie S. cerevisiae
⇒ methylotrophe Hefe: Wachstum mit Methanol als einzige Kohlenstoffquelle möglich
• Verfügbarkeit eines sehr starken, streng regulierten Promotors
• extrem hohe Produktionsraten bei intrazellulär lokalisierten Proteinen
• viele Proteine können effektiv in das nahezu proteinfreie Medium sezerniert werden
⇒ N-terminales α-Faktor Sekretionssignal
• einfache und effiziente Anzucht im Fermenter zu extrem hohen Zelldichten
• im Gegensatz zu S. cerevisiae stark reduzierte alkoholische Gärung
d.h. selbst bei hohen Zellzahlen keine toxischen Ethanolkonzentrationen
PichiaPichia pastorispastoris versusversus S. S. cerevisiaecerevisiae
Vorteile der Proteinexpression in Pichia pastoris (2)
• wesentlich seltener Hyperglykosylierung rekombinanter Proteine
keine Ausbildung stark immunogener α-1,3-mannosidischen Bindungen
Glykosylierungsmuster ähnlich dem in humanen Zellen
• Integration des rekombinanten Vektors in das P. pastoris-Genom führt zu stabilen Klonen
PichiaPichia pastorispastoris versusversus S. S. cerevisiaecerevisiae
18
Pichia pastoris Vektoren sind E. coli shuttle VektorenKlonierung im E.coli Hintergrund E. coli Replikationsursprung (ori) E. coli Resistenzgen
Expressionskassette für P. pastoris• AOX1 promoter• α-mating factor Signalsequenz (Sig) von S. cerevisiae (für Sekretion)• Multiple Klonierungsstelle (MCS)• Transkriptionsterminator• Kozak-Sequenz (Translationsinitiation)
Selektionsmarker (oft his-4; Histidinol-Dehydrogenase-Gen)zur Selektion auf Histidin-Mangelmedium von transformierten his- Stämmen
5‘- und 3‘- AOX1 Sequenzen erlauben die Rekombinationmit dem AOX1 Locus im Pichia pastoris Genome (zielgerichtete Plasmidintegration)
Aufbau eines Expressionsvektors für Aufbau eines Expressionsvektors für P. P. pastorispastoris
Alkoholoxidase 1 Promotor (AOX1)
• sehr effiziente Regulation
• vollständig reprimierbar durch Glucose und hohe Konzentrationen anderer Kohlenstoffquellen
• starke Induktion bei Wachstum auf Methanol als einzige C-Quelle
• induzierbarer Promoter erlaubt eine hohe Wachstumsrate vor der Proteinproduktion
(wichtig für Expression von toxischen Proteinen)
AOX1-PromotorAOX1-Promotor
19
P. pastoris besitzt keine eigenen stabilen, episomalen Plasmide
⇒ Zur Expression fremder Gene werden die Expressionsvektoren ins Genom integriert
Vektoren werden vor der Transformation linearisiert (Vektorinterne Restriktionsschnittstellen)
Integration erfolgt über homologe Rekombination
Integration des Expressionsvektors ins GenomIntegration des Expressionsvektors ins Genom
Single crossover Event:(Integration)AOX, (his-4)
Integration des Expressionsvektors ins GenomIntegration des Expressionsvektors ins Genom
20
Double crossover Event(Genaustausch):AOX, (his-4)
Integration des Expressionsvektors ins GenomIntegration des Expressionsvektors ins Genom
Klonierung der gewünschten Gensequenz in den Expressionsvektor
Linearisierung des Expressionsvektors
Transformation kompetenter Hefezellen (his-) mit der linearisierten Plasmid-DNA durch Elektroporation
Selektion von positiven Klonen auf Platten mit Histidin-Mangelmedium
Animpfen von Expressionskulturen mit verschiedenen Klonen, um das individuelle Expressionslevel zu bestimmen.
Wachstum der Hefeklone in komplexem Glycerol-Medium (BMGY); 2 Tage
Induktion der Proteinexpression durch Zugabe von Methanol zum Medium
Analyse der Hefekulturüberstände nach 2-4 Tagen (z.B. im Westernblot)
Proteinexpression in Proteinexpression in PichiaPichia pastorispastoris