muster in der dna replikationsursprung im virus hcmv
TRANSCRIPT
Muster in der DNAMuster in der DNA
Replikationsursprung im Virus Replikationsursprung im Virus HCMVHCMV
Grundlegende DefinitionenGrundlegende Definitionen
DNA (deoxyribose nucleic acid):DNA (deoxyribose nucleic acid): Informationsträger für Lebensprozesse Informationsträger für Lebensprozesse (z.B. Vermehrung)(z.B. Vermehrung)
Gen:Gen: Sequenz in der DNA, die ein Sequenz in der DNA, die ein Protein mit gewisser Funktion codiertProtein mit gewisser Funktion codiert
Genom:Genom: Gesamtgenbestand einer Zelle Gesamtgenbestand einer Zelle Genomics:Genomics: Erforschung von Lebewesen Erforschung von Lebewesen
unter voller Kenntnis der DNA-Sequenzunter voller Kenntnis der DNA-Sequenz
Aufbau der DNAAufbau der DNA
Nucleotid:Nucleotid: stickstoffhaltige stickstoffhaltige Base + Zucker + Base + Zucker + PhosphatrestPhosphatrest
Basen:Basen: Pyrimidine: Pyrimidine: TThymin, hymin, CCytosinytosin Purine: Purine: AAdenin, denin, GGuaninuanin
DNA ist PolynucleotidketteDNA ist Polynucleotidkette KomplementKomplement zu ACGT ist zu ACGT ist
TGCATGCA
DNA ist DoppelhelixDNA ist Doppelhelix
Replikation von DNAReplikation von DNA
Replikation:Replikation: Prozess des Kopierens Prozess des Kopierens von DNAvon DNA
Initiation der Replikation erfolgt Initiation der Replikation erfolgt durch das durch das PrimosomPrimosom
Synthese der Tochterstränge erfolgt Synthese der Tochterstränge erfolgt durch das durch das ReplisomReplisom
Replikationsursprung:Replikationsursprung: Stelle in der Stelle in der DNA, an der Replikation initiiert wirdDNA, an der Replikation initiiert wird
Human CytomegalovirusHuman Cytomegalovirus(HCMV)(HCMV)
Virus:Virus: von Proteinhülle (Kapsid) umgebene von Proteinhülle (Kapsid) umgebene DNADNA
HCMV ist Virus der Herpes-Familie und hat HCMV ist Virus der Herpes-Familie und hat Inzidenz von 30-80% (latent)Inzidenz von 30-80% (latent)
Länge von HCMV: 229 354 bLänge von HCMV: 229 354 b in produktivem Zyklus gefährlich für in produktivem Zyklus gefährlich für
Menschen mit geschwächtem Immunsystem:Menschen mit geschwächtem Immunsystem: TransplantationspatientenTransplantationspatienten AIDS-PatientenAIDS-Patienten
Human CytomegalovirusHuman Cytomegalovirus(HCMV)(HCMV)
Auswirkungen (teils lethal): Auswirkungen (teils lethal): LungenentzündungLungenentzündung neurologische Störungenneurologische Störungen Magen-Darm-KrankheitenMagen-Darm-Krankheiten angeborene Taubheitangeborene Taubheit
ForschungszielForschungsziel
Auffinden des ReplikationsursprungsAuffinden des Replikationsursprungs Kennzeichen in der DNA-Sequenz Kennzeichen in der DNA-Sequenz
sind vermutlich Anhäufungen sind vermutlich Anhäufungen sogenannter Palindromesogenannter Palindrome
Palindrom:Palindrom: Sequenz, die mit ihrem Sequenz, die mit ihrem umgekehrt gelesenen Komplement umgekehrt gelesenen Komplement übereinstimmt, z.B. GGGCATGCCCübereinstimmt, z.B. GGGCATGCCC
Entwicklung eines ImpfstoffesEntwicklung eines Impfstoffes
DatenDaten
Positionen der insgesamt 296 Positionen der insgesamt 296 Palindrome mit Länge Palindrome mit Länge 10 b 10 b
zu häufige Palindrome (z.B. AT) zählt zu häufige Palindrome (z.B. AT) zählt man dabei nichtman dabei nicht
Hypothese: Palindrome sind auf der Hypothese: Palindrome sind auf der DNA gleichverteiltDNA gleichverteilt
χχ22-T-Test auf Gleichverteilungest auf Gleichverteilung
Segmentierung der DNA in 10 gleich lange Segmentierung der DNA in 10 gleich lange AbschnitteAbschnitte
SegmentSegment 11 22 33 44 55
beobachtetbeobachtet 2929 2121 3232 3030 3232
erwarteterwartet 29.629.6 29.629.6 29.629.6 29.629.6 29.629.6
SegmentSegment 66 77 88 99 1010
beobachtetbeobachtet 3131 2828 3232 3434 2727
erwarteterwartet 29.629.6 29.629.6 29.629.6 29.629.6 29.629.6
χχ22-T-Test auf Gleichverteilungest auf Gleichverteilung
R-Code:R-Code: l<-read.table("HCMV.txt",header=TRUE)[,1]l<-read.table("HCMV.txt",header=TRUE)[,1] v<-cut(l,breaks=22935.4*(0:10))v<-cut(l,breaks=22935.4*(0:10)) f<-as.vector(table(v))f<-as.vector(table(v)) p<-rep(0.1,10)p<-rep(0.1,10) chisq.test(f,y=NULL,correct=TRUE,p)chisq.test(f,y=NULL,correct=TRUE,p)
p-Wert = 0.90p-Wert = 0.90
Homogener Poisson-ProzessHomogener Poisson-Prozess
Fasse gleichverteilte Palindrome als Fasse gleichverteilte Palindrome als unabhängige Treffer auf der DNA auf. unabhängige Treffer auf der DNA auf.
X... Anzahl der Treffer in TeilintervallX... Anzahl der Treffer in Teilintervall hängt nicht von der Position des hängt nicht von der Position des
Teilintervalls ab, nur von dessen LängeTeilintervalls ab, nur von dessen Länge ist für disjunkte Intervalle unabhängigist für disjunkte Intervalle unabhängig
P(X=k) = P(X=k) = λλkk/k! e/k! e--λλ
χχ22-T-Test auf Poisson-est auf Poisson-VerteilungVerteilung
57 Intervalle à 4000 b57 Intervalle à 4000 b P-Wert = 0.98P-Wert = 0.98
Anzahl der PalindromeAnzahl der Palindrome beobachte Intervallzahlbeobachte Intervallzahl erwartete Intervallzahlerwartete Intervallzahl
0-20-2 77 6.46.4
33 88 7.57.5
44 1010 9.79.7
55 99 10.010.0
66 88 8.68.6
77 55 6.36.3
88 44 4.14.1
99 66 4.54.5
gesamtgesamt 5757 5757
χχ22-T-Test auf maximale est auf maximale PalindromzahlPalindromzahl
Teilung der DNA in 57 Intervalle à Teilung der DNA in 57 Intervalle à 4000 b4000 b
Schätzwert Schätzwert λλ = 5.16 = 5.16 größte Beobachtung: 14größte Beobachtung: 14 P(Maximum P(Maximum 14) = 0.06 14) = 0.06
SchlussfolgerungenSchlussfolgerungen
Sowohl Hypothese der Sowohl Hypothese der Gleichverteilung der Palindrome als Gleichverteilung der Palindrome als auch der Poisson-Verteilung für die auch der Poisson-Verteilung für die Trefferzahl sind stichhaltig.Trefferzahl sind stichhaltig.
Das gezählte Maximum an Treffern Das gezählte Maximum an Treffern ist aber recht unwahrscheinlich, also ist aber recht unwahrscheinlich, also könnte man Replikationsursprung im könnte man Replikationsursprung im zugehörigen Intervall suchen.zugehörigen Intervall suchen.