dr. prohászka zoltán az mta doktora semmelweis egyetem iii. sz. belgyógyászati klinika...

33
A biostatisztikai elemzés helye az orvostudományban III. A klinikai epidemiológia és populációgenetika alapfogalmai és az alkalmazott statisztikai módszerek Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem III. Sz. Belgyógyászati Klinika 2013-05-09 [email protected]

Upload: aquila-mccarthy

Post on 03-Jan-2016

35 views

Category:

Documents


0 download

DESCRIPTION

A biostatisztikai elemzés helye az orvostudományban III. A klinikai epidemiológia és populációgenetika alapfogalmai és az alkalmazott statisztikai módszerek. Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem III. Sz. Belgyógyászati Klinika 2013-05-09 [email protected]. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

A biostatisztikai elemzés helye az orvostudományban III.

A klinikai epidemiológia és populációgenetika alapfogalmai és az alkalmazott statisztikai

módszerek

Dr. Prohászka ZoltánAz MTA doktora

Semmelweis Egyetem III. Sz. Belgyógyászati Klinika

[email protected]

Page 2: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

Epidemiológia

• A betegségek előfordulásának leírása, az okok feltárásának segítése– A genetikai és környezeti tényezők együttes

hatásának vizsgálata, ill. törekvés ezek közötti különbségtételre

• Genetikai epidemiológia: a betegségek esetleges öröklődésének vizsgálata, genetikai meghatározttságuk igazolása, feltárása

Page 3: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

A genetikai epidemiológiai módszerekkel megválaszolható kérdések

• Van családi halmozódás? • Van arra utaló adat, hogy a betegség genetikai meghatározottságú? • Kimutatható valamely genetikai modell? • Hol található a betegséget meghatározó gén? • Mi a betegség keletkezésének mechanizmusa?

Page 4: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

A(z genetikai) epidemiológia során használt fogalmak, módszerek, folyamatok

• Deskriptív epidemiológia: hipotézis generálás

http://info.cancerresearchuk.org/cancerstats/types/breast/incidence/uk-breast-cancer-incidence-statistics

Breast Cancer (C50), World Age-Standardised Incidence Rates, Females, World Regions, 2008 Estimates

Page 5: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

Hipotézis generálás genetikai epidemiológiai adatokkal

• Nemzetközi variabilitás a fenotípusban– Életkorra illesztett incidencia és prevalencia adatok

• Migrációs vizsgálatok– Környezeti és genetikai meghatározottság közötti

különbségtételre ad lehetőséget• Rasszok, etnikumok és szocio-ökonomikus csoportok

közötti különbségek elemzése• Admixture vizisgálatok (beházasodás)• Nemi különbségek

– X és Y kromoszómához kötött betegségek, hormonális hatások, környezeti-viselkedési hatások

• Életkor hatása– Családi halmozódású betegségforma általában hamarabb

kezdődik, mint a sporadikus (pl. retinoblasztoma: two-hit model)

Page 6: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

A genetikai epidemiológia során használt módszerek, folyamatok

• Deskriptív epidemiológia• Családi halmozódás: hipotézis alátámasztása

Genetic studies into inherited and sporadic hemolytic uremic syndromeWarwicker and Goodship, 1998

Page 7: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

Családvizsgálatok

• Fenotípus: folytonos vagy diszkrét? • Családfa:

– Nuclear family, beteg-pár, teljes család, ikrek és case-control vizsgálat (pl. emlőrákosok rokonai vs. biztosan nem azok)

• Gyakorlott kérdező és előzetes kérdéssor a biztosítéka a pontos adatok nyerésének

• Ikervizsgálatok• Adoptációs vizsgálatok• Vérrokonság

Page 8: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

A genetikai epidemiológia során használt módszerek, folyamatok

• Deskriptív epidemiológia• Családi halmozódás• Szegregációs vizsgálat: a genetikai modell

tesztelése– A családok tagjain tett megfigyelések (fenotípus)

alapján felépített genetikai modellek vizsgálata (molekuláris adatok nélkül)

– Egy vagy több génes-e betegség? Öröklésmenet domináns, recesszív, ko-domináns, egyéb?

Page 9: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

Washington University (www)

Page 10: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

Modes of inheritance

Page 11: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

A genetikai epidemiológia során használt módszerek, folyamatok

• Deskriptív epidemiológia• Családi halmozódás• Szegregációs vizsgálat: a genetikai modell

tesztelése• Linkage analízis• Asszociációs vizsgálat

Fogékonysági vagy rizikó gének felismerésére alkalmas módszerek

Page 13: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

Linkage Association

Linkage is a property of loci Association is a property of alleles

Role:* To identify a biological mechanism for transmission of a trait* To locate the gene involved

Role: * To identify association between an allelic variant and a disease* To identify linkage disequilibrium between a disease allele and a marker

Coarse mapping (>1cM) Fine mapping (<1cM)

No information about which allelic variant associated with higher risk of disease

 

Require family pedigrees Case-control or family based approach

Use very polymorphic markers Usually bi-allelic markers

Differences between linkage and association

Page 14: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

Linkage analízis• Felhasznált elvek:

– A különböző kromoszómákon található gének egymástól függetlenül szegregálódnak

– Az egy kromoszómán található gének közötti fizikai távolság növekedésével a rekombináció valószínűsége nő

• Érintett családok több tagjában is meghatározásra kerülnek polimorf, ismert lokalizációjú markerek

• Rekombinációs események követhetőek, melyből a feltételezett lókusz pozíciója nagyjából meghatározható– LOD-score módszer (LOD: logarithm of likelihood ratio)– Beteg testvér módszer

• Finomtérképezés– LD-map– Haplotipizálás, szekvenálás– Loss-of heterozygosity

Page 15: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

Asszociációs vizsgálatok

• Populációs (case-control)

• Családi (proband-parent trio, transmission-disequlibrium test)

Page 16: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

ROCHE Genetic Education (www)

Odds Ratio: 3.695% CI = 1.3 to 10.4

Page 17: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

Milyen okok vezethetnek inkonzisztens eredményekhez asszociációs vizsgálatokban?

• Betegek (fenotípus) és kontrollok eltérő definiálása• Genetikai heterogenitás populációk között• Random error• Tervezési és kiertékelési különbségek

– Fenotípus nem megfelelő definiálása (az is betegcsoportba kerül, aki valójában nem beteg)

– Kontroll csoport nem megfelelő választása (betegek vagy rokonok is bekerülnek)

– Alcsoport/ high-throughput analízis esetén a többszörös összehasonlítás eredményének korrekciója elmarad (Bonferroni)

– Kis mintaszám– A replikációs vizsgálat mellőzése

Page 18: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

Hum Genet. 1991 Apr;86(6):595-8.A marked drop in the incidence of the null allele of the B gene of the fourth component of complement (C4B*Q0) in elderly subjects: C4B*Q0 as a probable negative selection factor for survival.Kramer J, Fülöp T, Rajczy K, Nguyen AT, Füst G.

Department of Immunopathology, National Institute of Haematology and Blood Transfusion, Budapest, Hungary.

Ann N Y Acad Sci. 2003 Dec;1010:496-9.An age-associated decrease in the frequency of C4B*Q0 indicates that null alleles of complement may affect health or survival.Arason GJ, Bödvarsson S, Sigurdarson ST, Sigurdsson G, Thorgeirsson G, Gudmundsson S, Kramer J, Füst G.

Department of Immunology, Institute of Laboratory Medicine and Department of Medicine, Landspítali University Hospital, LSH Hringbraut, 101 Reykjavík, Iceland. [email protected]

Page 19: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

A fenotípus….

Page 20: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

rr 200 white

Rr R500 pink

RR 300 red

• genotype frequencies

• allele frequencies

200/1000 = 0.2 rr

500/1000 = 0.5 Rr

300/1000 = 0.3 RR

total = 1000 flowers

genotypefrequencies:

A genetikai meghatározottság

elemzése

Page 21: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

200 rr

500 Rr

300 RR

• genotype frequencies

• allele frequencies

900/2000 = 0.45 r

1100/2000 = 0.55 R

total = 2000 alleles

allelefrequencies:

= 400 r

= 500 r= 500 R

= 600 R

Describing genetic structure

Page 22: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

A Hardy-Weinberg elv• Az aktuálisan evolúciós hatásnak ki nem tett populáció génkészlete

több generáción keresztül egyensúlyban marad, azaz teljesül az elv• Feltételezve, hogy egy jelleget a lókusz p és q alléljei határoznak

meg, érvényesül hogy• 1=p+q (allélfrekvenciák összege)

• Azaz a genotípusok eloszlására érvényes a következő összefüggés (Hardy-Weinberg egyenlet):

• 1.0 = p2 + 2pq + q2

•  Ahol:• p2 = az AA genotípus gyakorisága• 2pq = az Aa genotípus gyakorisága• q2 = az aa genotípis gyakorisága

Page 23: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

A HW elv teljesülése

• A HW elv egy ideális helyzetre vonatkozik (modell)

• A valós helyzet lényegesen eltér ettől• A HW elv ideálistól való eltérését okozzák

– Ha az egyedek nem diploidok– Vannak ivartalan szaporodási események– A generációk átfedőek– A párválasztás nem véletlenszerű– A populáció mérete nem végtelen (korlátozott)– Az allélfrekvenciák eltérőek a nemekben– Van migráció, változik a mutációs ráta és szelekció

érvényesül

Page 24: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

A HW elv teljesülésének tesztelése kísérleteink, vizsgálataink során

• Kötelező

• A kontroll minta genotípus eloszlásának adott pillanatban meg kell felelnie a HW egyensúlynak

• Ha egy minta genotípus eloszlása eltérést mutat a HW egyensúlytól, az több dologra utalhat:

– Genotipizálási hiba (kontroll csík!!)– Mintavételezési hiba– Szelekciós, mutációs hatás vagy egyéb tényezők (rokonházasság, nem random

párválasztás, migráció, nemi kapcsoltság)

Írd ide a vad/vad genotípust hordozók számát: 23 27 Várhatóan vad/vad genotípust hordozók számaÍrd ide a vad/variáns genotípust hordozók számát: 45 38 Várhatóan vad/variáns genotípust hordozók száma

Írd ide a variáns/variáns genotípust hordozók számát: 10 14 Várhatóan variáns/variáns genotípust hordozók számaÖsszes vizsgált száma: 78 78

vad allél frekvenciája: 0,583333variáns allél frekvenciája: 0,416667

Eltérés a HW-egyenlőségtől: NEMChi négyzet próba, p= 0,256387

Page 25: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

Milyen analízist végezhetünk a

különböző öröklésmenetű

betegségek esetén?

Page 26: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

A chi-négyzet próba• Tegyük fel, hogy 200 személyt vontunk be vizsgáltunkba, a csoport fele beteg,

míg másik fele képezte a kontrollt • A 200 személy közül 50 esetében találtunk rizikó genotípust, míg 150

személynél nem.

Csoport Beteg Kontroll

Nem rizikó genotípus

150

Rizikó genotípus 50

100 100 200

Page 27: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

A chi-négyzet próba• Ha a rizikó genotípus és a betegség között nem állna fenn kapcsolat (azok

függetlenek lennének), akkor a betegek és a kontrollok csoportjában az emberek 25–25%-a esne a rizikó genotípus kategóriába (null-hipotézis).

• A várható előfordulási gyakoriságokat a táblázat széli gyakoriságaival (marginal frequency, a sorok és oszlopok összesített értékei) számíthatjuk ki, feltételezve, hogy ezek a számok adottak egy vizsgálatban.

Várható (expected) előfordulási gyakoriság

Csoport Beteg Kontroll

Nem rizikó genotípus

75 75 150

Rizikó genotípus 25 25 50

100 100 200

Page 28: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

A megfigyelt gyakoriságok

• A chi-négyzet teszt alapfeltevése az, hogy a várt és a megfigyelt eloszlási gyakoriságok között nincs különbség

• Ha a táblázat oszlopait és sorait meghatározó jellegzetességek egymással kapcsolatot mutatnak, akkor a várt és a megfigyelt eloszlások egymástól lényegesen eltérnek

• Az eltérés mértékét fejezi ki a chi-négyzet értéke. Esetünkben a betegcsoportban jóval nagyobb a rizikógenotípus frekvenciája, mint a kontroll csoportban, vagyis levonhatjuk azt a következtetést, hogy a betegség kapcsolatban van a rizikó genotípussal, a chi-négyzet értéke utal a kapcsolat erősségére.

Megfigyelt (observed) előfordulási gyakoriság

Csoport Beteg Kontroll

Nem rizikó genotípus

60 90 150

Rizikó genotípus

40 10 50

100 100 200

Page 29: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

A példa számaival végzett chi-négyzet próba eredménye

Chi-négyzet: Szabadsági fok: p-értéke: Egy- vagy kétoldalas a p?

24,001<0,0001Két oldalas

Relatív kockázat (RR) (95% CI)Esélyhányados (OR) (95% CI)

2,0 (1,57–2,54)6,0 (2,79–12,91)

Prospektív kohorsz

Eset-kontroll

Page 30: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

Az esélyhányados (odds ratio)

• A esélyhányados a kockázat becslésére szolgál, és leggyakrabban eset-kontroll tanulmányok során találkozunk alkalmazásával.

• Az OR annak az esélye, hogy egy eseményt elszenvedett személy (beteg) a rizikófaktornak (rizikó allél) ki volt téve, osztva annak az esélyével, hogy egy eseményt el nem szenvedett személy (kontroll) nem volt kitéve a rizikófaktornak

• Példánk eset-kontrollos vizsgálat volt (induláskor tudtuk ki beteg és ki a kontroll), így helyesen odds ratio-t lehet számolni

• Példánkban 10* 60/40*90=6

Page 31: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

A relatív kockázat (relative risk)

• A relatív kockázat, melynek jelölése általánosan RR (relative risk), mindig egy adott beteg csoport és egy adott kontroll csoport vonatkozásában fejezhető ki, és az adott betegségre vonatkozik.

• Kiszámításakor a rizikóhatásnak kitett (exposed) és a ki nem tett (non-exposed) csoportokban megfigyelt betegség incidenciákat osztjuk egymással.

• A relatív kockázat a két csoport esemény rátáinak hányadosa. • Példánknál maradva, a betegség relatív rizikója 40/50 osztva

60/150 azaz 2. • Relatív rizikót prospektív kohorsz vizsgálatban lehet megállapítani

(induláskor mindenki egészséges). • Példánkból helyesen nem lehet relative risket számolni

Page 32: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

A genetikai epidemiológia során használt módszerek, folyamatok

• Deskriptív epidemiológia• Családi halmozódás• Szegregációs vizsgálat: a genetikai modell

tesztelése• Linkage analízis• Asszociációs vizsgálat• Klónozott gének funkcionális vizsgálata

Fogékonysági vagy rizikó gének felismerésére alkalmas módszerek

Page 33: Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem  III. Sz. Belgyógyászati Klinika 2013-05-09

Szekvencia variációkSzekvencia variációk

Mutáció < 1% < Polimorfizmus

Egyedek közti különbség = 0.1%