teste de hipóteses em genética - remendel.ufpr.br · •resultados semelhantes àqueles descritos...

45
Teste de Hipóteses em Genética Professora Lupe Furtado Alle Email: [email protected]

Upload: hoangkhanh

Post on 13-Dec-2018

222 views

Category:

Documents


0 download

TRANSCRIPT

Teste de Hipóteses em Genética

Professora Lupe Furtado Alle

Email: [email protected]

AS HIPÓTESES GENÉTICAS

Após a redescoberta do trabalho de Mendel:

• Muitos estudos foram realizados para descobrir o

mecanismo de herança de características em diferentes

organismos;

• Resultados semelhantes àqueles descritos por Mendel

para as características das ervilhas de jardim;

• Hipótese genética: características estudadas herdadas

de acordo com os Princípios de Mendel e suas

extensões.

AS HIPÓTESES GENÉTICAS E O TESTE DE QUI-QUADRADO (2)

• Teste estatístico para comparar proporções.

• Comparar os resultados observados em um

estudo com os resultados que esperados de

acordo com a hipótese em questão – Teste de

2 de Aderência ou de Concordância.

• Linhagens puras de camundongos com

características contrastantes: orelhas grandes

e orelhas pequenas.

• Camundongos com orelhas grandes X

camundongos com orelhas pequenas

– F1: camundongos com orelhas grandes

– F2: 155 com orelhas grandes e 45 com orelhas

pequenas.

• Hipótese: O tamanho das orelhas nos

camundongos tem herança mendeliana e o

alelo P (orelhas grandes) é completamente

dominante em relação ao alelo p (orelhas

pequenas).

• Resultados obtidos nos cruzamentos

monoíbridos das ervilhas de jardim, comparar

com os resultados dos camundongos e realizar

o teste de Qui-Quadrado (2).

• A proporção esperada em F1 é:

– 3 camundongos com orelhas grandes: 1

camundongo com orelhas pequenas.

Fenótipo de F2 Observado

(O)

Esperado (E) (O – E)

Orelhas grandes 155 (¾) x 200 = 150 (155 – 150) = 5

Orelhas pequenas 45 (¼) x 200 = 50 (45 – 50) = – 5

Total 200 200 0

Fenótipo de F2 Observado (O) Esperado (E) (O – E) (O – E)2/E

Orelhas grandes 155 (¾) x 200 = 150 (155- 150) = 5 (5)2/150 = 0,167

Orelhas pequenas 45 (¼) x 200 = 50 (45 – 50) = – 5 (–5)2/50 = 0,50

Total 200 200 0 (d2/E) = 0,667

(d2/E) é o valor de 2 calculado que deve ser

comparado a um valor na tabela da distribuição de

2 .

• O número de graus de liberdade (GL) é calculado:

• GL = número de classes fenotípicas – 1,

No nosso exemplo:

• GL = número de classes fenotípicas – 1 = 2 – 1 = 1

• O nível de significância () representa a

probabilidade máxima de erro que se tem ao

se rejeitar a hipótese nula (erro do tipo I).

• A maior parte dos trabalhos científicos utiliza

um nível de significância de 5% (0,05).

• Hipótese nula (H0): as freqüências observadas

não são significativamente diferentes das

freqüências esperadas.

• Hipótese alternativa (H1): as freqüências

observadas são significativamente diferentes

das freqüências esperadas.

• A tomada de decisão é feita comparando-se

os dois valores de 2 :

– Se 2 calculado > ou = 2 tabelado: Rejeita-

se Ho.

– Se 2 calculado < 2 tabelado: Aceita-se Ho.

Nível de significância () GL

0,99 0,95 0,90 0,80 0,70 0,50 0,30 0,20 0,10 0,05 0,02 0,01 0,001

1 ,0002 0,004 0,016 0,064 0,148 0,455 1,074 1,642 2,706 3,841 5,412 6,635 10,827

2 0,020 0,103 0,211 0,446 0,713 1,386 2,408 3,219 4,605 5,991 7,824 9,210 13,815

3 0,115 0,352 0,584 1,005 1,424 2,366 3,665 4,642 6,251 7,815 9,837 11,345 16,266

4 0,297 0,711 1,064 1,649 2,195 3,357 4,878 5,989 7,779 9,488 11,668 13,277 18,467

5 0,554 1,145 1,610 2,343 3,000 4,351 6,064 7,289 9,236 11,070 13,388 15,080 20,515

6 0,872 1,635 2,204 3,070 3,828 5,348 7,231 8,558 10,645 12,592 15,033 16,812 22,457

7 1,239 2,167 2,833 3,822 4,671 6,346 8,383 9,803 12,017 14,067 16,622 18,475 24,322

8 1,646 2,733 3,490 4,594 5,527 7,344 9,524 11,030 13,362 15,507 18,168 20,090 26,125

9 2,088 3,325 4,168 5,380 6,393 8,343 10,656 12,242 14,684 16,919 19,679 21,666 27,877

10 2,558 3,940 4,865 6,179 7,267 9,342 11,781 13,442 15,987 18,307 21,161 23,209 29,588

11 3,053 4,575 5,578 6,989 8,148 10,341 12,899 14,631 17,275 19,675 22,618 24,725 31,264

12 3,571 5,226 6,304 7,807 9,034 11,340 14,011 15,812 18,549 21,026 24,054 26,217 32,909

13 4,107 5,892 7,042 8,634 9,926 12,340 15,119 16,985 19,812 22,362 25,472 27,688 34,528

14 4,660 6,571 7,790 9,467 10,821 13,339 16,222 18,151 21,064 23,685 26,873 29,141 36,123

15 5,229 7,261 8,547 10,307 11,721 14,339 17,322 19,311 22,307 24,996 28,259 30,578 37,697

16 5,812 7,692 9,312 11,152 12,624 15,338 18,418 20,465 23,542 26,296 29,633 32,000 39,252

17 6,408 8,672 10,085 12,002 13,531 16,338 19,511 21,615 24,769 27,587 30,995 33,409 40,790

18 7,015 9,390 10,865 12,857 14,440 17,338 20,601 22,760 25,989 28,869 32,346 34,805 42,312

19 7,633 10,117 11,651 13,716 15,532 18,338 21,689 23,900 27,204 30,144 33,687 36,191 43,820

20 8,260 10,851 12,443 14,572 16,266 19,337 22,775 25,038 28,412 31,410 35,020 37,566 45,315

• Exemplo 2:

Se um experimento conduzido numa

determinada população apresentou na

geração F2: 37 AA; 40 Aa e 23 aa, podemos

afirmar que a proporção em F2 está de acordo

com a segregação alélica proposta por

Mendel?

Genótipo de F2 Observado (O) Esperado (E) (O – E) (O – E)2/E

AA 37 (¼) x 100 = 25 (37 – 25) = 12 (11)2/25 = 5,76

Aa 40 (½) x 100 = 50 (40 – 50) = – 10 (–10)2/50 = 2

aa 23 (¼) x 100 = 25 (23 – 25) = – 2 (–2)2/25 = 0,16

Total 100 100 0 (d2/E) = 7,92

H0: 1/4AA: 1/2Aa: 1/4aa

2 calculado= 7,92; GL = 2 e = 5%

2 tabelado = 5,991

Qual é a conclusão?

01) Um pesquisador quer identificar a interaçãoentre dois alelos do gene que determina corda pelagem em uma raça de cães. Cruzouindivíduos pretos puros com indivíduosbrancos puros e obteve filhotes com os peloscompletamente cinzentos. Cruzou os cãescinzentos entre si e obteve os seguintesfilhotes: 20 pretos; 45 cinzentos e 18 brancos.Qual é o padrão de herança da cor da pelagemnessa raça de cães?

02) Um geneticista estava caminhando pelocampo e encontrou uma planta com floresbrancas. Essa planta geralmente produz floresvermelhas e o geneticista elaborou umexperimento para estudar a herança da cordas flores nessa planta. Cruzou as duasvariedades (linhagens puras) – branca evermelha e obteve uma F1 com floresvermelhas. Ao cruzar essas plantas de F1 entresi, obteve uma F2 formada por 590 plantascom flores vermelhas e 410 com floresbrancas. Elabore e teste uma hipótesegenética que explique a coloração das floresnessas plantas.

03) Um criador de cães da raça labrador cruzoucães pretos e obteve ninhadas totalizando 53filhotes pretos, 27 filhotes dourados e 20filhotes marrons. Elabore e teste umahipótese genética que explique a coloração dapelagem destes cães.

04) Uma pesquisadora identificou um novo antígeno eritrocitário emcobaias em laboratório. Este antígeno é codificado por um únicogene que possui três alelos: A1; A2 e A3. Com o objetivo deestabelecer as interações entre os três alelos do gene A, apesquisadora obteve linhagens puras para os 3 genótiposhomozigotos e realizou cruzamentos experimentais, com osseguintes resultados:

Cruzamento F1 F2

A1A1 x A2A2 100% com antígenos A2 444 com antígenos A2 e 126 sem antígenos eritrocitários A

A1A1 x A3xA3 100% com antígenos A3 369 com antígenos A3 e 101 sem antígenos eritrocitários A

A2A2 x A3A3 100% com antígenos A2 e A3 120 com antígenos A2, 116 com antígenos A3 e 275 com antígenos A2 e A3

Com base nos resultados obtidos pela pesquisadora, responda:

a) Os três alelos do gene A codificam produtos funcionais? Justifique.

b) Elabore e teste uma hipótese para as interações entre os alelos A1, A2 e A3

do gene A.

Teste de Qui-quadrado de independência ou de Contingência

• Comparar proporções em diferentes grupos.

• Verificar a independência das proporções em relação ao grupo de origem.

Suponha que em uma amostra da população de Curitiba (N = 100), o

fenótipo CHE2 C5- tenha sido identificado em 86 indivíduos e o fenótipo

CHE2 C5 + em 14 indivíduos. Em uma amostra de índios Guarani do

Paraná (N = 100) o fenótipo CHE2 C5- foi identificado em 55 indivíduos

e o fenótipo CHE2 C5+ em 45 indivíduos. Testar a hipótese (p = 5%) de

que as duas populações têm freqüências iguais dos fenótipos CHE2

C5- e CHE2 C5+.

• Para responder: qui-quadrado de independência para comparar as proporções entre as populações

Cálculo dos esperados: (total da linha x total da coluna)/total geral

FenótiposCuritiba Guarani

TotalObservado Esperado Observado Esperado

CHE2 C5+ 76(141*100)/215

= 65,5865

(141*115)/215

= 75,42141

CHE2 C5- 24(74*100)/215

= 34,4250

(74*115)/215

= 39,5874

Total 100 100 115 115 215

GL = (total de linhas -1) x (total de colunas -1)

Qui- quadrado calculado = 8,99Qui-quadrado tabelado (GL = 1) = 3,84

Conclusão?

FenótiposCuritiba Guarani

Obs Esp (O-E)2/E Obs Esp (O-E)2/E

CHE2 C5+ 76 65,58 1,66 65 75,42 1,44

CHE2 C5- 24 34,42 3,15 50 39,58 2,74

Total 100 100 4,81 115 115 4,18

Teste de Qui-Quadrado em estudos de associação genética (Teste de Contingência ou Independência)

• Estudos para elucidar o componente genético de doenças multifatoriais.

• Genes candidatos: comparação entre pacientes e controles.

– origem étnica, idade, sexo, classe social, região geográfica, entre outros.

• Teste de qui-quadrado para comparar proporções em duas amostras (pacientes e controles).

Num estudo para elucidar o componente genético de uma doençamultifatorial, pesquisadores analisaram um SNP de um genecandidato. Este SNP foi genotipado em um grupo de pacientes e emum grupo de indivíduos sem a doença. Estes grupos foram pareadospara diversos fatores, como origem étnica, idade, sexo, classe social,região geográfica, entre outros. O número de indivíduosencontrados com cada um dos genótipos possíveis para este SNPestá na tabela abaixo. Com base na tabela responda se o SNP emquestão está ou não associado com a doença de maneiraestatisticamente significativa e justifique sua resposta.

Genótipos Pacientes Controles Total

CC 95 127 222

CT 70 146 216

TT 18 44 62

Total 183 317 500

GL = (total de linhas -1) x (total de colunas -1)

Qual é a conclusão?

Cálculo dos esperados: (total da linha x total da coluna)/total geral

Genótipos PacientesObservado

PacientesEsperado

(O –E)2/E ControlesObservado

ControlesEsperado

(O –E)2/E

CC 95 81,252 2,326189 127 140,748 1,342879

CT 70 79,056 1,03738 146 136,944 0,598866

TT 18 22,692 0,97016 44 39,308 0,560061

Total 183 183 4,333729 317 317 2,501806

Qui-quadrado calculado = 4,333729 + 2,501806 = 6,835535

05) Pesquisadores testaram o efeito de uma vacina em doisgrupos experimentais distintos e encontararm osresultados a seguir:

a)Qual é a hipótese nula?

b) Faça o teste estatístico adequado e explique o que

os resultados do teste informam quanto ao efeito da

vacina nos dois grupos experimentais?

Grupo Experimental Reação

Positiva Negativa

1 25 45

2 15 25

Teste de Qui-quadrado para Equilíbrio de Hardy-Weinberg

• Comparar proporções obtidas (observado) com proporções esperadas (esperado) pelo Teorema de Hardy-Weinberg.

• No Equilíbrio de Hardy-Weinberg:

– Frequencias alélicas (p, q) são mantidas ao longo das gerações.

– Frequencias genotípicas são determinadas pelas frequencias alélicas:

• p2, 2pq e q2

• p2, q2, r2, 2pq , 2pr, 2qr

a) Quais são as frequências dos alelos X1 e X2 na população Z da espécie W?

b) Essa população está em equilíbrio de Hardy-Weinberg? Justifique sua resposta.

No de

indivíduos 240 230 530

X1

X2

Na população Z da espécie W, foram analisados 1000 indivíduos quanto à

variabilidade do gene X. Os alelos X1 e X2 do gene X podem ser

identificados através de eletroforese em gel de poliacrilamida. Observe a

representação esquemática de um gel de poliacrilamida contendo os

fragmentos de DNA correspondentes ao gene X, e responda às questões

propostas.

Primeiro passo: cálculo das frequências alélicas

• X1X1: 240

• X2X2: 230

• X1X2: 530

• Total de indivíduos: 1000

– Qual é o total de alelos analisados?

– Quantos alelos X1?

– Qual é a frequencia do alelo X1 no total de alelos analisados?

– Quantos alelos X2?

– Qual é a frequencia do alelo X2 no total de alelos analisados?

Segundo passo: cálculo dos valores esperados

• p (alelo X1) = 0,505 e q (alelo X2) = 0,495

• Total de indivíduos: 1000

– Qual é a frequencia esperada para X1X1 (p2) em 1000 indivíduos?

– Qual é a frequencia esperada para X1X2 (2pq) em 1000 indivíduos?

– Qual é a frequencia esperada para X2X2 (q2) em 1000 indivíduos?

Terceiro passo: montagem da tabela e cálculo do qui-quadrado

GL = 3 - 2 = 1 (número de classes – número de alelos)

Classe Observado Esperado (O – E)2/E

X1X1 240 255,025 0,88521

X2X2 230 245,025 1,806186

X1X2 530 499,95 0,921337

Total 1000 1000 3,612733

Qual é a conclusão?

06) Na população Y da espécie G, foram analisados 1000 indivíduos quanto àvariabilidade do gene A. Os alelos A1, A2 e A3 do gene A podem seridentificados através de eletroforese em gel de poliacrilamida. Observe arepresentação esquemática de um gel de poliacrilamida contendo osfragmentos de DNA correspondentes ao gene A, e responda às questõespropostas.

160 140 150 150 200 200

A1

A2

A3

a) Quais são as frequências dos alelos A1, A2 e A3 na população Y da espécie G?

b) Essa população está em equilíbrio de Hardy-Weinberg? Justifique sua resposta.

Teste de Qui-quadrado para dados de heredogramas de doenças monogênicas

1. Levantamento de várias irmandades com a mesma doença genética.

2. Análise dessas genealogias: compilação de dados.

3. Elaboração da hipótese para o modo de herança e testes de qui-quadrado.

10 irmandades 3 irmandades

11 irmandades 4 irmandades

1. Levantamento de várias irmandades com a mesma doença

2 Compilação de dados

Genitor

AfetadoIrmandades Irmãos

Total de

Afetados

Filhos

afetados

Filhas

afetadas

Mãe 13 52 29 13 16

Pai 15 60 26 15 11

Total 28 112 55 28 27

2 Hipótese:???

Perguntas a serem respondidas para testar a hipótese

a) Qual é a proporção de afetados nas irmandades? Corresponde à proporção esperada?

b) A proporção de filhas e filhos afetados é semelhante?

c) O sexo dos filhos afetados depende do sexo do genitor afetado?

a) Qual é a proporção de afetados nas irmandades? Corresponde à proporção

esperada?

Classes Observado Esperado (O-E)2/E

Afetados 55 56 0,018

Normais 57 56 0,018

Total 112 112 0,036

Conclusão?

b) A proporção de filhas e filhos afetados é semelhante?

Classes Observado Esperado (O-E)2/E

Filhas

Afetadas

27 27,5 0,009

Filhos

Afetados

28 27,5 0,009

Total 55 55 0,018

Conclusão?

c) O sexo dos filhos afetados depende do sexo do

genitor afetado?

Afetados Mãe Afetada Pai Afetado Total

Filhas 16 11 27

Filhos 13 15 28

Total 29 26 55

• Para responder: qui-quadrado de independência para comparar as proporções

Cálculo dos esperados: (total da linha x total da coluna)/total geral

AfetadosMãe Afetada Pai Afetado

TotalObservado Esperado Observado Esperado

Filhas 16 (27x29)/55 11 (27x26)/55 27

Filhos 13 (28x29)/55 15 (28x26)/55 28

Total 29 29 26 26 55

GL = (total de linhas -1) x (total de colunas -1)

Afetados

Mãe Afetada Pai Afetado

Obs Esp(O-E)2/E

Obs Esp(O-E)2/E

Filhas 16 14,240,22

11 12,760,24

Filhos 13 14,760,21

15 13,240,23

Total 29 290,43

26 260,47

Conclusão?

Perguntas a serem respondidas para testar a hipótese

a) Qual é a proporção de afetados nas irmandades? Corresponde à proporção esperada?

b) A proporção de filhas e filhos afetados é semelhante?

c) O sexo dos filhos afetados depende do sexo do genitor afetado?

A hipótese foi confirmada?

5 irmandades

10 irmandades 2 irmandades

8 irmandades

07)

08) Com base nas informações a seguir, elabore e teste umahipótese justificável geneticamente para o padrão de herança.Uma doença genética rara foi analisada em 50 famílias. Emtodas essas famílilas um dos genitores era normal e o outroafetado (independente do sexo). Em um total de 110 irmãosanalisados, 53 eram afetados e 57 eram normais(independente do sexo). Dos 53 irmãos afetados, 45 secasaram com pessoas normais, tendo um total de 80 filhos: 37normais e 43 afetados. Dos 49 irmãos normais, 40 se casaramcom pessoas normais, tendo um total de 85 filhos, todosnormais.