haploview: análise e visualização de mapas e ld...

14
Haploview: análise e visualização de mapas e LD haplótipos Informação sobre o artigo: Autores: JC Barret, B. Fry, J. Maller e MJ Daly Respectivas filiações: Whitehead Institute for Biomedical Research Cambridge, MA 02142, EUA MIT Media Lab Cambridge, MA 02139, EUA Instituto Broad do MIT e de Harvard em Cambridge, MA, EUA Data : 23 de julho de 2004. Realizado por: Carlos Rodrigues 070316102 Liliana Mota 070307056

Upload: phamtruc

Post on 07-Nov-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Haploview: análise e visualização de mapas e LD haplótiposvsc/Bioinformatica.MCC/monos/CarlosRodri... · A informação dos marcadores pode ser carregada com o nome ou localização,

Haploview: análise e visualização de mapas e LD haplótipos

Informação sobre o artigo:

Autores: JC Barret, B. Fry, J. Maller e MJ Daly

Respectivas filiações:

Whitehead Institute for Biomedical Research Cambridge, MA 02142, EUA

MIT Media Lab Cambridge, MA 02139, EUA Instituto Broad do MIT e de Harvard em Cambridge, MA, EUA

Data : 23 de julho de 2004.

Realizado por:

Carlos Rodrigues 070316102

Liliana Mota 070307056

Page 2: Haploview: análise e visualização de mapas e LD haplótiposvsc/Bioinformatica.MCC/monos/CarlosRodri... · A informação dos marcadores pode ser carregada com o nome ou localização,

Haploview: análise e visualização de mapas e LD haplótipos 2012

2

“A tecnologia digital é a arte de criar necessidades desnecessárias mas que se tornam absolutamente

imprescindíveis.”

Joelmir Beting

Page 3: Haploview: análise e visualização de mapas e LD haplótiposvsc/Bioinformatica.MCC/monos/CarlosRodri... · A informação dos marcadores pode ser carregada com o nome ou localização,

Haploview: análise e visualização de mapas e LD haplótipos 2012

3

Índice

Terminologias .......................................................................................4

Introdução............................................................................................5

Características do Haploview .................................................................6

Versões de Haploview ...........................................................................9

Conclusões .........................................................................................13

Referências ........................................................................................14

Page 4: Haploview: análise e visualização de mapas e LD haplótiposvsc/Bioinformatica.MCC/monos/CarlosRodri... · A informação dos marcadores pode ser carregada com o nome ou localização,

Haploview: análise e visualização de mapas e LD haplótipos 2012

4

Terminologias Alelo: Representa uma das formas alternativas para um determinado gene, no qual

ocupa um locus (posição) num cromossoma. A combinação entre alelos determina as características de um determinado individuo. Cromossoma: Sequência de DNA que contém vários genes e outras sequências de

nucleotídeos com funções especificas nas células dos seres vivos.

Locus(plural: loci): Local fixo num determinado cromossoma aonde se localiza

determinado gene ou marcador genético.

Marcador genético: Característica que identifica diferenças entre dois ou mais

organismos. Usados para o estudo da diversidade populacional.

Desequilíbrio de ligações(LD): Associações alélicas não aleatórias que ocorrem com

mais ou menos frequência que seria esperado numa determinada população. LD é

influenciado com seguintes factores; ligação genética, selecção, taxa de combinação,

taxa de mutação, deriva genética, combinação não aleatória de acasalamento e

estrutura da população.

Dados pedigree: Fornece dados probabilísticos sobre dados quantitativos no campo

biológico ou estudos laboratoriais.

Equilibrio de Hardy-Weinberg: É o estudo dos genes (variantes) do ponto de vista de

sua distribuição na população. Esta lei afirma que de geração em geração as

frequências alélicas vão se tornando constantes.

transmission disequilibrium test (TDT): Testa a ligação entre um marcador e um locus

de susceptibilidade doença e características quantitativas.

Teste X2: Usado para comparar as frequências observadas com Frequências esperadas.

Page 5: Haploview: análise e visualização de mapas e LD haplótiposvsc/Bioinformatica.MCC/monos/CarlosRodri... · A informação dos marcadores pode ser carregada com o nome ou localização,

Haploview: análise e visualização de mapas e LD haplótipos 2012

5

Introdução A variação genética é elevada nas populações humanas, provém da diversidade

das combinações alélicas nas recombinações transmitidas de geração em geração. Mas

pode ocorrer erros nessas recombinações causando danos para o individuo.

Um haplótipo é uma combinação de alelos, que se encontram em locais

adjacentes (loci) no cromossoma e são transmitidos juntos na transmissão genética.

No entanto pode ocorrer um desequilíbrio de ligação local (LD) num bloco causando

assim determinadas doenças, tais como os diabetes, cancro, doenças cardíacas,

depressão e asma são afectadas por muitos genes e factores ambientais.

O estudo destas estruturas e determinação de padrões haplótipos no genoma

humano tem sido muito importante para a genômica médica, medicina evolutiva ,

moderna e aplicações farmacêuticas. Com o decorrer do tempo e o aumento da

informação levaram ao desenvolvimento de um projecto denominado HapMap que

tem como objectivo desenvolver um mapa de haplótipos do genoma humano (base

dados), no qual descreve os padrões comuns de variação humana na sequência de

DNA. O estudo destas variantes fornece informação sobre as causas que levam ao

desenvolvimento das doenças no Ser Humano.

Dado ao grande número de informação contida no HapMap foi necessário o

desenvolvimento de uma ferramenta para análise, interpretação e visualização de

haplótipos, facilitando assim a pesquisa de vários investigadores. Foi desenvolvido

assim um software que fornece dados estatísticos denominado Haploview.

Tendo como objectivo fornecer uma análise rigorosa sobre haplótipos, além de

gerar estatísticas de marcadores, ainda fornece informação sobre ligações LD, blocos

haplótipos e frequências destes na população. Todos os recursos podem ser alterados

conforme o interesse do utilizador e todos os cálculos são realizados em tempo real,

mesmo para conjuntos de dados com centenas de pessoas e centenas de marcadores.

Page 6: Haploview: análise e visualização de mapas e LD haplótiposvsc/Bioinformatica.MCC/monos/CarlosRodri... · A informação dos marcadores pode ser carregada com o nome ou localização,

Haploview: análise e visualização de mapas e LD haplótipos 2012

6

Características de Haploview Haploview permite carregar informação em vários formatos, sendo compatível

com quaisquer formatos de dados provenientes do projecto HapMap, no qual permite

uma ligação directa de leitura da base de dados. Dados pedigree carregados permite

ler informação de cromossomas em diferentes estados, especificar informação

estrutural de cada família e ainda permite comparação de doenças com casos controle.

A informação dos marcadores pode ser carregada com o nome ou localização, mas

estes são carregadas separadamente.

Contem um navegador gráfico para visualização do genoma em que possibilita

aos utilizadores uma navegação localizada numa região específica escolhidas por eles,

mostrando todos os marcadores presentes nessa região. Os marcadores dessa região

tem que estar de acordo com o equilíbrio de Hardy-Weinberg, registo de erros da

herança mendeliana e percentagem de indivíduos genotipados para esse marcador. Só

os marcadores de interesse é que são filtrados pelo próprio programa, mas o utilizador

pode ajustar os limites dependendo da sua pesquisa, adicionando ou eliminando

marcadores. Todas as alterações feitas alteram de uma forma imediata análise em

curso.

Page 7: Haploview: análise e visualização de mapas e LD haplótiposvsc/Bioinformatica.MCC/monos/CarlosRodri... · A informação dos marcadores pode ser carregada com o nome ou localização,

Haploview: análise e visualização de mapas e LD haplótipos 2012

7

Figura 1 – Exemplo do ecrã do software HaploView [1]

O Haploview calcula ainda várias medidas para pares de LD que usa para criar

uma representação gráfica como demonstrado na figura acima. Utilizador pode ainda

usar um esquema de cores para identificar as diferentes relações LD. A medida que

analise está a decorrer este mostra as variáveis e a taxa de recombinação

(esquerda/cima). A direita está informação sobre haplótipos da região seleccionada.

Estes haplótipos são gerados depois da selecção de marcadores escolhidos de forma

automática ou manual, ainda gera as suas frequências populacionais.

A figura mais a direita ainda mostra a representação em blocos, em que as

linhas representam a transição entre blocos e espessura indica o grau de LD. A

personalização está novamente presente, podendo exibir alelos como letras, números

ou caixas coloridas. Haploview pode ainda calcular estatísticas TDT e X2

(caso/controlo), para cada marcador. Haploview é organizado em vários tab,

permitindo ao utilizador analisar os dados em tempo real. As informações de cada

janela podem ainda ser convertida para um arquivo PNG, podendo ser utilizado em

apresentações, publicações ou ficheiros texto. O programa pode ainda ser manipulado

através de uma linha de comandos, que permite ao utilizador executar todas as

análises sem abrir a interface gráfica.

Page 8: Haploview: análise e visualização de mapas e LD haplótiposvsc/Bioinformatica.MCC/monos/CarlosRodri... · A informação dos marcadores pode ser carregada com o nome ou localização,

Haploview: análise e visualização de mapas e LD haplótipos 2012

8

As versões futuras incluirão vários haplótipos-tag métodos de selecção de SNP,

bem como haplótipos baseados em testes de associação e de avaliação de significância

usando o teste de permutação. Estas características finais vão permitir que o utilizador

a partir de dados do genótipo explore associações genéticas através de um software

de fácil utilização.

Este software é escrito numa linguagem java no qual permite assim que

qualquer plataforma que possua pelo menos java 1.3 pode correr esta aplicação. Neste

artigo é referente a versão 2.05 de Abril de 2004, o Haploview podia ser exibido um

conjunto de dados com 200 marcadores genotipados em 400 indivíduos e ajustar

parâmetros sem nenhum atraso perceptível. O programa também permite o uso da

linha de comandos para fazer cálculos LD em conjuntos de dados muito grandes, em

quantidades pequenas de tempo.

Page 9: Haploview: análise e visualização de mapas e LD haplótiposvsc/Bioinformatica.MCC/monos/CarlosRodri... · A informação dos marcadores pode ser carregada com o nome ou localização,

Haploview: análise e visualização de mapas e LD haplótipos 2012

9

Versões de Haploview Como se trata de um artigo de Abril de 2004, com o passado dos anos foram

sendo lançadas novas versões deste software, aqui vai-se listar todas as versões

lançadas e suas melhorias.

Versão 3.0 (Outubro de 2004) [2]

Bugfixes for block size display, checkdata tab, allele sorting, EM missing

data.

Added compressed PNG output mode.

Lots of new command line options.

Changed batch mode input format.

Re-sort out of order info files.

Substantial improvement in speed and memory usage in EM.

New color schemes.

Added additional sample information for 2nd and 3rd HapMap plate.

Fixed handling of complex pedigrees.

Added proportional spacing to LD display.

Added HapMap GBrowse track.

Filter individuals with lots of missing genotypes.

Haplotype association tests.

Update checker.

Versão 3.1 (Janeiro de 2005) [2]

Additional HapMap info track display options.

Improved parsing of complex pedigrees.

Fixed bug with loading of haps style input files.

Fixed bug with correctly parsing out-of-order info files.

Fixed problem with association tests on datasets with no blocks.

Fixed bug with exporting range of markers to LD PNG.

Page 10: Haploview: análise e visualização de mapas e LD haplótiposvsc/Bioinformatica.MCC/monos/CarlosRodri... · A informação dos marcadores pode ser carregada com o nome ou localização,

Haploview: análise e visualização de mapas e LD haplótipos 2012

10

Versão 3.2 (Abril de 2005) [2]

added Tagger interface

added custom association test input

added permutation testing of association results

improved memory efficiency for EM haplotype reconstruction

added Perlegen sample Ids

fixed bug in PNG export cutting off final marker

Versao 3.3 (Maio de 2006) [2]

support for X chromosome

major memory usage improvements allow multiple analysis tracks and label Y axis

added user defined hapmap sample option

added haplotypes only permutation option

added option to show different LD measures or hide them

added -memory switch and changed default to 512M

added minor allele to check panel

added progress bar for data loading

support for alphabetical (ACGT) input format

added individual information dialog

added check panel for phased haps files

added dump tags button

last popup dialog is shown at top of display

added GOLD style color scheme

can sort tables by clicking on headers

changed case control allele order

Versão 4.0 (Agosto de 2007) [2]

Page 11: Haploview: análise e visualização de mapas e LD haplótiposvsc/Bioinformatica.MCC/monos/CarlosRodri... · A informação dos marcadores pode ser carregada com o nome ou localização,

Haploview: análise e visualização de mapas e LD haplótipos 2012

11

dded support for HapMap PHASE format data

added support for phased HapMap downloads

added support for PLINK output files including plotting functionality

added a number of Tagger features to coincide with the Tagger website

functionality

added 2-marker aggressive tagging from the command line

added log file functionality to command line mode

added proxy support

added table sorting to Tagger configuration

added numerous minor display and interface tweaks

added export options for Mendel errors and male heterozygotes on x

chromosome

added command line HapMap info track download

added case control frequencies to command line association output

added ld values selection to command line image export

added citation information to the "About" dialog

added "Uncapture All" button to Tagger

added build 36 option to HapMap info track downloads

added http:// loading for files on the command line and initial load screen

changed some labelling in Tagger and made pairwise the default option

changed obsHet calculation to use founders only

changed HW and het calculations to show as "NA" in X data with too few

individuals

enhanced GUI design with tabbed pane for initial loading dialog

Versão 4.1 (Abril de 2008) [2]

Page 12: Haploview: análise e visualização de mapas e LD haplótiposvsc/Bioinformatica.MCC/monos/CarlosRodri... · A informação dos marcadores pode ser carregada com o nome ou localização,

Haploview: análise e visualização de mapas e LD haplótipos 2012

12

added support for GeneCruiser lookup

added support for HapMap release 22

added -out fileroot specification to the command line

added consecutive filtering to PLINK with view/add/remove filters

added SVG output for LD plot and haplotype blocks display

added min design scores to Tagger in GUI and command line

added reset thresholds button to Tagger

added exclude A/T and C/G SNPs button to Tagger

upgraded graphing packages to latest version

changed load screen dialog tab orientation for Mac OSX

fixed bug with LD display pop-up on certain systems

fixed bug with HapMap info track caching

fixed bug on LD Display with MAF of .5

fixed bug where setting tagger cutoff fields to blank would generate exceptions

fixed bug with PLINK View Filters dialog

fixed bug with PLINK file column number mismatches

Versão 4.2 (Em Setembro de 2009) [2]

added support for Phase 3 HapMap

added support for the latest version of GeneCruiser

added GeneCruiser lookup to Region Dialog in PLINK tab

added search as you type and prune table to PLINK results

added "-v/-version" to option to the command line

changed tab orientation for initial load screen on Mac OSX

disabled Genecruiser for non HG18 Hapmap Releases

Actualmente este software encontra-se em modo de “congelamento” estando

a espera que alguém através de mais investigação consiga trazer melhorias futuras de

forma a conseguir-se obter resultados cada vez mais eficientes.

Conclusão

Page 13: Haploview: análise e visualização de mapas e LD haplótiposvsc/Bioinformatica.MCC/monos/CarlosRodri... · A informação dos marcadores pode ser carregada com o nome ou localização,

Haploview: análise e visualização de mapas e LD haplótipos 2012

13

Haploview consistiu uma óptima ferramenta para a pesquisa dos investigadores

na área da genômica, no qual permite uma pesquisa fácil e rápida e ainda apresenta

uma série de informações e cálculos estatísticos. Permite ainda ao utilizador

personalizar o aspecto visual facilitando a leitura de dados. Sendo assim um software

open source, intuitivo e user-friendly.

Referências

Page 14: Haploview: análise e visualização de mapas e LD haplótiposvsc/Bioinformatica.MCC/monos/CarlosRodri... · A informação dos marcadores pode ser carregada com o nome ou localização,

Haploview: análise e visualização de mapas e LD haplótipos 2012

14

Fonte do artigo: http://bioinformatics.oxfordjournals.org/content/21/2/263.abstract

[1 ] - http://bioinformatics.oxfordjournals.org/content/21/2/263/F1.large.jpg

[2] - http://www.broadinstitute.org/science/programs/medical-and-population-

genetics/haploview/version-history

Diversas fontes:

http://pt.wikipedia.org/wiki/Alelo

http://es.wikipedia.org/wiki/Haplotipo

http://hapmap.ncbi.nlm.nih.gov/

http://www.broadinstitute.org/scientific-community/science/programs/medical-and-

population-genetics/haploview/haploview

http://www.broadinstitute.org/science/programs/medical-and-population-

genetics/program-medical-and-population-genetics