fichero de salida crea una carpeta con el nombre de tu archivo y introduce 5 ficheros:...
TRANSCRIPT
FICHERO DE SALIDACrea una carpeta con el nombre de tu archivo y introduce 5 ficheros:
amovaHG27_sB.htm
amovaHG27_sB.js
amovaHG27_sB_main.htm
amovaHG27_sB_tree.htm
Arlequin_log.txt (avance del proceso)
Y otro externo con los datos usados: randseed.txt
Usamos amovaHG27_sB.htm
que lo salvamos como .txt
FICHERO DE SALIDA
=================================================== == GENETIC STRUCTURE ANALYSIS AMOVA ======================================================
-errores y el día y fecha de la corrida
- Información acerca del proyecto y varias secciones
FICHERO DE SALIDA=================================================== == GENETIC STRUCTURE ANALYSIS AMOVA ======================================================
Ordenamos los FST: (1-FSC)*(1-FCT) = (1-FST)
Variación: en una población: 99.38%
FSC(entre poblaciones dentro de grupos)=0.00296
var = 0.32% P-value = 0.00098+-0.00000 p<0.001
FCT(entre grupos)=0.00320
var = 0.29% P-value = 0.00000+-0.00000 p<0.001
FST(total)= 0.00615
P-value = 0.00000+-0.00000 p<0.001
Conclusión: las regiones son distintas, pero hay mucha
mas estructuración de la que planteamos, pues es
significativa la variación dentro de regiones
FICHERO DE SALIDAANALYSES AT THE INTRA-POPULATION LEVEL:
======================================================== ==
Sample : GAL
===========================================================
Standard diversity indices :
No. of gene copies: 191 No.
haplotypes : 19 No. of loci :
0 No. of
usable loci : 0
loci with less than 5.00 % missing data
No. of polymorphic loci : 0 Haplotype-level
computations Sum of square
freqs. : 0.2073 Gene diversity :
0.7969 +/- 0.0228 (Standard deviation is for the sampling process)
================================ ==
Molecular diversity indices : (GAL) ================================
FICHERO DE SALIDAANALYSES AT THE INTRA-POPULATION LEVEL:
================================ ==
Molecular diversity indices : (GAL) ================================
Sample size : 191.0000
No. of haplotypes : 19
Allowed level of missing data : 5.0000
% Number of polymorphic loci : 0
Number of usable loci : 0
Theta(Hom) : 3.104775
S.D. Theta(Hom) : 0.471907
Theta(k) : 5.056943 95 %
confidence interval limits for theta(k) : [ 3.033856, 8.158112 ] Unable to
compute theta(S) for standard data type Unable to compute theta(Pi) for standard
data type
Al no haber datos moleculares, este apartado no tiene mucho sentido
List of labels for population samples
Population pairwise FSTs
FST P values
Matrix of significant Fst P values Significance Level=0.0500
Matrix of Slatkin linearized FSTs as t/M=FST/(1-FST) (M=N for haploid data, M=2N for diploid data)
Matrix of M values (M=Nm for haploid data, M=2Nm for diploid data)
Exact Test of Sample Differentiation Based on Haplotype Frequencies :
List of labels for population samples
Global test of differentiation among sample
Non-differentiation exact P values
FICHERO DE SALIDA=================================================== == Comparisons of pairs of population samples ======================================================
Podemos paras los datos (FST y exact test) a un
excel para poder mover filas y columnas
FST
1) Copiamos cada matrix en un fichero .txt
2) Desde el excel, abrimos los ficheros
FICHERO DE SALIDA=================================================== == GENETIC STRUCTURE ANALYSIS AMOVA ======================================================
FICHERO DE SALIDA=================================================== == GENETIC STRUCTURE ANALYSIS AMOVA ======================================================
Ordenamos los FST: (1-FSC)*(1-FCT) = (1-FST)
Variación: en una población: 99.64%
FSC(entre poblaciones dentro de grupos)=0.00084
var = 0.08% P-value = 0.14565+-0.01291 p = n.s.
FCT(entre grupos)=0.00271 var =
0.27% P-value = 0.00000+-0.00000 p<0.001 FST(total)=
0.00355 P-value
= 0.00000+-0.00000 p<0.001
Conclusión: las regiones son distintas, y las
poblaciones dentro de regiones son homogéneas
la población está estructurada
SPSS-MDS
1) Preparar archivo: hoja de excel con una matriz con los FST
2) En la diagonal mayor se ponen 0
3) Los nombres de las poblaciones en la 1º fila y en la 1º columna.
SPSS-MDSAbrimos el SPSS
- Crear una nueva consulta mediante el asistente para bases
de datos, y se nos abre una ventana donde le diremos: “Excel”
files” “siguiente”
Se nos abre otra ventana que nos permite examinar el ordenador
para buscar el archivo que nos interesa mediante: “Examinar”
“abrir” y “Aceptar”
En la nueva ventana tenemos que pasar la hoja que nos interesa
de “tablas disponibles” a “recuperar los campos en este orden”,
bien sea arrastrándola de izq a derecha ó marcándola y
presionando la flecha. A continuación: “Siguiente” “Siguiente”
“Siguiente” “Finalizar”. De esta manera se abre el archivo de
datos y empieza a escribirse el de resultados.
Normalmente le ponemos: Escala, Numérico, Ancho = 8 y Decimales = 4
SPSS-MDS
- Pinchamos “ANALIZAR” y luego “Escala” y “Escalamiento
multidimensional (ASCAL)”
- Marcamos todas las variables (mayúsculas) y las pasamos.
- Pinchamos MODELO: Nivel de medida: intervalo,
condicionalidad: matriz, Dimensiones 2x2 y modelo de
escalamiento: Distancia euclídea. CONTINUAR
- Pinchamos OPCIONES: marcamos para visualizar las 4 y
CONTINUAR
- ACEPTAR
Ahora podemos mirar los resultados:
STRESS: (<0’15 bueno, <0’10 muy bueno)
R2 = RSQ correlación alta muy bueno, luego cuanto mayor mejor,
por ejemplo 0’7 ó más.
Ahora vemos el gráfico y lo retocamos para la publicación
SPSS-MDS
SPSS-MDS
SPSS-MDS
SPSS-MDS
OTRAS POSIBILIDADES
Datos moleculares
HT: al comparar las poblaciones podríamos usar la divergencia (medida, por ejemplo, por el número de diferencias) molecular entre ellos, para ponderar las diferencias.
Esta información se la podemos dar de dos maneras:
A) Suministrándole los haplotipos como datos binarios (cada RFLP ó cada SNP ó cada base, sería una posición)Ahora, dentro de la sección DATA hemos incluido el apartado:
[[HaplotypeDefinition]]HaplListName="56 human mtDNA RFLPs"HaplList= EXTERN "56hapdef1.txt"
Que nos indica las diferencias moleculares entre los distintos HT
FICHERO DE DATOS de texto .arpSECCIONES-APARTADOS
[Data]
[[HaplotypeDefinition]]
HaplListName = “nombre”
HaplList = {
H1 ATCG
H2 ATCA
}
También podemos escribirlo:[[HaplotypeDefinition]]
HaplListName = “nombre”
HaplList = EXTERN “hapl_file.hap”
B) También podemos darle directamente la matriz de diferencias entre los HT, incluyendo en DATA el apartado:
[[DistanceMatrix]]MatrixName="A matrix of genetic
distance between 56 haplotypes"MatrixSize= 56#LabelPosition=LINEMatrixData=EXTERN "amovadis.dis“
Para ello vamos a usar el programa HAPLOSITE http://www.haplosite.com/haplosearch
HAPLOSEARCH http://www.haplosite.com/haplosearch
Tenemos que crear un archivo con el siguiente formato:START: 090>CRSTATTTCGTACATTACTGCCAGCCACCATGAATATTGTACGGTACCATAAATACTTGACCACCTGTAGTACATAAAAACCCAATCCACATCAAAACCCCCTCCCCATGCTTACAAGCAAGTACAGCAATCAACCCTCAACTATCACACATCAACTGCAACTCCAAAGCCACCCCTCACCCACTAGGATACCAACAAACCTACCCACCCTTAACAGTACATAGTACATAAAGCCATTTACCGTACATAGCACATTACAGTCAAATCCCTTCTCGTCCC>SEQ5093
>SEQ6094
Esto lo hacemos a partir del excel:
A) Nosotros hemos analizado entre las posiciones 65 y 365, por lo que en la primera línea tenemos que poner START: 065
B) Ahora preparamos la sec. del CRS, para ello abrimos el archivo RE_rCRS.txt y seleccionamos de la posición 16065 a la 16365. Cuando ya lo tenemos sin espacios, sin marcas de párrafo y en mayúsculas, lo añadimos a la segunda fila como
>CRS^pSecuencia en mayúsculas^p
HAPLOSEARCH
C) Ahora en las restantes filas escribimos >H#^p”motivo HT”^p.- Para ello creamos el excel, lo copiamos y convertimos la tabla en texto:sustituimos ^p por ^p>- reemplazamos 2 espacios por uno (tantas veces como necesario)- reemplazamos ^t por ^p- revisamos que no queden espacios al final de las posiciones de los HT,
reemplazamos espacio^p por ^p- lo salvamos como .txt (texto sin formato)
D) lo corremos en el programa http://www.haplosite.com/haplosearchProcesar, examinar, get sequence, populations genetics, procesar.- Esperar---abrir con WORDPAD, aceptar, Guardar como “sec_amova27_rosi.txt”
E) preparar la matriz para el arlequín, cuyo formato es::[Data] [[HaplotypeDefinition]]
HaplListName="U3"HaplList={
H01.. TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTCTTTTTTTTTTTTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA^pH02.. }
HAPLOSEARCH
FICHERO DE DATOS de texto .arpSECCIONES-APARTADOS
[Data]
[[HaplotypeDefinition]]
HaplListName = “nombre”
HaplList = {
H1 ATCG
H2 ATCA
}
También podemos escribirlo:[[HaplotypeDefinition]]
HaplListName = “nombre”
HaplList = EXTERN “hapl_file.hap”
Pasos:- Copiamos sec_amova27_rosi.txt como matriz.txt- Quitamos la 1ª fila- reemplazamos > por nada- reemplazamos ^p por 3 espacios- reemplazamos 3espaciosH por ^pH- quitamos el CRS y salvamos.
Ahora introducimos en amova_HT135_mol.arp el encabezado y la matriz
En DataType ponemos DNA y añadimos: LocusSeparator=noneCompDistMatrix=1
Si está bien se te activaran los “Molecular diversity indices”
NOTA: Tambien existe la posibilidad de usar un archivo externo, ver los modelos del arlequin
FICHERO DE DATOS de texto .arp
Ahora existe la posibilidad de calcular los FST basados sólo en las frecuencias o pedirle que nos “compute distance matriz” usando “pairwise differences”
También le podemos pedir:- que nos imprima la matriz de distancia entre los HT- los índices moleculares de diversidad: Theta
RESULTADOS:El nº de loci: posiciones que le hemos puestoMean number of pairwise differences, equivalente a pi y te da las diferentes Theta, basadas en Homocigosis, nº alelos, nº sitios polimórficos y pi