CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg La población subdividida y el efecto Wahlund La similaridad genética El análisis estadístico de la similaridad Otros métodos estadísticos útiles en Antropogenética Bases de datos Programas de interés en Antropogenética
Bibliografía complementaria Calderon R, Vidales C, Peña JA, Perez-Miranda A, Dugoujon JA 1998 Immunoglobulin allotypes (GM and KM) in Basques from Spain: Approach to the Origin of the Basque Population. Human Biology, 70:667-698 (JAP790) Calò, C. M., Piras, I. S., Moral, P., Falchi, A., Ghiani, M. E., Varesi, L., Vona, G., 2005, Analisi molecolare delle popolazioni del Mediterraneo attraverso 11 inserzioni Alu. Antropo, 9, 1-12. www.didac.ehu.es/antropo Cerny V., Hajek M., Bruzek J., Cmejla R., Brdicka R., 2004, Relations génétiques des populations de langues tchadiques parmi les populations péri-sahariennes révélées par l’étude des séquences de l’ADN mitochondriale. Antropo, 7, 123-131. www.didac.ehu.es/antropo Chen et a 2000 mtDNA Variation in the South African Kung and Khwe and Their Genetic Relationships to Other African Populations Am. J. Hum. Genet., 66:1362-1383 (JAP 1323) Coudray, C., Guitard, E., Lemaire, O., Cherkaoui, M., Baali, A., Hilali, K., Sevin, A., Kandil, M., Harich, N., Melhaoui, M., Larrouy, G., Moral, P., Dugoujon, J.M., 2004, Les allotypes Gm des immunoglobulines chez les Berbères du Maroc. Antropo, 6, 63-69. www.didac.ehu.es/antropo Goddard et al 2000 Linkage Disequilibrium and Allele-Frequency Distributions for 114 Single-Nucleotide Polymorphisms in Five Populations Am J Hum Genet 66:216-234 (JAP1325) Jorde et al 2000 The distribution of human genetic diversity: a comparison of mitochondrial, autosomal, and Y-chromosome data Am J Hum Genet 66:979-988 (JAP783) Peña et al 1997 New method for comparing levels of microdifferentiation: Application to migration matrices of two populations from the Basque Country (Spain) Human Biology 69:329-344 (JAP787) Peña, J. A., Alfonso-Sánchez, M. A., García-Obregón, S., Pérez-Miranda, A., 2002, Persistencia de actividad lactasa en población residente en el País Vasco. Antropo, 3, 51-60. www.didac.ehu.es/antropo Peña et al 2002 Microsatellite DNA markers from HLA region (D6S105, D6S265 and TNFa) in autochthonous Basques from Northern Navarre (Spain) Annals of Human Biology 29:176-191 Peña, J.A., Alfonso-Sánchez, M.A., Pérez-Miranda, A., García-Obregón, S., 2004, Flujo génico y presiones selectivas en Europa. Una aproximación a partir de clinas de ADN codificante y no codificante. Antropo, 8, 117-122. www.didac.ehu.es/antropo Roewer et al 2005 Signature of recent historical events in the European Y-chromosomal STR haplotype distribution Human Genetics (JAP1045) Tishkoff et al 2007 History of Click-Speaking Populations of Africa Inferred from mtDNA and Y Chromosome Genetic Variation Mol Biol Evol 24:2180-2195 (JAP 1322)
Equilibrio Hardy-Weinberg Genotipo Frecuencia AA p2 Aa 2pq aa q2 Total 1
La población subdividida k subpoblaciones p1 p2 p p3 p4
La población subdividida El efecto Wahlund
La población subdividida Variación con el tiempo de de F ST
La población subdividida Peña et al, 1997 Rotura de los aislados y F ST
La similaridad genética RST = ∑i wi rii estima de Coeficiente de parentesco (matriz R)
La similaridad genética G2 de Sanghvi Jxx=1-hx Jyy=1-hy D de Nei Matriz R FST de Reynolds et al Coeficientes de distancia
El análisis estadístico de la similaridad Con el fin de ajustar la matriz de disimilaridades D obtenida entre k muestras, a una representación euclídea en s dimensiones ( s ≤ k - 1 ), se asocia una matriz de distancias, de modo que dadas dos disimilaridades tal que dij < di'j' debe cumplirse, siempre que sea posible que las distancias representadas sean d*ij < d*i'j' De este modo, situando los M elementos de la matriz D en orden creciente di1j1 < di2j2 < ... < diMjM sus distancias asociadas deben quedar como d*i1j1 < d*i2j2 < ... < d*iMjM Pueden representarse las disimilaridades frente a sus distancias asociadas en el denominado diagrama de Sephard. Análisis de Escalamiento Multidimensional (MDS)
El análisis estadístico de la similaridad Análisis de Escalamiento Multidimensional (MDS)
El análisis estadístico de la similaridad Matriz de distancias Hola Fran UK Belg Germ Irel Ital Pola Port Sard Turk BaFr Hola 0,000 0,034 0,007 0,021 0,018 0,012 0,027 0,029 0,033 0,078 0,034 0,040 Fran 0,034 0,000 0,029 0,039 0,022 0,037 0,031 0,029 0,038 0,081 0,050 0,058 UK 0,007 0,029 0,000 0,015 0,010 0,011 0,020 0,018 0,024 0,060 0,031 0,038 Belg 0,021 0,039 0,015 0,000 0,014 0,017 0,018 0,015 0,006 0,037 0,012 0,044 Germ 0,018 0,022 0,010 0,014 0,000 0,010 0,007 0,006 0,014 0,052 0,021 0,036 Irel 0,012 0,037 0,011 0,017 0,010 0,000 0,023 0,020 0,024 0,058 0,028 0,042 Ital 0,027 0,031 0,020 0,018 0,007 0,023 0,000 0,007 0,019 0,061 0,015 0,044 Pola 0,029 0,029 0,018 0,015 0,006 0,020 0,007 0,000 0,016 0,051 0,015 0,048 Port 0,033 0,038 0,024 0,006 0,014 0,024 0,019 0,016 0,000 0,046 0,018 0,041 Sard 0,078 0,081 0,060 0,037 0,052 0,058 0,061 0,051 0,046 0,000 0,060 0,068 Turk 0,034 0,050 0,031 0,012 0,021 0,028 0,015 0,015 0,018 0,060 0,000 0,069 BaFr 0,040 0,058 0,038 0,044 0,036 0,042 0,044 0,048 0,041 0,068 0,069 0,000 Iteration S-stress Improvement 1 ,15028 2 ,11401 ,03627 3 ,10002 ,01399 4 ,09344 ,00658 5 ,09049 ,00295 6 ,08883 ,00166 7 ,08765 ,00118 8 ,08668 ,00097 For matrix Stress = ,11872 RSQ = ,95603 Análisis de Escalamiento Multidimensional (MDS)
El análisis estadístico de la similaridad Dimension Pob 1 2 1 HOLANDA ,9909 -,2243 2 FRANCE 1,9713 ,2448 3 UK ,5153 ,0128 4 BELGIUM -,5642 ,1847 5 GERMANY ,2549 ,0100 6 IRELAND -,0072 ,2183 7 ITALY ,4334 ,4043 8 POLAND ,1545 ,3784 9 PORTUGAL -,4574 ,2178 10 SARDINIA -3,0858 -,3584 11 TURKEY -,3758 1,3403 12 BASQUES ,1702 -2,4287 Análisis de Escalamiento Multidimensional (MDS)
El análisis estadístico de la similaridad Ejemplo práctico 1 2 3 4 1 0 0,4 0,6 0,3 2 0 0,2 0,2 3 0 0,3 4 0 4 1 2 3 Análisis de Escalamiento Multidimensional (MDS)
El análisis estadístico de la similaridad Análisis de Escalamiento Multidimensional (MDS) Matriz R - Inserciones Alu Calò et al, 2005
Análisis Factorial de correspondencias (AFC) El análisis estadístico de la similaridad Análisis Factorial de correspondencias (AFC) Distancia Chi2
Los Bereberes Individuos bereberes
Los Bereberes Idiomas bereberes Azul oscuro: Tuaregs Rosa oscuro: Zaians Amarillo: Riffis Rosa claro: Chenwis Rojo: Kabylia Verde: Chawis Naranja: Bereberes del Sahara Azul claro: Chleuhs Idiomas bereberes
Análisis de Escalamiento Multidimensional (MDS) Los Bereberes Análisis de Escalamiento Multidimensional (MDS) distancia FST - ADN mt Cerny et al, 2004
Los Bereberes
Análisis Factorial de Correspondencias Los Bereberes 1 : Arabes de Doukkala (Maroc) ; 2 : Berbères de Amizmiz (Maroc) ; 3 : Berbères de Asni (Maroc) ; 4 : Berbères de Khenifra (Maroc) ; 5 : Berbères de Bourhia (Maroc) ; 6 : Berbères de Basse Kabylie ; 7 : Berbères de Haute Kabylie ; 8 : Berbères Mzab (Algérie) ; 9 : Berbères de Takrouna:Jeradou (Tunisie) ; 10 : Berbères de Douiret:Chenini (Tunisie) ; 11 : Berbères de Djerba (Tunisie) ; 12 : Touaregs Issequamarenes (Algérie) ; 13 : Amhara Tigrai (Ethiopie) ; 14 : Issas (Djibouti) ; 15 : Bwa (Mali) ; 16 : Mendenka (Sénégal) ; 17 : Fulani (Sénégal) ; 18 : Baoule (Côte d’Ivoire) ; 19 : Yorubas (Nigeria) ; 20 : Pygmées Aka (République Centrafrique). Análisis Factorial de Correspondencias frecuencias GM Coudray et al, 2004
El análisis estadístico de la similaridad Método del mínimo Método del máximo Método de la media Dendrogramas
Método Neighbour Joining El análisis estadístico de la similaridad i j Método del centroide Método UPGMA Método Neighbour Joining Dendrogramas
El análisis estadístico de la similaridad 1 2 3 4 5 1 0 0,5 1 2 5 2 0 2 3 4 3 0 7 8 4 0 6 5 0 1/2 3 4 5 1/2 0 1,5 2,5 4,5 3 0 7 8 4 0 6 5 0 1/2/3 4 5 1/2/3 0 4,75 6,25 4 0 6 5 0 Dendrogramas
El análisis estadístico de la similaridad 1 2 3 4 5 1 0 0,5 1 2 5 2 0 2 3 4 3 0 7 8 4 0 6 5 0 1 2 3 4 5 1 0 0,5 1 2 5 2 0 7 3 4 3 0 2 8 4 0 6 5 0 1 2 3 4 5 1 0 4 1 2 5 2 0 2 3 0,5 3 0 7 8 4 0 6 5 0 Bootstrap …
El análisis estadístico de la similaridad Bootstrap Calderón et al, 1998: GM, Matriz R, NJ, bootstrap
Autocorrelación espacial Otros métodos estadísticos útiles en Antropogenética Autocorrelación espacial Peña et al, 2002: Persistencia de actividad lactasa en Europa
Otros métodos estadísticos útiles en Antropogenética Test de Mantel
Otros métodos estadísticos útiles en Antropogenética Clinas Peña et al, 2002: Persistencia de actividad lactasa en Europa. Clina SSE-NNO
Otros métodos estadísticos útiles en Antropogenética Clinas Peña et al, 2004: Clinas en VNTRs
Otros métodos estadísticos útiles en Antropogenética Mapas sintéticos Roewer et al, 2005: Y-STRs
Otros métodos estadísticos útiles en Antropogenética STRP: STRs autosómicos RSP: polimorfismos de restricción HVS1, HVS2: ADN mt Y STRP: STRs cromosoma Y AMOVA Jorde et al, 2000
Otros métodos estadísticos útiles en Antropogenética Frec P<0,01 Haplotipo Tests de neutralidad
Desequilibrio de ligamiento Otros métodos estadísticos útiles en Antropogenética B8 no B8 Total A1 376 235 611 no A1 91 1265 1356 Total 467 1500 1967 Locus A Locus B +/+ +/- -/+ -/- Total a b c d n A1 B8 376 235 91 1265 1967 0,311x0,237+0,077=0,151 Desequilibrio de ligamiento
Desequilibrio de ligamiento Otros métodos estadísticos útiles en Antropogenética Desequilibrio de ligamiento Peña et al, 2002
Mapa de ligamiento de 114 SNPs en varios grupos étnicos Goddard et al, 2000
Otros métodos estadísticos útiles en Antropogenética Probabilidad de coincidencia (Matching probability) Capacidad de discriminación (Power of discrimination) Capacidad de exclusión (Power of exclusion) Genética Forense
Otros métodos estadísticos útiles en Antropogenética Indice de paternidad, PI Indice de paternidad combinado, CPI Probabilidad de paternidad Genética Forense