Estimación de distancias nucleotídicas ACGTGACGGCCAGTGGCAGTGGCAG |||x||x||x||||x||||x|||x| ACGCGAAGGTCAGTAGCAGGGGCGG Distancia simple is la proporción de nucleótidos que son diferentes entre ambas secuencias D=6/25=0.24 S=19/25=0.76 P=4/25=0.16 Q=2/25=0.08
Pero…..cuando las distancias son relativamente grandes aparecen ciertos problemas 1 cambio, 1 diferencia 2 cambios, 1 diferencia A 2 cambios, 0 diferencias G 2 cambios, 0 diferencias C 3 cambios, 0 diferencias C A G
T C A G T C A G T C A G Modelo Jukes-Cantor 1-λ λ/3 λ/3 λ/3 λ/3 1-λ From T 1-λ λ/3 λ/3 λ/3 C λ/3 1-λ λ/3 λ/3 A λ/3 λ/3 1-λ λ/3 G λ/3 λ/3 λ/3 1-λ
T C A G k =2λt 1-λ λ/3 λ/3 λ/3 λ/3 1-λ λ/3 λ/3 λ/3 λ/3 1-λ λ/3 λ/3 λ/3 S=1 D=0 S1 S2 λt k =2λt
T intervals of time
% de diferencias Tiempo
Modelo de dos parámetros de Kimura C A G β α 1-α-2β α β G A C T 1-Q-P G G C A A C T T α β G A C A G C P G T C A C A T G Q
Para tiempo =0 P=0 and Q=0 De estas ecuaciones obtenemos
Modelo sin restricciones A T C G A T C G
G C T A A T C G A T C G Tajima-Nei 1984 Equal input model a1 1-(a1+a2+a3) a3 a2 a1 a4 1-(a2+a3+a4) Tajima-Nei 1984 Equal input model Tamura (1992) A T C G A T C G A T C G A T C G Tamura-Nei (1994)
/to From T C A G p11 p12 P13 p14 p21 p32 P23 p24 p31 P33 p34 p41 p42 Estimando el estado estacionario de secuencias de ADN a partir de datos reales El primer objetivo es obtener la matriz de sustitución. Es decir aquella que tiene las probabilidades de cambio de cada nucleótido a los restantes T C A G p11 p22 p12 p13 p33 p31 p21 p14 p44 p24 p42 p43 p34 /to From T C A G p11 p12 P13 p14 p21 p32 P23 p24 p31 P33 p34 p41 p42 P43 p44
TACATCCGGATGCACTACTCGAT Sp1 TACGTTCCGATACAGTTCCCGCT Sp2 Para este propósito construimos una matriz de substituciones observadas Species 1 Species 2 Outgroup TACATCCGGATGCACTACTCGAT Sp1 TACGTTCCGATACAGTTCCCGCT Sp2 TACGTTCCGATGCAGTACGGGAT Outgoup ***+*+*+***+**+*+*++*+* /to From T C A G 5 1 4 3 2
Número esperado de sustituciones /to From T C A G p11 p12 P13 p14 p21 p32 P23 p24 p31 P33 p34 p41 p42 P43 p44 T=2300 C=3000 A=2500 G=3100 Tendremos entonces p11*2300 Ts que permanecerán como T, p12*2300 Ts que cambiarán hacia C, p13*2300 que cambiarán de T a A y p14*2300 que cambiarán de T hacia G /to From T C A G P11*2300 p12*2300 p13 *2300 p14*2300 p21*3000 p32*3000 p23*3000 p24*3000 p31*2500 p32*2500 p33*2500 p34*2500 p41*3100 p42*3100 p43*3100 p44*3100
Normalización: From/to T C A G Total 5 1 6 4 3 2 From/to T C A G 5/6 6 4 3 2 From/to T C A G 5/6 1/6 0/6 0/5 4/5 1/5 3/5
ESCALAMIENTO T C A G /to From T C A G 5 1 4 3 2 From/to T C A G 5/6 4 3 2 From/to T C A G 5/6 1/6 0/6 0/5 4/5 1/5 3/5 0.83 0.167 0 0 0 0.80 0 0.20 0.20 0.20 0.60 0 0 0.20 0.20 0.60 T C A G 0.1463 0.4878 0.1220 0.2439
Normalización: From/to T C A G Total 5 1 6 4 3 2 From/to T C A G 5/6 6 4 3 2 From/to T C A G 5/6 1/6 0/6 0/5 4/5 1/5 3/5
ESCALAMIENTO T C A G /to From T C A G 5 1 4 3 2 From/to T C A G 5/6 4 3 2 From/to T C A G 5/6 1/6 0/6 0/5 4/5 1/5 3/5 0.83 0.167 0 0 0 0.80 0 0.20 0.20 0.20 0.60 0 0 0.20 0.20 0.60 T C A G 0.1463 0.4878 0.1220 0.2439
T C A G 0.1463 0.4878 0.1220 0.2439 T C A G T C A G 0.8333 0.1667 0.8000 0.2000 0.6000 Cantidad de cambios= 0.1667* 0.1463 +0* 0.1463+0* 0.1463+ 0*0.4878+0* 0.4878+0.2*0.4878+ 0.2*0.1222+0.2*0.122+0*0.122+ 0*0.2439+0.2*0.2439+0.2*0.2439 =0.2683
----- 0.1667 0.2000 0.0373* ----- 0.0062 0.0075 0.9938 0.0062 0.9925 0.0075 0.9851
0.8333 0.1667 0.8000 0.2000 0.6000 0.9938 0.0062 0.9925 0.0075 0.9851