ESTADÍSTICA BÁSICA EN ECOLOGÍA EVOLUTIVA Juan J. Soler Cruz Estación Experimental de Zonas Áridas Almería
1)¿Cuantos organismos hay? 2)¿Cuántos tipos distintos? 3)Caracteres de cada uno de ellos 4)¿Cuantos de cada tipo? 5)¿Hay alguno más común que otro?
Número% sp sp sp sp sp sp sp sp sp Sp sp sp sp sp sp sp sp sp sp sp
Número% sp sp sp sp sp sp sp sp sp sp sp sp sp sp sp sp sp sp sp sp
Parámetros que pueden influir en el éxito reproductor ¿Tamaño? ¿Peso? ¿Condición física? ¿Factores ambientales?
Medidas descriptivas de las variables Valor representativo de la población (¿cuánto suelen medir?) Valor representativo de la variabilidad del carácter (¿cómo son de similares entre si los distintos individuos). Valores representativos de las distribuciones de frecuencias. (¿la mayoría de los organismos son muy similares entre si mientras que muy pocos difieren de la mayoría, al contrario, o algo intermedio?)
Medidas descriptivas de las variables Valor representativo de la población (¿cuánto suelen medir?) Media, Mediana, moda,..
Medidas descriptivas de las variables Valor representativo de la población (¿cuánto suelen medir?) Media: Suma de todas las medidas dividido por el numero de individuos en los que la hemos medido Mediana: El valor que divide a la población en 50% de los individuos a un lado y los otros 50% al otro Moda: el valor con mayores frecuencias en la población Percentiles (25, 50, 75, 90, etc): valor que deja a la izquierda el porcentaje de individuos que indica el número
Medidas descriptivas de las variables Valor representativo de la variabilidad del carácter (¿cómo son de similares entre si los distintos individuos). Varianza, error estándar, coeficiente de variación, etc
Medidas descriptivas de las variables Valor representativo de la variabilidad del carácter (¿cómo son de similares entre si los distintos individuos). Varianza: Suma de las diferencias entre la media y la medida real de cada individuo, elevadas al cuadrado, y dividido por el nº de individuos en la que la hemos medido. Desviación estándar: Raíz cuadrada de la varianza. Error estándar: Desviación dividido por la raíz cuadrada de n – 1. Coeficiente de variación: Media dividida por la variación.
Medidas descriptivas de las variables Valores representativos de las distribuciones de frecuencias. (¿la mayoría de los organismos son muy similares entre si mientras que muy pocos difieren de la mayoría, al contrario, o algo intermedio?) Kurtosis K > 0K = 0K < 0
Medidas descriptivas de las variables Valores representativos de las distribuciones de frecuencias. (¿la mayoría de los organismos son muy similares entre si mientras que muy pocos difieren de la mayoría, al contrario, o algo intermedio?) Skewness Sk > 0Sk = 0Sk < 0
Variables a estimar Éxito reproductor (V. continua) Tamaño (V. continua) Peso (V. continua) Factores ambientales manipulación (V. discreta) Color (V. discreta)
¿Medimos a todos los individuos de la población? Número de individuos: 103 Tiempo necesario para tomar los datos necesarios de cada individuo: 12h Horas de campo necesarias: 1263 Días de campo (a unas 10h/día): 127 Si sólo se reproducen en primavera no podríamos realizar el muestreo completo en un año
¿Existe alguna forma de estimar un número adecuado de tamaño de muestra? Necesitamos saber : Variabilidad y distribución de los datos Qué queremos conseguir con los datos
Medidas descriptivas de las variables Valor representativo de la variabilidad del carácter (¿cómo son de similares entre si los distintos individuos). Varianza, error estándar, coeficiente de variación, etc
Intuición
EQUACIÓN GENERAL
Medidas descriptivas de las variables Media = Varianza= N = 103 Kurtosis = -0.8 Skewness=.12 La distribución de frecuencias que encontramos, ¿se aproxima a una distribución Normal?
Medidas descriptivas de las variables Media = Varianza= N = 103 Kurtosis = -0.8 Skewness=.12 K-S d = , p> 0.20; Lilliefors p> 0.20
Prácticas con las demás variables Las estimamos en Excell??? Solo utilizamos: Suma(); ordenar casillas, *, /
Exagerado Disminuido Control Tipo 1 Tipo 2 Tipo 3 Tipo 4
Negr.Verd. Mor. AzulTotal Más Menos Control Todos EXPERIMENTO Variables: Tamaño, peso, color, experimento, éxito reproductor. Variable dependiente: ?? Variable independiente: ?? Hipótesis: Variaciones en el ambiente determinan el éxito reproductor. Predicción: el experimento influye en el éxito reproductor
Negr.Verd. Mor. AzulTotal Más Menos Control Todos EXPERIMENTO Variables: Tamaño, peso, color, experimento, éxito reproductor. Variable dependiente; Variable independiente; Predicción: el experimento influye en el éxito reproductor
DIFERENCIAS ENTRE GRUPOS EXPERIMENTALES (TAMAÑO)
DIFERENCIAS ENTRE GRUPOS EXPERIMENTALES (TAMAÑO) MásMenosControl
DIFERENCIAS ENTRE GRUPOS EXPERIMENTALES (PESO)
DIFERENCIAS ENTRE GRUPOS EXPERIMENTALES (Éxito reproductor)
significativas ¿Podemos decir que son significativas las diferencias? P < 0.05
Ejemplo: Comparación entre grupos experimentales: Más y Menos T(Student) y Anova ÉXITO REPRODUCTOR más menos
Ejemplo: Comparación entre grupos experimentales: Más y Menos T(Student) y Anova ÉXITO REPRODUCTOR más menos
Ejemplo: Comparación entre grupos experimentales: Más y Menos T(Student) y Anova ÉXITO REPRODUCTOR H 0 = ?? H 1 = ??
Ejemplo: Comparación entre grupos experimentales: Más y Menos T(Student) y Anova ÉXITO REPRODUCTOR H 0 : Valor medio de “Más” = valor medio de “Menos” H 1 : Valor medio de “Más” valor medio de “Menos”
Ejemplo: Comparación entre grupos experimentales: Más y Menos T(Student) y Anova ÉXITO REPRODUCTOR H0H0
Ejemplo: Comparación entre grupos experimentales: Más y Menos T(Student) y Anova ÉXITO REPRODUCTOR H0H0 H1H1
Ejemplo: Comparación entre grupos experimentales: Más y Menos T(Student) y Anova ÉXITO REPRODUCTOR H0H0 H1H1 H1H1
Ejemplo: Comparación entre grupos experimentales: Más y Menos T(Student) y Anova ÉXITO REPRODUCTOR
Ejemplo: Comparación entre grupos experimentales: Más y Menos T(Student) y Anova ÉXITO REPRODUCTOR
Ejemplo: Comparación entre grupos experimentales: Más y Menos T(Student) y Anova ÉXITO REPRODUCTOR d.f = n x + n y –2 = 68 P =
Ejemplo: Comparación entre grupos experimentales: Más y Menos T(Student) y Anova ÉXITO REPRODUCTOR
Error tipo I: rechazar H 0 siendo verdadera Error tipo II: no rechazar H 0 siendo falsa α β 1-β H0H0 H1H1 t = 5.35
Prácticas con las demás variables ¿Existen diferencias significativas en peso y en la longitud entre grupos experimentales? Las estimamos en Excell???
DIFERENCIAS ENTRE GRUPOS EXPERIMENTALES (Éxito reproductor)
DIFERENCIAS ENTRE GRUPOS EXPERIMENTALES (Éxito reproductor) COMPARACIÓN DE DOS O MAS MEDIAS: Análisis de la varianza (ANOVA)
DIFERENCIAS ENTRE GRUPOS EXPERIMENTALES (Éxito reproductor) COMPARACIÓN DE DOS O MAS MEDIAS: Análisis de la varianza (ANOVA) Variación total Variación dentro de cada subgrupo ?
DIFERENCIAS ENTRE GRUPOS EXPERIMENTALES (Éxito reproductor) COMPARACIÓN DE DOS O MAS MEDIAS: Análisis de la varianza (ANOVA) Variación total Variación media de cada subgrupo =F a,b
DIFERENCIAS ENTRE GRUPOS EXPERIMENTALES (Éxito reproductor) COMPARACIÓN DE DOS O MAS MEDIAS: Análisis de la varianza (ANOVA) F 1,68 = = (t 68 ) 2 = ; P =
DIFERENCIAS ENTRE GRUPOS EXPERIMENTALES (Éxito reproductor) COMPARACIÓN DE DOS O MAS MEDIAS: Análisis de la varianza (ANOVA) F 2,100 = 13.95, P =
DIFERENCIAS ENTRE GRUPOS EXPERIMENTALES (Éxito reproductor) COMPARACIÓN POST-HOC: Análisis de la varianza (ANOVA) F 2,100 = 13.95, P = P = P = P = 0.018
Prácticas con las demás variables ¿Existen diferencias significativas en peso y en la longitud entre grupos experimentales?
¿EXISTE RELACIÓN ENTRE PESO, TAMAÑO Y ÉXITO REPRODUCTOR? ¿Lineal? Y = a(X) + b
¿EXISTE RELACIÓN ENTRE PESO, TAMAÑO Y ÉXITO REPRODUCTOR? ¿SI, NO?
RELACIÓN ENTRE TAMAÑO Y ÉXITO REPRODUCTOR
RELACIÓN ENTRE TAMAÑO Y ÉXITO REPRODUCTOR ¿lineal?
RELACIÓN ENTRE TAMAÑO Y ÉXITO REPRODUCTOR ¿logarítmica?
RELACIÓN ENTRE TAMAÑO Y ÉXITO REPRODUCTOR ¿polinomial?
RELACIÓN ENTRE TAMAÑO Y ÉXITO REPRODUCTOR
RELACIÓN ENTRE TAMAÑO Y ÉXITO REPRODUCTOR polinomial logarítmica lineal
¿Cómo saber si se ajustan a una línea con una cierta probabilidad?
H 0 = ?? H 1 = ??
¿Cómo saber si se ajustan a una línea con una cierta probabilidad? H 0 = d ≠0 H 1 = d =0
¿Cómo saber si se ajustan a una línea con una cierta probabilidad? H 0 = d ≠0 H 1 = d =0
¿Coeficiente de regresión o coeficiente de correlación? FITNESS = * PESO Correlation: r = % Varianza explicada = 100*r 2 = 13.3
Coeficiente de regresión (pendiente) FITNESS = * PESO
Coeficiente de regresión Limites de confianza (regresión tipo I)
Coeficiente de regresión ¿regresión tipo I, o tipo 2?
Coeficiente de regresión ¿regresión tipo I, o tipo 2?
Coeficiente de regresión ¿regresión tipo I, o tipo 2?
Coeficiente de regresión regresión tipo 2
Término independiente (punto de corte) FITNESS = * PESO
Coeficiente de correlación R = 0.416, t 101 = 4.6, P =
Prácticas con las demás variables ¿Están relacionadas las variables entre sí?
Estima de la condición (física) Definición? Sugerencias de estimas?
Estima de la condición (física) Definición? Sugerencias de estimas? Residuos del peso controlado por el tamaño
Cálculo de residuos
Práctica: Explica la variable condición el éxito reproductor? ¿mejor o peor que el peso y el tamaño? ¿qué conclusiones extraeríamos de nuestro análisis?
Resultados ¿Conclusión?
ANÁLISIS DE FRECUENCIAS
Exagerado Disminuido Control Tipo 1 Tipo 2 Tipo 3 Tipo 4
Negr.Verd. Mor. AzulTotal Más Menos Control Todos EXPERIMENTO Suponiendo que los individuo de distinto color, se distribuyen de forma aleatoria ¿existe algún color predominante en la población? H 0 = ???
Negr.Verd. Mor. AzulTotal Más Menos Control Todos EXPERIMENTO Suponiendo que los individuos de distinto color, se distribuyen de forma aleatoria ¿existe algún color predominante en la población? H 0 = Las frecuencias de aparición de cada color deben de ser iguales
Negr.Verd. Mor. AzulTotal Más Menos Control Todos EXPERIMENTO ¿existe algún color predominante en la población? H 0 = Las frecuencias de aparición de cada color deben de ser iguales OBSERVADOS 4
OE(O-E)(O-E) 2 (O-E) 2 /E H 0 = Las frecuencias de aparición de cada color deben de ser iguales
OE(O-E)(O-E) 2 (O-E) 2 /E 2 = d.f. = 3 P = H 0 = Las frecuencias de aparición de cada color deben de ser iguales H 1 = Las frecuencias de aparición de cada color no son iguales
Negr.Verd. Mor. AzulTotal Más Menos Control Todos EXPERIMENTO Suponiendo que los individuos de distinto color, se distribuyen de forma aleatoria ¿Está nuestra muestra experimental sesgada hacia algún color en alguno de los tipos? H 0 = ???
Negr.Verd. Mor. AzulTotal Más Menos Control Todos EXPERIMENTO ¿Está nuestra muestra experimental sesgada hacia algún color en alguno de los tipos? H 0 = El total de un color se debe de repartir uniformemente en cada uno de los tipos experimentales
Observados NegroverdeMoradoAzulTotal más menos control Total Esperados NegroverdeMoradoAzulTotal más menos control Total????? H 0 = El total de un color se debe de repartir uniformemente en cada uno de los tipos experimentales
Observados NegroverdeMoradoAzulTotal más menos control Total Esperados NegroverdeMoradoAzulTotal más????? menos????? control????? Total H 0 = El total de un color se debe de repartir uniformemente en cada uno de los tipos experimentales
Observados NegroverdeMoradoAzulTotal más menos control Total Esperados NegroverdeMoradoAzulTotal más menos control Total H 0 = El total de un color se debe de repartir uniformemente en cada uno de los tipos experimentales
(Observados – Esperados) NegroverdeMoradoAzulTotal más menos control Total H 0 = El total de un color se debe de repartir uniformemente en cada uno de los tipos experimentales Análisis log-linear 2 = 6.63; d.f. = 8; P < 0.58
Uso del análisis log-linear para Testar asociaciones ¿Predice el grupo experimental (más, menos, control) las frecuencias de individuos con éxito reproductor mayor o menor de la media poblacional? H 0 = las frecuencias de individuos que superen la media poblacional no depende del grupo experimental al que pertenezcan
másmenoscontrol Total Menor que la media Mayor que la media Total másmenoscontrol Total Menor que la media Mayor que la media Total Uso del análisis log-linear para Testar asociaciones H 0 = las frecuencias de individuos que superen la media poblacional no depende del grupo experimental al que pertenezcan
Uso del análisis log-linear para Testar asociaciones H 0 = las frecuencias de individuos que superen la media poblacional no depende del grupo experimental al que pertenezcan másmenoscontrol Total Menor que la media Mayor que la media Total másmenoscontrol Total Menor que la media53 Mayor que la media50 Total
másmenoscontrol Total Menor que la media Mayor que la media Total másmenoscontrol Total Menor que la media Mayor que la media Total Uso del análisis log-linear para Testar asociaciones H 0 = las frecuencias de individuos que superen la media poblacional no depende del grupo experimental al que pertenezcan
Análisis log-linear: 2 = 8.96; d.f. = 2; P < Uso del análisis log-linear para Testar asociaciones H 0 = las frecuencias de individuos que superen la media poblacional no depende del grupo experimental al que pertenezcan másmenoscontrol Total Menor que la media Mayor que la media Total másmenoscontrol Total Menor que la media Mayor que la media Total
Uso del análisis log-linear para Testar asociaciones H 0 = las frecuencias de individuos que superen la media poblacional no depende del grupo experimental al que pertenezcan 2 = 8.96; d.f. = 2; P < másmenoscontrol Total Menor que la media Mayor que la media Total
Prácticas Análisis Log-Linear y Otras tablas de contingencia
Regresión logística Normalmente, se utiliza para ver si la probabilidad de que ocurra un suceso se asocia a una variable continua. Por ejemplo: Existe una mayor probabilidad de quedarse calvo conforme aumenta la edad
Regresión logística Normalmente, se utiliza para ver si la probabilidad de que ocurra un suceso se asocia a una variable continua. Por ejemplo: Existe una mayor probabilidad de quedarse calvo conforme aumenta la edad Con nuestros datos: los individuos de mayor peso tienen una probabilidad mayor de tener más éxito reproductor que la media poblacional?
Regresión logística ¿si?
Regresión logística
Chi²(1)= p= Regresión logística
Chi²(1)= p= ? ? ? ? Regresión logística
Prácticas Regresión logística ¿influye el tamaño?
TESTS NO PARÁMETRICOS
ESTADÍSTICA MULTIVARIANTE
Manova: color, experimento, fitness (covariable: condicion) Regresión multiple: peso, tamaño y fitness Condición física