Elementos generales de los test de hipótesis y estadística inferencial

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

ANALISIS PARAMÉTRICOS
Tema 16: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
Tema 15. Contraste de hipótesis: Planteamiento de las hipótesis
1.1 Contraste de Bondad de Ajuste para Datos Categóricos
TEMA 6: CONTRASTES NO PARAMÉTRICOS
Estadística Aplicada a Ecología
Demostración de Asociación
Pruebas de significancia para datos cualitativos
Contraste de Hipótesis
KRUSKAL WALLIS Jorge Iván Betancur Marta Isabel Naranjo García
Estadística Teórica II
La prueba U DE MANN-WHITNEY
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
PRUEBAS DE HIPOTESIS HIPOTESIS
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
Uso de pruebas estadísticas paramétricas y no paramétricas
Pruebas de hipótesis Walter Valdivia Miranda
ANOVA Modelo I: Comparación entre medias
Definición de Hipótesis de Investigación.
Prueba de hipótesis Equivalencia entre la prueba de hipótesis y los intervalos de confianza Valor de probabilidad Valor de probabilidad unilateral Prueba.
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
ANALISIS DE DATOS CON EXCEL
Clases 3 Pruebas de Hipótesis
Unidad VI: PRUEBAS DE HIPOTESIS
Clases 4 Pruebas de Hipótesis
Curso Práctico de Bioestadística Con Herramientas De Excel Fabrizio Marcillo Morla MBA (593-9)
Probabilidad y prueba de significancia de Chi-Cuadrado (X²)
Diseño Estadístico y Herramientas para la Calidad
ANALISIS DE DATOS CATEGORICOS
Tema 17: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
Tema 7: Introducción a los contrastes de hipótesis
Investigación Experimental
AÑO DE PROMOCIÓN DE LA INDÚSTRIA RESPONZABLE Y COMPROMISO CLIMÁTICO
Inferencias con datos categóricos
Tema : Introducción a los contrastes de hipótesis
ESTADÍSTICAS DESCRIPTIVA
Pruebas No paramétricas
Prof. Rosario Martínez Verdú
Análisis Cuantitativo de Datos (Básico)
Clase 4a Significancia Estadística y Prueba Z
Análisis y diseño de experimentos
Herramientas básicas.
Capítulo 1. Conceptos básicos de la Estadística
1 ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia y Coeficientes de Asociación.
La Distribución Normal.
Pruebas de hipótesis.
PRUEBAS ESTADISTICAS NO PARAMETRICAS
Análisis de los Datos Cuantitativos
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
Estadística para administradores
Aspectos generales de la investigación educativa en el SNIT
CONTRASTE DE HIPÓTESIS Dimensiones Largo275mm. 169 mm 2 Ancho175mm.49 mm 2 Alto175mm.49 mm 2 Peso16 Kg.1 Kg 2. SITUACIÓN PROBLEMA.
Metodología de la Investigación Cát. I
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
INTRODUCCIÓN AL ANÁLISIS DE DATOS CATEGÓRICOS. Temas Carácterísticas de la distribución Chi-cuadrada Prueba de bondad de ajustes Prueba de homogeneidad.
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
Estimación Estadística Tares # 3. Estimación Estadística Conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a.
PRUEBA DE SIGNIFICANCIA
Estadística Inferencial
Tarea # 4 PRUEBAS DE HIPÓTESIS ESTADÍSTICAS. PRUEBA DE HIPÓTESIS Hipótesis es una aseveración de una población elaborado con el propósito de poner a prueba,
6.1 Las hipótesis Nazira Calleja. Tipos Hipótesis investigación Hipótesis estadísticas.
PRUEBA CHI-CUADRADO UNIDAD 2: ESTADÍSTICA.
PRUEBA DE SIGNIFICANCIA
ANALISIS DE VARIANZA.
YASIR MOUBARIK GONZALEZ ESTADISTICA Y TIC SUBGRUPO 19 UNIDAD DOCENTE VIRGEN DEL ROCIO.
Evaluando los promedios de grupos distintos UNIDAD 7 1.
Transcripción de la presentación:

Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a partir de muestras de la población. Hipótesis Nula (Ho) Observaciones Test estadístico Supuestos Test Estadístico Componentes Estadística Biología Marina 2003

Poniendo a prueba hipótesis estadísticas. Determinar la hipótesis nula partir de una declaración sobre la población. La hipótesis nula expresa el concepto de “NO DIFERENCIA” De esta manera, generalmente la hipótesis nula expresa la ausencia de un patrón. Inferencia: deducir una cosa a partir de otra Estadística Biología Marina 2003

Preguntas biológicas versus hipótesis “nula” estadística ¿Los machos y hembras difieren en tamaño? Ho: El tamaño promedio de machos y hembras es el mismo. ¿Existen diferencias entre la estructura de talla de dos poblaciones de peces? Ho: La distribución de frecuencia de tallas es independiente de la población. Estadística Biología Marina 2003

Si concluimos que la hipótesis nula es falsa… Una hipótesis alternativa (Ha) es asumida como verdadera. Cada test estadístico debe tener una Ho y Ha, y todos los posibles resultados son cubiertos por este par de hipótesis. Estadística Biología Marina 2003

TENER EN CUENTA: “L as hipótesis deben ser establecidas ANTES que los datos sean recolectados. Proponer hipótesis después de la examinación de los datos puede invalidar un test estadístico.” Estadística Biología Marina 2003

Testeado una hipótesis biológica Cuestionamiento biológico ¿La droga A y B difieren en su eficacia en el tratamiento del cáncer? Generación de hipótesis biológica. Generación de predicción biológica. Hipótesis biológica Sobre vivencia A B Inducción: Deduccción: sacar consecuencias a partir de un principio proposición o supuesto Estadística Biología Marina 2003

Al tener los datos se debe seguir los siguientes pasos: Someter los datos a análisis estadístico. La función del test estadístico es generar un valor (el valor de un test estadístico), el cual es convertido vía una tabla o un algoritmo (computador) a un valor de probabilidad. Interpretación del test estadístico y su probabilidad. Estadística Biología Marina 2003

Pero: ¿Qué tan diferentes necesitan ser dos valores para que podamos concluir, al menos TENTATIVAMENTE, que son diferentes? Sobre vivencia A B ¿Son diferentes? Estadística Biología Marina 2003

Ha Ho Tomando una decisión Es necesario un criterio objetivo para rechazar o no rechazar una hipótesis nula. Deben existir algunos puntos prácticos en los que nos situemos convencidos de rechazar o no rechazar una hipótesis. En este sentido la probabilidad asociada (P) con el test estadístico se encarga de tomar la decisión por nosotros. Estadística Biología Marina 2003

Algo sobre probabilidades: La probabilidad de que un evento ocurría oscila entre 0 y 1 (0 = evento imposible y 1 = siempre ocurre este evento). Para probar una hipótesis sobre la media, debemos evaluar si es alta o baja la probabilidad de que la media de la muestra esté cerca de la media de la distribución muestral. Si es baja, el investigador dudará en generalizar a la población o si es alta, el investigador podrá hacer generalizaciones Estadística Biología Marina 2003

Nivel de significáncia o Nivel alfa (denotados por ) ¿Qué tan alta o baja debe ser nuestra probabilidad para poder indicar a ciencia cierta que la media de la muestra está cerca o lejos de la media poblacional? Nivel de significáncia o Nivel alfa (denotados por ) Punto de referencia En general una probabilidad de 0.05 o 5% (a veces se utiliza también 0.01 o 1%) es comúnmente utilizada como nivel de significancia Veamos un ejemplo practico… Estadística Biología Marina 2003

Vamos a apostar a las carreras de caballos. Catillo Morochito 5% v/s 95% ¿Apostarían?, ¿A que caballo? ¿Es una decisión difícil de tomar? Pero… ¿Estarían completamente seguros de ganar? Estadística Biología Marina 2003

De esta forma alfa = 0.05 nos expresa el nivel de seguridad con el que estamos tomando nuestra decisión En otras palabras: Un nivel de significáncia de 0.05 implica que el investigador tiene 95% de seguridad para generalizar sin equivocarse, y sólo 5% en contra. En términos de probabilidad, 0.95 y 0.05, ambos suman la unidad (universo) Estadística Biología Marina 2003

De esta manera, la matriz de posibilidades es: Si la probabilidad es > que el nivel de significancia, entonces OPERACIONALMENTE, concluimos que los datos APOYAN la Ho. Esto es, que la Ho es “verdadera”. No se obtuvo significancia estadística. Si la probabilidad generada es  que el nivel de significancia, entonces concluimos que no es verdad que la Ho es correcta. De este modo la Ho es RECHAZADA. Mientras menor sea la probabilidad generada (0.0001 vs 0.049), mayor confidencia se tiene para rechazar la Ho. Estadística Biología Marina 2003

En resumen: Estadística Biología Marina 2003

¿Es posible cometer un error al realizar estos procedimientos de estadística inferencial? Nunca podemos estar completamente seguros de nuestra estimación. Trabajamos con altos niveles de confianza o seguridad y aunque el riesgo es mínimo, podría cometerse un error. Estos son… Estadística Biología Marina 2003

Aceptar un hipótesis verdadera (decisión correcta). Rechazar una hipótesis falsa (decisión correcta). Aceptar una hipótesis falsa (error conocido como el tipo II o beta). Rechazar una hipótesis verdadera (error conocido como de tipo I o error alfa). Estadística Biología Marina 2003

Muestras representativas Inspección cuidadosa de datos Ambos errores son ideseables y para reducir la probabilidad de cometerlos se debe tener en cuenta: Muestras representativas Inspección cuidadosa de datos Selección de pruebas estadísticas apropiadas Conocimiento apropiado de la población con la que estamos trabajando Estadística Biología Marina 2003

Tipos de errores en los Test de Hipótesis Si Ho es verdadera Si Ho es falsa Si Ho es rechazada Error tipo I (alfa) No hay error Si Ho no es rechazada Error tipo II (beta) Estadística Biología Marina 2003

Veamos como funcionan los test estadísticos con el test de chi-Cuadrado Estadística Biología Marina 2003

Test de bondad de ajuste de chi-cuadrado o X2 Es una prueba estadística para evaluar hipótesis acerca de la relación entre variables nominales. Como funciona: A partir de datos “observados” evalua si la población de éstos, se ajustan a una determinada distribución teórica “esperada” ¿Les suena conocido? Estadística Biología Marina 2003

Se realiza un cruce monohibrido de 100 plantas A = alelo para color amarillo. a = alelo para color verde. Se realiza un cruce monohibrido de 100 plantas heterocigotas ¿Resultados? Relación fenotípica de 3:1 (amarillas verdes) Resultados: 84 amarillas. 16 verdes. ¿La distribución observada se ajusta o no se ajusta a la distribución esperada? Estadística Biología Marina 2003

Cuales son la Hipótesis Estadísticas Ha: las frecuencias observadas son iguales a las frecuencias esperadas. Ha: las frecuencias observadas son diferentes a las frecuencias esperadas. Estadística Biología Marina 2003

El cálculo del estadístico Chi-Cuadrado X2 =  (frecuencia esperada-frecuencia observada)2 frecuencia esperada o Entrega una medida de cuan lejos la distribución observada se encuentra de la distribución esperada. Estadística Biología Marina 2003

Para nuestro ejemplo ¿Contra que comparamos este valor? Observados Amarillo Verde 84 16 ¿Esperados? Amarillo Verde 75 25 = 4.320 ¿Contra que comparamos este valor? Contra un valor crítico de X2 ,. Este se ubica en la tabla respectiva Con grados de libertad de :  = k -1 X2 0.05,1= 3.841 Estadística Biología Marina 2003

Finalmente: Si el valor calculado es mayor que el valor crítico, se rechaza la Ho. Es este caso Rechazamos Ho, ya que la probabilidad asociada al valor calculado 4.320 es menor a 0.05 (alpha). Es decir: 0.025<P<0.05. Estadística Biología Marina 2003

Conclusión: La proporción de flores amarillas : verdes observadas no se ajusta a la proporción de flores amarillas : verdes esperadas para un cruzamiento de este tipo (chi-cuadrado bondad de ajuste 0.025<P<0.05). Estadística Biología Marina 2003

Errores en Chi Cuadrado. Efecto de una frecuencia observada pequeña: X2 Fe = 20.2 Fo = 22.0 Fe = 0.2 Fo = 2.0 0.162 16.2 A pesar que la diferencia absoluta es igual en ambos casos, Chi-cuadrado es 10 veces más grande en el segundo caso. ¿Cuáles pueden ser las consecuencias de esta situación? Estadística Biología Marina 2003

Recomendación En general se recomienda aplicar este test cuando tenemos frecuencias observadas mayores 5. Estadística Biología Marina 2003

2. Problemas de continuidad: corrección de Yates para continuidad. Permite que los datos de enumeración discreta se aproximen a la distribución continua de X2 Sólo se usa cuando GL = 1, o sea cuando se tienen dos clases Siempre disminuye el valor de X2 Estadística Biología Marina 2003

Si no se corrige, el efecto de discontinuidad incrementa artificialmente el valor de X2 lo suficiente para ocasionar el rechazo de una Ho verdadera. ¿Qué tipo de error es este? Estadística Biología Marina 2003

3. Es fundamental tener en cuenta que el estadístico chi-cuadrado es calculado usando las frecuencias observadas. No es valido convertir los datos a porcentajes e intentar realizar el cálculo. % Estadística Biología Marina 2003

Subdividiendo el Análisis de Chi Cuadrado. Tenemos un cruzamiento dihíbrido ente semillas que arrojó las siguientes frecuencias observadas. Amarillo suave Amarillo Verde suave Verde n F obs 152 39 53 6 250 F esp 140.625 46.875 15.2625 ¿Proporciones esperadas? Estadística Biología Marina 2003

Ho: La muestra viene de una población que tiene proporciones de 9:3:3:1 de semillas amarillas suaves, amarillas, verdes suaves y verdes. Ha: La muestra viene de una población que no tiene proporciones de 9:3:3:1 de semillas amarillas suaves, amarillas, verdes suaves y verdes. Estadística Biología Marina 2003

Calcular: X2 Gl X20.05,3 = 8.972 = 3 = 7.815 Se rechaza Ho Las frecuencias observadas en este cruce dihibrido se alejan significativamente del modelo 9:3:3:1 (X2,0.025 < P < 0.05) Estadística Biología Marina 2003

Pero a pesar de que Ho ha sido rechazada, podemos estar interesados en: Probar si la diferencia significativa entre lo obs y lo esp esta concentrado en alguna clase en particular Probar si la diferencia fue provocada por el efecto los datos en todas las clases. Veamos… Al analizar el calculo de X2, podemos ver que la ultima clase entrega el mayor aporte al valor final de X2 (5.926) Estadística Biología Marina 2003

Al realizar el análisis dejando fuera la última clase: Ho: La muestra viene de una población con proporciones de 9:3:3 en sus primeros tres fenotipos. Ho: La muestra viene de una población sin proporciones de 9:3:3 en sus primeros tres fenotipos. Gl = k-1= 2; X2=0.9201+1.3230+0.80032 = 2.544 X20.05,3 = 5.991 No se rechaza la Ho. Las frecuencias observadas provienen de una población que presenta sus primeras tres frecuencias fenotípicas de 9:3:3 (X2,0.25 < P < 0.50). Estadística Biología Marina 2003

Ahora podemos unir las tres primeras clases y comparar con la ultima Amarillo suave Amarillo Verde suave Verde n F obs 152 39 53 6 250 F esp 140.625 46.875 15.2625 Ho: La muestra viene de una población con proporciones de 1:15 de semillas verdes y otros fenotipos de semillas. Ho: La muestra no viene de una población con proporciones de 1:15 de semillas verdes y otros fenotipos de semillas. Gl = k-1 = 1; X2 = 5.929 + 0.3953 = 6.324 X2 0.05,3 = 3.841 Se rechaza Ho. Estadística Biología Marina 2003

Las muestras no provienen de una población con proporciones esperadas de 1:15 de semillas verdes y otros fenotipos de semillas (X2, 0.01 < P < 0.025). Atención: ¿Le falta algo a este último cálculo? Estadística Biología Marina 2003

Heterogeneidad de Chi-cuadrado En ocasiones un determinado set de datos son probados en contra de una misma hipótesis nula. ¿Podremos combinar todos los datos con el propósito de desarrollar un único análisis estadístico de Chi-cuadrado? Veamos un ejemplo Estadística Biología Marina 2003

Ho: Las arbejas provienen de una población con una proporción de 3:1 Exp. Amarillo Verde Total(n) X2 GL 1 25 11 36 0.5926 2 32 7 39 1.0342 3 14 5 19 0.0175 4 70 27 97 0.4158 24 13 37 2.0270 6 20 26 0.0513 45 0.3630 8 44 9 53 1.8176 50 64 0.3333 10 18 62 0.5376 X2 0.05,1 = 3.841 “En ningún caso la Ho es rechazada” Estadística Biología Marina 2003

Debido a que la Ho no es rechazada en ninguno de los 10 casos Debido a que la Ho no es rechazada en ninguno de los 10 casos. - Es razonable poner a prueba la Ho de que las 10 muestras provienen de la misma población. Pasos a seguir: X2 agrupado: Se calcula para decidir si todas las muestras provienen de la misma población 3:1 Ho: Las frecuencias observadas se ajustan a la proporción esperada de 3:1. Ha: Las frecuencias observadas no se ajustan a la producción de 3:1 Estadística Biología Marina 2003

2003 Las frecuencias observadas se ajustan a distribución de 3:1 Exp. Amarillo Verde Total(n) X2 GL 1 25 11 36 0.5926 2 32 7 39 1.0342 3 14 5 19 0.0175 4 70 27 97 0.4158 24 13 37 2.0270 6 20 26 0.0513 45 0.3630 8 44 9 53 1.8176 50 64 0.3333 10 18 62 0.5376 Total de X2 7.1899 X2 agrupado 355 123 478 0.1367 X2 0.05,1 = 3.841 Las frecuencias observadas se ajustan a distribución de 3:1 Pero antes de decidir esto… Estadística Biología Marina 2003

2. X2 para heterogeneidad: Se calcula 2. X2 para heterogeneidad: Se calcula para decidir si las diez muestras provienen de la misma población. (La prueba de heterogeneidad entre replicas del test de bondad de ajuste, se basa en que la suma de valores individuales de X2 es en sí mismo un valor de Chi-cuadrado) Ho: Las diez muestras provienen de la misma población (son homogéneas). Ha: Las diez muestras provienen de al menos dos poblaciones diferentes (son heterogéneas). Estadística Biología Marina 2003

2003 Exp. Amarillo Verde Total(n) X2 GL 1 25 11 36 0.5926 2 32 7 39 1.0342 3 14 5 19 0.0175 4 70 27 97 0.4158 24 13 37 2.0270 6 20 26 0.0513 45 0.3630 8 44 9 53 1.8176 50 64 0.3333 10 18 62 0.5376 Total de X2 7.1899 X2 agrupado 355 123 478 0.1367 X2 Heter. 7.0532 X2 0.05,9 = 16.919 No se rechaza la Ho. Las 10 muestras provienen de una misma población y se justifica que se agrupen. Estadística Biología Marina 2003

Corrección de Yates: Debe ser aplicada una vez que hemos determinado que los datos se pueden agrupar. Para este ejemplo finalmente tenemos que X2c= 0.128 (en vez de X2 = 0.137) Estadística Biología Marina 2003

Consideraciones en el test de heterogeneidad Se puede mal interpretar el resultado de X2 agrupado: Si el valor de probabilidad para X2 agrupado es bajo, se podría pensar en rechazar la Ho. Pero antes de eso se debe considerar la probabilidad asociada a X2 de heterogeneidad. Y si la probabilidad asociada a este valor es <0.05, entonces si se debe rechazar la Ho. En este último caso, no se justifica agrupar los datos. Estadística Biología Marina 2003

2- Aumentando el poder de análisis: Puede ocurrir el caso en que en ningún caso se pueda rechazar Ho. Pero podemos observar un determinado patrón en nuestros datos. Veamos el siguiente ejemplo… Estadística Biología Marina 2003

Observaciones del uso de la tenaza derecha o izquierda para manejar el alimento en Petrolisthes laevigatus Exp. Diestras Zurdas Total (n) X2 Gl 1 15 (11.00) 7 22 2.9091 2 16 (12.00) 8 24 2.6667 3 12 (8.50) 5 17 2.8824 4 13 (9.00) 18 3.5556 X2 0.05,1 = 3.841 Estadística Biología Marina 2003

Para cada muestra y para los datos agrupados, las hipótesis son: Ho: La población muestra una misma proporción de Petrolisthes laevigatus que usan la tenaza derecha y la izquierda. Ha: La población no muestra la misma proporción de Petrolisthes laevigatus uso de las tenazas. Estadística Biología Marina 2003

Hipótesis test de heterogeneidad Ho: Todas las muestras provienen de la misma población. Ha: Las muestras provienen de a lo menos, dos poblaciones distintas. Estadística Biología Marina 2003

¿Las muestras son homogéneas? Exp. Diestras Zurdas Total (n) X2 Gl 1 15 (11.00) 7 22 2.9091 2 16 (12.00) 8 24 2.6667 3 12 (8.50) 5 17 2.8824 4 13 (9.00) 18 3.5556 Total de X2 12.0138 X2 agrupado 56 (40.50) 25 81 11.8642 X2 Heter. 0.1496 ¿Las muestras son homogéneas? Las muestras provienen de una misma población Se justifica agrupar los datos Estadística Biología Marina 2003

¿Qué tenaza es preferida por los cangrejos? Exp. Diestras Zurdas Total (n) X2 Gl 1 15 (11.00) 7 22 2.9091 2 16 (12.00) 8 24 2.6667 3 12 (8.50) 5 17 2.8824 4 13 (9.00) 18 3.5556 Total de X2 12.0138 X2 agrupado 56 (40.50) 25 81 11.8642 X2 Heter. 0.1496 ¿Qué tenaza es preferida por los cangrejos? Estadística Biología Marina 2003

CONCLUSIÓN: X2c = 11.111 X2 0.05,1 = 3.841 La población de Petrolisthes laevigatus no muestra la misma proporción de uso de las tenazas derecha e izquierda (X2, P<0.001). Estadística Biología Marina 2003

Test de Kolmogorov-Smirnov: Prueba de ajuste de una muestra para variables discretas. Características: Es una alternativa al test de Chi cuadrado. Presenta tablas propias. Puede ser utilizado con frecuencias pequeñas. Muy útil para datos en escala ordinal y nominal. Estadística Biología Marina 2003

“n debe ser multiplo de k” Usa frecuencias acumuladas. El diseño experimental es muy importante: “n debe ser multiplo de k” El estadígrafo del test es dmax : Estadística Biología Marina 2003

Ejemplo: Un total de 35 poliquetos fueron utilizados para verificar cual era la preferencia de estos animales sobre sustratos con diferente grados de humedad. Grado de Humedad 1 2 3 4 5 F obs 8 13 6 F esp 7 Ho: Los poliquetos no muestran preferencias por ningún sustrato en especial Ha: Los poliquetos muestran preferencias por algún sustrato determinado. Estadística Biología Marina 2003

2003 Grado de Humedad 1 2 3 4 5 F obs 8 13 6 F esp 7 F obs acum. 21 F esp acum. di  Estadística Biología Marina 2003

dmax = 7 dmax 0.05; 5,35 = 7 Se rechaza Ho. Grado de Humedad 1 2 3 4 5 F obs 8 13 6 F esp 7 F obs acum. 21 27 33 35 F esp acum. 14 28 di  dmax = 7 dmax 0.05; 5,35 = 7 Se rechaza Ho. Existe una preferencia de los poliquetos sobre un sustrato con un grado de humedad determinado (K-S, P = 0.05). Estadística Biología Marina 2003

Tablas de Contingencia. Suele ocurrir que tenemos hemos determinado frecuencias para dos variables. Y se quiere determinar si las frecuencias de ocurrencia las categorías de una variable son independientes de las frecuencias observadas en la segunda variable. Estadística Biología Marina 2003

Esta información debe ser ordenada en Tablas de Contingencia En este tipo de análisis no se necesitan frecuencias esperadas a priori. Esta basado en la distribución de chi-cuadrado. El número de columnas en una tabla es c. El número de filas en una tabla es r. Entonces una tabla esta compuesta por r x c celdas. Estadística Biología Marina 2003

Ejemplo de tabla de contingencia 2 x 4 Color de pelo Sexo Negro Café Rubio Rojo TOTAL Macho 32 43 16 9 100 R1 Hembra 55 65 64 200 R2 87 108 80 25 300 C1 C2 C3 C4 C = columnas y R = filas. Estadística Biología Marina 2003

En este test, la hipótesis nula es que las frecuencias observadas en las filas son independientes de las frecuencias observadas en las columnas Ho: El color de pelo de las personas es independiente del sexo en la población muestreada. Ha: El color de pelo de las personas es dependiente del sexo en la población muestreada. Estadística Biología Marina 2003

Análisis de la tabla de contingencia La formula es: Los grados de libertad: Gl = (r-1)(c-1) Las frecuencias esperadas: Fesp ij = (Ri)(Cj)/N Estadística Biología Marina 2003

Calculo de frecuencias esperadas F11 = 100 x 87 / 300 = 29 F21 = 200 x 87 / 300 = 58 Color de pelo Sexo Negro Café Rubio Rojo TOTAL Macho 32 (29.00) 43 16 9 100 Hembra 55 (58.00) 65 64 200 87 108 80 25 300 Estadística Biología Marina 2003

¿Conclusión estadística? Color de pelo Sexo Negro Café Rubio Rojo TOTAL Macho 32 (29.00) 43 (36.00) 16 (26.67) 9 (8.33) 100 Hembra 55 (58.00) 65 (72.00) 64 (53.33) 16 (16.67) 200 87 108 80 25 300 8.987 3 X2 0.05,3 = 7.815 X2 = Gl = ¿Conclusión estadística? Estadística Biología Marina 2003

El color de pelo en las personas es dependiente del sexo en la población muestreada (tabla de contingencia 0.025 < P < 0.05). Estadística Biología Marina 2003

Método especial simplificado para tablas de contingencia de 2 x2 Este tipo de tablas es la que más se usa Para calcular verificar el siguiente requisito: (f11) (f22) – (f12) (f21) > N / 2 Estadística Biología Marina 2003

N (| (f11) (f22) – (f12) (f21) |) – N/2)2 Si se cumple… Aplicar corrección de Yates para continuidad: Si no se cumple, se elimina el término N/2. Este método la frecuencia esperada no se calcula por separado. De esta el cálculo de forma X2 es Más Fácil Más Cuidadoso Tener en cuenta que no es recomendable utilizar frecuencias menores a 5. X2 = N (| (f11) (f22) – (f12) (f21) |) – N/2)2 (C1) (C2) (R1) (R2) Estadística Biología Marina 2003

Heterogeneidad para tablas 2 x 2 El principio es el mismo empleado para poner a prueba la heterogeneidad de replicas en el test de bondad de ajuste de X2. La Ho busca determinar si las muestras provienen de una misma población. Veamos el siguiente ejemplo Estadística Biología Marina 2003

Se hicieron 4 experimentos. Las hipótesis eran: Se aplicó una droga para mejorar la supervivencia en los tanques de abalones de la universidad, los que estaban siendo atacados por una bacteria. Se hicieron 4 experimentos. Las hipótesis eran: Ho: La supervivencia de los animales es independiente de la administración de la droga. Ha: La supervivencia de los animales es dependiente de la administración de la droga. En ningún caso se rechazó la hipotesis nula Veamos los resultados. Estadística Biología Marina 2003

X2 0.05,1 = 3.841 Mueren Viven Total Con droga 9 15 24 X2 = 2.4806 Sin droga 10 25 Gl = 1 49 Experimento 1 Mueren Viven Total Con droga 13 12 25 X2 = 2.1222 Sin droga 18 7 Gl = 1 31 19 50 Experimento 2 Mueren Viven Total Con droga 12 13 25 X2 = 2.0525 Sin droga 17 8 Gl = 1 29 21 50 Experimento 3 Mueren Viven Total Con droga 10 14 24 X2 = 2.4522 Sin droga 16 9 25 Gl = 1 26 23 49 Experimento 4 X2 0.05,1 = 3.841

Se prueba un test de heterogeneidad con los 4 experimentos Ho: Las cuatro muestras son homogéneas. Ha: Las cuatro muestras son heterogéneas. Datos agrupados para Exp. 1-4 Mueren Viven Total Con droga 44 54 98 X2 = 8.9262 Sin droga 66 34 100 Gl = 1 110 88 198 Total de X2 = 9.1075 Gl= 4 X2 Agrupado = 8.9262 Gl= 1 X2 Heterogeneidad = 0.1813 Gl= 3 ¿Conclusión? X2 0.05,3 = 7.815 Estadística Biología Marina 2003

Se justifica agrupar los datos Ho: La supervivencia de los animales es independiente de la administración de la droga. Ha: La supervivencia de los animales es dependiente de la administración de la droga. Mueren Viven Total Con droga 44 54 98 Sin droga 66 34 100 110 88 198 Recordar Aplicar corrección 8.183 1 X2 0.05,1 = 3.841 X2c= Gl = ¿Conclusión? Estadística Biología Marina 2003

Subdivisión de Tablas de Contingencia En el primer ejemplo determinamos que: “Existe una dependencia del sexo sobre el color del pelo” Color de pelo Sexo Negro Café Rubio Rojo TOTAL Macho 32 43 16 9 100 Hembra 55 65 64 200 87 108 80 25 300 Pero es posible observar que la proporción de hombres rubios es menor que las otras columnas Estadística Biología Marina 2003

Es posible que esta columna aporte en gran parte a la significancía Si ignoramos momentáneamente esta columna y realizamos el análisis con una tabla 2 x 3: Ho: La ocurrencia de pelo, negro, café y colorín es independiente del sexo. Ha: La ocurrencia de pelo, negro, café y colorín no es independiente del sexo Estadística Biología Marina 2003

La tabla quedaría… Sexo Negro Café Colorín Total Hombre 32 43 9 84 Mujer 55 65 16 136 87 108 25 220 X2 = 0.245 -Valor crítico X2 0.05,2 = 5.991 Entonces no se rechaza Ho con 0.75 < P< 0.9 De esta forma podemos concluir que los tres colores de pelo son independientes del sexo de los individuos (tabla de contingencia 0.75 < P< 0.9) Estadística Biología Marina 2003

Ahora podemos hacer una tabla de 2 x 2, considerando en la columna el color rubio y en la otra los otros tres colores Ho: La ocurrencia del color rubio y no rubio es independiente del sexo. Ha: La ocurrencia del color rubio no es independiente del sexo Sexo Rubio No rubio Total Hombre 16 84 100 Mujer 64 136 200 80 220 300 X2c = 7.928 con GL = 1; Valor crítico X2 0.05,1 = 3.841 Entonces se rechaza Ho con 0.001< P< 0.005. Estadística Biología Marina 2003

De esta manera se confirma la sospecha que entre los cuatro colores de pelo, el rubio presenta las frecuencias relativas diferentes en relación a los otros colores de cabello. Estadística Biología Marina 2003

Estrictamente hablando, no se debería aplicar este tipo de procedimientos para poner a prueba hipótesis estadísticas. Los resultados solo deben considerados como una guía para desarrollar nuevas hipótesis con los datos. Estadística Biología Marina 2003

Estadística Biología Marina 2003