Clases 4 Pruebas de Hipótesis

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

ANOVA DE UN FACTOR.
ANALISIS PARAMÉTRICOS
Tema.11. Principales modelos de distribución de probabilidad en Psicología: Variables discretas: binomial y Poisson. Variables continuas: normal, chi.
Tema 22: Análisis de tablas de contingencia Prueba c2 como medida de asociación y como prueba de contraste. Coeficientes derivados de c2. Interpretación.
1.1 Contraste de Bondad de Ajuste para Datos Categóricos
TEMA 6: CONTRASTES NO PARAMÉTRICOS
Pruebas de significancia para datos cualitativos
KRUSKAL WALLIS Jorge Iván Betancur Marta Isabel Naranjo García
La prueba U DE MANN-WHITNEY
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Contraste de Hipótesis ETSITGC Madrid Unidad Docente de Matemáticas.
PRUEBAS DE HIPOTESIS HIPOTESIS
TABLAS DE CONTINGENCIA
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
Correlación 1.
Nombre: Israel Espinosa Jiménez Matricula: Carrera: TIC Cuatrimestre: 4 Página 1 de 5.
COEFICIENTE DE CORRELACIÓN PRODUCTO-MOMENTO DE PEARSON
CURSO DE ESTADÍSTICA BÁSICA
MEDIDAS DE CORRELACIÓN
Análisis no paramétricos
Prueba de hipótesis Equivalencia entre la prueba de hipótesis y los intervalos de confianza Valor de probabilidad Valor de probabilidad unilateral Prueba.
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Clase 5 Hipótesis de diferencias de grupos
Clases 3 Pruebas de Hipótesis
Inferencia Estadística
CHI-CUADRADO Y DISTRIBUCION NORMAL
Curso Práctico de Bioestadística Con Herramientas De Excel Fabrizio Marcillo Morla MBA (593-9)
REGRESION Y CORRELACION
ANALISIS DE DATOS CATEGORICOS
UNIVERSIDAD INCA GARCILASO DE LA VEGA
Tema 17: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
AÑO DE PROMOCIÓN DE LA INDÚSTRIA RESPONZABLE Y COMPROMISO CLIMÁTICO
Inferencias con datos categóricos
Unidad V: Estimación de
Curso de Bioestadística. ANOVA
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Pruebas No paramétricas
CORRELACIÓN y ASOCIACIÓN
Prof. Rosario Martínez Verdú
Análisis Cuantitativo de Datos (Básico)
Clase 4a Significancia Estadística y Prueba Z
Inferencia Estadística
Herramientas básicas.
Medidas de asociación entre dos variables
Capítulo 1. Conceptos básicos de la Estadística
1 ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia y Coeficientes de Asociación.
Modulo03 – Ejercicio13 Asociar categorías: Test de independencia.
Pruebas de hipótesis.
PRUEBAS ESTADISTICAS NO PARAMETRICAS
Análisis de los Datos Cuantitativos
Capitulo 4 Análisis descriptivo inferencial: comparaciones múltiples
ESTIMACIÓN DE PARÁMETROS
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…
Introducción a la Inferencia Estadistica Dept. of Marine Science and Applied Biology Jose Jacobo Zubcoff.
Aspectos generales de la investigación educativa en el SNIT
INFERENCIA ESTADÍSTICA
16. Asociación estadística y test de independencia
Capitulo 1 Análisis descriptivo
INTRODUCCIÓN AL ANÁLISIS DE DATOS CATEGÓRICOS. Temas Carácterísticas de la distribución Chi-cuadrada Prueba de bondad de ajustes Prueba de homogeneidad.
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
PRUEBA DE SIGNIFICANCIA
PRUEBA CHI-CUADRADO UNIDAD 2: ESTADÍSTICA.
TAMAÑO DE LA MUESTRA Alvaro Alfredo Bravo Dpto. de Matemáticas y Estadística Universidad de Nariño - Colombia.
PRUEBA DE SIGNIFICANCIA
YASIR MOUBARIK GONZALEZ ESTADISTICA Y TIC SUBGRUPO 19 UNIDAD DOCENTE VIRGEN DEL ROCIO.
Transcripción de la presentación:

Clases 4 Pruebas de Hipótesis Curso de Metodología de la Investigación Profesor Manuel Lobos González Año 2011

PRUEBA CHI CUADRADO Sean X e Y dos variables categóricas. X con r categorías e Y con c categorías. Podemos utilizar una tabulación cruzada entre las variables para identificar la relación que existe entre ambas. En este caso la tabulación cruzada entre X e Y tendrá r filas y c columnas. Las respuestas para (X, Y) pueden ser pensadas como provenientes de alguna población tal que se pueden definir probabilidades para cada celda de la tabla. Cuando las celdas de una tabla contienen las frecuencias de respuestas, la tabla se denomina de contingencia.

PRUEBA CHI CUADRADO Una de las principales preguntas que uno quiere responder cuando analiza la asociación entre dos variables es si existe alguna relación entre ellas o lo que muestra la tabla es simple error muestral. Para responder a esta pregunta, se utiliza un test de hipótesis conocido como el test Chi-cuadrado de Pearson. La hipótesis nula del test es que las dos variables analizadas son independientes. La hipótesis alternativa es que las variables no son independientes, es decir que existe una relación entre las dos variables.

PRUEBA CHI CUADRADO Ejemplo: La siguiente tabla de contingencia muestra la tabulación cruzada de la variable Cantidad de libros en Biblioteca (dividido en tres categorías, menos de 2000; entre 2000 y 4000 y más de 4000) y la dependencia del colegio (dividida en tres categorías, Municipal, Particular Subvencionado y Particular Pagado).

PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación   DEPENDENCIA CANTIDAD LIBROS PARTICULAR PAGADO PARTICULAR SUBVENCIONADO MUNICIPAL Total Menos de 2000 45 95 62 202 2000 - 4000 65 80 100 245 más de 4000 90 89 241 200 237 251 688

Tablas de Contingencia y Medidas de Asociación PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación Las entradas de la tabla representan el número de colegios en la muestra con cada combinación de cantidad de libros en la biblioteca y dependencia del colegio. Por ejemplo, 45 colegios particulares pagados tienen menos de 2000 libros. El test Chi-cuadrado de Pearson se basa en encontrar cual hubiera sido el valor de cada entrada si las variables fueran independientes. Es decir el valor esperado de cada celda de la tabla si las variables cantidad de libros en la biblioteca y dependencia del colegio son independientes.

Tablas de Contingencia y Medidas de Asociación PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación Si cantidad de libros en la biblioteca y dependencia del colegio son independientes, la probabilidad del evento conjunto "A1: tener menos de 2000 libros" y "B1: dependencia particular pagada" es el producto de esas dos probabilidades: Pr(A1 y B1) = Pr(A1)*Pr(B1) Pr(A1) = A1/A = 202/688, Pr(B1) = B1/B = 200/688 Donde A y B son las frecuencias totales de los eventos.

Tablas de Contingencia y Medidas de Asociación PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación Por lo tanto: Pr(A1 y B1) = Pr(A1)*Pr(B1) = 202*200/(688*688) = 0.0854 El número esperado en la entrada A1B1 es entonces: N* Pr(A1 y B1) = 688*0.0854 = 58,72

Tablas de Contingencia y Medidas de Asociación PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación En general la fórmula del valor esperado es: Eij = (NAi*NBj)/N. Eij = número esperado NAi= número de elementos en la categoría Ai NBi= número de elementos en la categoría Bi Para A1B1 el número esperado es: E11 = (202*200)/688 = 58,72

Tablas de Contingencia y Medidas de Asociación PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación Este proceso se debe repetir para cada una de las entradas de la tabla. Una vez hecho esto el estadístico Chi-cuadrado se calcula con la siguiente fórmula: r = número de categorías de la variable en las filas c = número de categorías de la variable en las columnas Oij = número observado en entrada ij Eij = número esperado en la entrada ij Este estadístico Chi-cuadrado tiene (r-1)*(c-1) grados de libertad.

Tablas de Contingencia y Medidas de Asociación PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación En nuestro ejemplo hay (3-1)*(3-1) = 4 grados de libertad. Realizando todos los cálculos con la tabla del ejemplo, el estadístico da 27,389. Se debe comparar este número con el valor crítico de la distribución Chi-cuadrado con 4 grados de libertad a un nivel de significación estadística del 5%

Tablas de Contingencia y Medidas de Asociación PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación El valor crítico de la distribución Chi-cuadrado con 4 grados de libertad a un nivel de significación estadística del 5% el valor crítico correspondiente es 9,48. Como 27,389 > 9,48 se rechaza la hipótesis nula. Es decir, las variables no son independientes.

Tablas de Contingencia y Medidas de Asociación PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación Limitaciones La muestra de tamaño n debe ser suficientemente grande, de modo que ninguna de las frecuencias esperadas Eij sea menor que 1 y no más del 20 % de los mismos sea menor que 5.

Ejemplo PRUEBA CHI CUADRADO Considere un estudio sobre consumo que esta interesado en investigar las preferencias de las familias por diferentes Tipos de colegios. A priori, uno pensaría que sería más probable que familias más numerosas eligieran colegios municipales o subvencionados y que familias con menos miembros optaran por colegio particulares pagados.

Ejemplo PRUEBA CHI CUADRADO Supongamos que para investigar esta relación, el investigador toma una muestra aleatoria de tamaño n=300 de todas aquellas familias que matricularon a sus hijos en las escuelas de una región. La siguiente tabla provee la clasificación de los 300 datos:

DEPENDENCIA DEL COLEGIO PARTICULAR SUBVENCIONADO PRUEBA CHI CUADRADO EJEMPLO   TAMAÑO DE FAMILIA DEPENDENCIA DEL COLEGIO 2 Y 3 4 Y 5 más de 5 Total PARTICULAR PAGADO 25 37 8 70 PARTICULAR SUBVENCIONADO 10 62 53 125 MUNICIPAL 5 41 59 105 40 140 120 300

Ejemplo PRUEBA CHI CUADRADO Nuestra tarea es determinar si el tamaño de la familia afecta la decisión del tipo de colegio. La hipótesis nula es que las variables son independientes (esto es, no hay relación entre tamaño familiar y la elección del colegio); la hipótesis alternativa es que las variables no son independientes.

Ejemplo PRUEBA CHI CUADRADO Trabajemos con un nivel de confianza del 95% y calculemos el estadístico de Pearson. Para esto asignemos las siguientes letras a los eventos de la tabla: A1 Dependencia particular pagada A2 Dependencia particular subvencionada A3 Dependencia municipal

Ejemplo B1 Familia de 2 a 3 miembros B2 Familia de 4 a 5 miembros PRUEBA CHI CUADRADO B1 Familia de 2 a 3 miembros B2 Familia de 4 a 5 miembros B3 Familia de más de 5 miembros Sabemos que el número esperado de observaciones que se esperarían en la celda (Ai, Bj) si las variables fueran independientes esta definido por: Eij = (NAi*NBj)/N, por lo tanto:

Ejemplo E11 = ( NA1 * NB1 ) / N = E12 = ( NA1 * NB2 ) / N = PRUEBA CHI CUADRADO E11 = ( NA1 * NB1 ) / N = E12 = ( NA1 * NB2 ) / N = E13 = ( NA1 * NB3 ) / N = E21 = ( NA2 * NB1 ) / N = E22 = ( NA2 * NB2 ) / N = E23 = ( NA2 * NB3 ) / N = E31 = ( NA3 * NB1 ) / N = E32 = ( NA3 * NB2 ) / N = E33 = ( NA3 * NB3 ) / N = 70 140 32.67 300 40 120 125 105 9.33 28 58.33 16.67 50 49 14 42

Ejemplo La fórmula de cálculo del estadístico viene dada por PRUEBA CHI CUADRADO La fórmula de cálculo del estadístico viene dada por

Ejemplo PRUEBA CHI CUADRADO El valor crítico desde una tabla Chi-cuadrado con 4 grados de libertad y un margen de error del 5% es 9,488 Como el valor del estadístico de Pearson 58.21 es mayor al valor crítico de la tabla se rechaza la hipótesis nula. Por lo tanto, podemos afirmar que no existe independencia entre el tamaño de la familia y la elección del tipo de colegio.

Tablas de Contingencia y Medidas de Asociación PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación El estadístico de Pearson nos dice si dos variables son independientes una de otra pero no nos dice nada acerca de la naturaleza de la relación. Esto es, no sabemos cuan fuerte es la asociación entre las variables analizadas. Para medir el grado de relación entre las variables se utiliza el denominado Coeficiente de Contingencia (C).

Tablas de Contingencia y Medidas de Asociación PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación El coeficiente de contingencia se calcula fácilmente desde el estadístico de Pearson: donde n es el tamaño muestral.

Tablas de Contingencia y Medidas de Asociación PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación Del ejemplo anterior sabemos que el número de miembros que tenga la familia afecta la decisión de la elección del colegio, pero esa es solamente una parte del análisis. En particular, cuál es el grado de relación entre las dos variables?

Tablas de Contingencia y Medidas de Asociación PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación ¿Este valor de 0.403 indica una relación fuerte entre las variables? Para poder responder esta pregunta necesitamos saber los límites de variación de C. Cuando no hay relación entre las variables el coeficiente C = 0. El valor máximo de C está dado por

Tablas de Contingencia y Medidas de Asociación PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación En nuestro caso: Entonces: El valor calculado se encuentra más o menos en la mitad entre el valor mínimo y máximo de C por lo que uno puede afirmar que existe una relación moderada entre el tamaño de la familia y la elección del tipo de colegio.