Tema: Estadísticos no paramétricos CHI-Cuadrada Curso: Seminario de Estadística ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO FACULTAD DE INFORMATICA Y ELECTRONICA ESCUELA DE INGENIERIA ELECTRONICA EN CONTROL Y REDES INDUSTRIALES SEMINARIOS
Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones supuestas Tienen problemas con muestras de pequeño tamaño Aplicación limitada a variables cuantitativas.
Problemas de las escalas no numéricas No se puede definir cantidades. A lo más puede definirse un orden entre las categorías Esto significa que se establece un RANGO entre las observaciones. Para estos casos se han desarrollado metodos inferenciales que no requieren definición de la forma de la distribución.
Comparación de pruebas paramétricas y no paramétricas. AplicaciónPrueba paramétrica Prueba no paramétrica Eficiencia de la prueba no paramétrica en relación a param. Dos muestras dependientes (datos pareados Prueba t o prueba zPrueba del signo Prueba de rangos con signos de Wilcoxon Dos muestras independientes Prueba t o prueba zPrueba de suma de rangos de Mann Whitney 0.95 Varias muestras independientes Análisis de varianzaPrueba de Kruskal Wallis 0.95 CorrelaciónCorrelación linealPrueba de correlación de rangos 0.91
¿CUÁLES SON LAS SUPOSICIONES DE LA ESTADÍSTICA NO PARAMÉTRICA? Para realizar análisis no paramétricos, debe partirse de las siguientes consideraciones: La mayoría de estos análisis no requieren de supuestos acerca de la forma de la distribución poblacional. Aceptan distribuciones no normales. Las variables no necesariamente deben estar medidas en un nivel por intervalo o de razón, pueden analizar datos nominales u ordinales. Si se quieren aplicar análisis no paramétrica a datos por intervalos o razón, éstos deben ser resumidos a categorías discretas (a unas cuantas). Las variables deben ser categorías.
¿CUÁLES SON LOS MÉTODOS O PRUEBAS ESTADÍSTICAS NO PARAMÉTRICAS MÁS UTILIZADAS? 1.La Chi-cuadrada o Ji-Cuadrada o X 2. 2.Los coeficientes de correlación e independencia para tabulaciones cruzadas. 1.Los coeficientes de correlación por rangos ordenados de Spearman y Kendall. 1.Prueba de U de Mann Whitney 2.Pruebas W de Wilcoxon Las Pruebas no paramétricas más utilizadas son:
Distribución Ji-Cuadrada o Chi-cuadrada o X 2 ?. Es una prueba útil para variables categóricas y estadística, es aplicable cuando la variable nominal está compuesto por dos o más categorías. Tiene dos aplicaciones: 1. La prueba de bondad de ajuste Chi-cuadrada. 2. La prueba Chi-cuadrada de asociación. Ambas pruebas se utilizan para determinar si las frecuencias observadas (O) en las categorías difieren significativamente de las frecuencias esperadas (E).
Es una prueba estadística para evaluar hipótesis acerca de la relación entre dos variables categóricas. Símbolo: X2 X2 Hipótesis a probar:Correlaciones Variables involucradas: Dos variables (la prueba Chi-cuadrada no considera relaciones causales). Nivel de medición de las variables Nominal u ordinal (o intervalos o razón reducidas a ordinales) ProcedimientoLa Chi-cuadrada se calcula por medio de una tabla de contingencia o tabulación cruzada, que es una tabla de dos dimensiones y cada dimensión contiene una variable. A su vez, cada variable se subdivide en dos o más categorías.
CARACTERÍSTICAS 1.La Distribución X 2 se lee con grados de libertad G.L = (Nº de filas - 1)(Nº de columnas - 1). 2.No tiene valores negativos. El valor mínimo es 0. 3.Todas las curvas son asimétricas 4.Cuando aumentan los grados de libertad las curvas son menos elevadas y más extendidas a la derecha. 5.Se utiliza para variables medidas en escala nominal u ordinal. 6.Las fórmulas son:
Ejemplo 1. Variable, categoría y tabla de contingencia 2x2: Sean las variables SEXO (Masculino y Femenino) y CANDIDATO (“A” y “B”). La tabla de contingencia o tabulación cruzada es: CANDIDATO “A” “B” Masculino SEXO Femenino
Variable Categoría CANDIDATO “A” “B” Masculino SEXO Femenino
Ejemplo 2. Estudio de Tabla de contingencia 3x2: Se estudia a 1040 estudiantes de los niveles de educación primaria y secundaria y a los cuales se aplica un instrumento que mide el aprendizaje de la matemática, en las dimensiones de aprendizaje conceptual, procedimental y actitudinal. Variables: APRENDIZAJE categorías: Conceptual, Procedimental, Actitudinal. NIVEL DE EDUCACIÓN categorías: Primaria, Secundaria. NIVEL DE EDUCACIÓN Primaria Secundaria APRENDIZAJE Conceptual Procedimental Actitudinal TABLA DE CONTINGENCIA
Tabla de frecuencias observadas (O): NIVEL DE EDUCACIÓNTOTAL Primaria Secundaria APRENDIZAJE Conceptual Procedimental Actitudinal TOTAL La Chi-cuadrada es una comparación entre las tablas de frecuencias observadas y la denominada tabla de frecuencias esperadas (la tabla que esperaríamos encontrar si las variables fueran estadísticamente independientes o no estuvieran relacionadas).
La frecuencia esperada de cada celda, casilla o recuadro, se calcula mediante la siguiente fórmula aplicada a la tabla de frecuencias observadas: N = es el número total de frecuencias observadas. E = (marginal del reglón)(marginal de columna) / N. NIVEL DE EDUCACIÓN Marginal de filas Primaria Secundaria APRENDIZAJE Conceptual Procedimental Actitudinal (280)(540)/1040(280)(500)/ (470)(540)/1040(470)( 500)/ (290)(540)/1040(290)(500)/ marginal de columnas Tabla de frecuencias esperadas (E):
Frecuencia observada: NIVEL DE EDUCACIÓNTOTAL Primaria Secundaria APRENDIZ AJE Conceptual Procedimental Actitudinal 145,4134, ,0226, ,6139,4290 TOTAL NIVEL DE EDUCACIÓNTOTAL Primaria secundaria APRENDI ZAJE Conceptual Procedimental Actitudinal TOTAL Frecuencia esperada: Donde: O: frecuencia observada en cada celda E: frecuencia esperada en cada celda
CeldaOEO-E(O-E) 2 (O-E) 2 / E Conceptual/Primaria180145,434,61197,168,23 Procedimental/ Primaria190244,4-54,42959,3612,11 Actitudinal / Primaria170150,619,4376,362,50 Conceptual / Secundaria100134,6-34,61197,168,69 Procedimental /Secundaria280226,054,02916,0012,80 Actitudinal / Secundaria120139,4-19,4376,362,70 X 2 =47,33 Para saber si el valor de X 2 es o no significativo, debemos calcular los grados de libertad. G.L. = (Nº de filas - 1)(Nº de columnas - 1).
Para el ejemplo: Nº de filas = 3 y Nº de columnas = 2; entonces G.L. = (3-1)(2-1) = 2. Luego, acudimos a la “tabla de distribución de Chi- cuadrado”, eligiendo nuestro nivel de confianza ( = 0,05 ó = 0,01). Si el valor obtenido de X 2 es igual o superior al valor de la “tabla”, decimos que las variables están relacionadas o no son independientes. Aplicación: Para el nivel de confianza de =0,05 y g.l. = 2, el X 2 de tabla es 5,9915 (ver tabla). X 2 Obtenido = 47,33 X 2 Crítico = 5,9915
Prueba de hipótesis: H 0 : No existe relación entre el aprendizaje y los niveles de educación. H 1 : Existe relación entre el aprendizaje y niveles de educación. X 2 obtenido X 2 crítico entonces variables no son independientes; es decir existe una relación entre Aprendizaje y los niveles educativos X 2 obtenido X 2 crítico entonces se rechaza la hipótesis nula (H 0 ), y por lo tanto se acepta la hipótesis alterna (H 1 ).
Establezca la Ho a ser probada; por ejemplo, Ho: 1 = 2 = 0,5 Especifique el nivel de significancia α, por ejemplo: α = 0.5 Haga una tabla de frecuencias obtenidas Deduzca las frecuencias esperadas a partir de Ho: Calcule el grado de libertad: Producto de (categorías - 1) Calcule el valor de X 2 a partir de las frecuencias obtenidas y frecuencias esperadas. Mediante la tabla de X 2 obtenga el valor teórico. Compara dichos valores. Establezca la conclusión con respecto a Ho: Retenga Ho si valor de tabla > Valor calculado. Retenga Ho si valor de tabla < Valor calculado. Paso Nº 1 Paso Nº 2 Paso Nº 3 Paso Nº 4
ENCUESTA Se quiere estudiar la relación que existe entre el Sexo, Grado académico y el Ingreso familiar de los docentes de la Institución Educativa de la UGEL Nº 6. Por favor responda cada ítem de la presente encuesta: Sexo: ( ) Femenino( ) Masculino Grado académico: ( ) Bachiller( ) Magíster ( ) Doctor ( ) Otros Ingreso familiar: ( ) Menos o iguales de S/. 550 ( ) Mayor que S/. 550 y menor que S/. 800 ( ) Mayor que S/. 800 y menor que S/ ( ) Mayor que S/
DEFINIR LA VARIABLES EN SPSS
Datos resultados de la encuesta
INGRESO DE DATOS
Cálculo de X 2
Tabla de contingencia