La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Estadística Aplicada II PRUEBAS Chi -CUADRADO

Presentaciones similares


Presentación del tema: "Estadística Aplicada II PRUEBAS Chi -CUADRADO"— Transcripción de la presentación:

1 Estadística Aplicada II PRUEBAS Chi -CUADRADO
Profesor: Mg. Emma Pérez Palacios

2 Técnicas de la Estadística Inferencial
Puntual Estimación Interválica ( Límites de confianza ) Sobre los Parámetros Poblacionales: , 2, P Dócimas o Pruebas de Hipótesis Sobre la relación y distribución de las variables

3 Dócimas o Pruebas de Hipótesis
Es el procedimiento basado en la evidencia muestral y en la teoría de probabilidad que se emplea para determinar si: La hipótesis es un enunciado razonable y no debe rechazarse, o si es irrazonable y debe ser rechazada.

4 PRUEBA JI-CUADRADO DE BONDAD DE AJUSTE
La aplicación principal de la prueba de bondad de ajuste se da cuando se desea verificar si una muestra aleatoria proviene de alguna población cuya distribución se ajusta a una distribución teórica conocida (uniforme o normal). Las observaciones se deben clasificar de acuerdo a la siguiente tabla: Categoría Ai Frecuencia Observada Oi Frecuencia Esperada Ei Probabilidad P(Ai) A1 O1 E1 P(A1) A2 O2 E2 P(A2) …. Ar Or Er P(A r) TOTAL n 1,00

5 PRUEBA Chi-CUADRADO DE BONDAD DE AJUSTE
La prueba se especifica de la siguiente forma: : Formular las Hipótesis. H0: Los datos de la muestra se ajustan a la distribución propuesta H1: Los datos de la muestra no se ajustan a la distribución propuesta Fijar el nivel de significación: 0 <  < 1 Calcular el estadístico de Prueba: Hallar el valor crítico: 2(gl; 1), siendo gl=k–p–1, k el número de categorías y p es el número de parámetros desconocidos que se han estimado para determinar las probabilidades de las categorías. Tomar la decisión de acuerdo a la siguiente regla de decisión: H0 se rechaza si: 2c >2(gl; 1), en caso contrario se acepta. Nota:- Si alguna(s) categoría(s) tiene Ei<5, se deben agrupar la(s) categoría(s) hasta lograr que todas las frecuencias observadas sean mayores o iguales que 5.

6 PRUEBA Chi-CUADRADO DE BONDAD DE AJUSTE : DISTRIBUCION UNIFORME
La distribución Uniforme: Es aquella que tiene sus frecuencia de ocurrencia iguales para cada una de los valores de la variable (puede ser cuantitativa o cualitativa). En la distribución uniforme p=0, ya que no requiere que se estimar ningún parámetro. Ejemplo.  Un fabricante de sistemas de aire acondicionada ha dividido su mercado en 4 zonas. A un posible distribuidor se le explica que las instalaciones de equipos se distribuyen de manera aproximadamente igual en las 4 zonas. El prospecto de distribuidor toma una muestra aleatoria de 40 instalaciones hechas el año anterior, de los archivos de la fábrica, y encuentra la siguiente tabla: Zonas A B C D Total Nº instalaciones en la muestra Oi 6 12 14 8 40

7 e i = n / k Variable: las zonas de ventas.
Donde: k = n º de categorias = numero de zonas n = tamaño de muestra = 40 Para un nivel de significación del 5% probar la afirmación de la empresa fabricante de sistemas de aire acondicionado. Zonas A B C D Total Nº instalaciones en la muestra Oí 6 12 14 8 40 Nº esperado de instalaciones 10 e i = n / k Hipótesis H0 : Oi = ei  Las instalaciones se distribuyen uniformemente en las cuatro zonas H1 : Oi  ei  Las instalaciones no se distribuyen uniformemente en las cuatro zonas

8 (2) Estádistica y Valor calculado
   3) Regiones de Aceptación y Rechazo Nivel de significación  = 0.05 Distribución Chi-cuadrado. Estadístico de prueba  R. A α = RR Para  = 0.05, prueba cola derecha y gl = 401= 3  4) Regla de decisión: 2 = <  Cae en región de aceptación; se acepta H0  5) Conclusión: Con un nivel de significación del 5%, se pude afirmar que las instalaciones están distribuidas en formas equitativa en las 4 zonas.

9 En el Minitab

10 Chi-Square Goodness-of-Fit Test for Observed Counts in Variable: C1
Salida del Minitab Chi-Square Goodness-of-Fit Test for Observed Counts in Variable: C1 Test Contribution Category Observed Proportion Expected to Chi-Sq .6 N DF Chi-Sq P-Value Decisión: Como P-Vaule > α 0.261 > => Ho se acepta Conclusión: Las ventas en las 4 zonas es uniforme.

11 PRUEBA Chi-CUADRADO DE BONDAD DE AJUSTE PARA LA DISTRIBUC. NORMAL
En la producción de piezas para un componente de la memoria de una computadora es sumamente importante la longitud (centimetros) de dichas piezas. El gerente de producción considera en la línea de producción se generan piezas que se ajustan a una distribución normal y para tal efecto presenta el siguiente reporte de las longitudes en centímetros de 120 piezas. A la luz de los datos, ¿qué puede usted concluir? Longitud de las piezas en centímetros Número de piezas 1.900 1.925 6 1.950 8 1.975 12 2.000 22 2.025 30 2.050 20 2.075 14 2.100 Total 120

12 EJEMPLO DE LA PRUEBA Chi-CUADRADO DE BONDAD DE AJUSTE
Longitud de las piezas en centímetros Número de piezas: Oi Punto Medio: Yi Yi Oi Yi2 Oi 1.900 1.925 6 1.9125 11.475 21.946 1.950 8 1.9375 15.500 30.031 1.975 12 1.9625 23.550 46.217 2.000 22 1.9875 43.725 86.903 2.025 30 2.0125 60.375 2.050 20 2.0375 40.750 83.028 2.075 14 2.0625 28.875 59.555 2.100 2.0875 16.700 34.861 Total 120 Media 241.0 = 2.0079 120 Desviaciòn 0.0448 Estandar

13 En el Minitab

14 Chi-Square Goodness-of-Fit Test for Observed Counts in Variable: Oi
Test Contribution Category Observed Proportion Expected to Chi-Sq N DF Chi-Sq P-Value 1 cell(s) (12.50%) with expected value(s) less than 5.

15 En el Minitab: Fusionando clases

16 Chi-Square Goodness-of-Fit Test for Observed Counts in Variable: o2
Salida del Minitab Chi-Square Goodness-of-Fit Test for Observed Counts in Variable: o2 Test Contribution Category Observed Proportion Expected to Chi-Sq N DF Chi-Sq P-Value

17 Ejemplo de la Prueba Chi-cuadrado de Bondad de Ajuste
Nota:- Si alguna categoría tiene Ei<5, se deben agrupar la(s) categoría(s) hasta lograr que todas las frecuencias observadas sean mayores o iguales que 5.

18 EJEMPLO DE LA PRUEBA Chi-CUADRADO DE BONDAD DE AJUSTE

19 EJEMPLO DE LA PRUEBA Chi-CUADRADO DE BONDAD DE AJUSTE
Hipótesis. H0: La línea de producción genera piezas que se ajustan a una distribución normal H1: La línea de producción genera piezas que no se ajustan a una distribución normal Nivel de significación:  = 0,05 Estadístico de Prueba: 2c = 6,289 Valor Crítico: 2(3; 0,95) = Decisión: H0 se acepta por que 2c < 2(3; 0,95) Conclusión: La línea de producción genera piezas que se ajustan a una distribución normal

20

21 TABLAS DE CONTINGENCIA
Desde el punto de vista de la estadística una Tabla de Contingencia, en un cuadro de doble entrada donde cada observación de la muestra se encuentra clasificada en dos niveles de categorías. Los datos de las pruebas Chi-cuadrado se encuentran contenidos en estas tablas de doble entrada o clasificación.

22 Tipo de Variable (en intervalos) TABLAS DE CONTINGENCIA Cualitativa
Para las tablas se puede aplicar variables del tipo: Tipo de Variable Cualitativa (Nominal u ordinal ) Cuantitativa (en intervalos)

23 PRUEBA Chi-CUADRADO DE INDEPENDENCIA DE VARIABLES
Se aplica para comprobar si dos variables son independientes en las observaciones de una misma población. Los datos de la muestra se clasifican a la vez en las “r” categorías de la variable X, y en las “K” categorías de la variable Y. De este modo los datos de la muestra se resumen de acuerdo la tabla de contingencia siguiente:

24 Tabla de Contingencia de las Variables X e Y Niveles de la variable Y

25 PRUEBA Chi-CUADRADO DE INDEPENDENCIA DE VARIABLES
La prueba se especifica de la siguiente forma: : Formular las Hipótesis. H0: Las variables son independientes. H1: Las variables no son independientes Fijar el nivel de significación: 0 ≤  ≤ 1 Calcular el estadístico de Prueba: Calcular el valor crítico: 2(gl; 1), siendo gl=(r–1)(K–1), r: el número de filas y k: el número de columnas. Tomar la decisión de acuerdo a la siguiente regla de decisión: H0 se rechaza si: 2c >2(gl; 1), en caso contrario se acepta. Nota:-Si alguna categoría tiene Eij<5, se deben agrupar la(s) categoría(s) hasta lograr que todas las frecuencias observadas sean mayores o iguales que 5.

26 Prueba de Independencia
Objetivo Probar la independencia o dependencia de dos variables X e Y cada una con diferentes categorías Ejemplo Se desea probar si existe alguna dependencia entre la preferencia de tipo gaseosas y sexo Ho : Tipos de gaseosa y sexo son independientes H1 : Tipos de gaseosa y sexo son dependientes (están relacionados)

27 eij = Frecuencia esperada del nivel-i de X, del nivel j de Y
Estadística de la Prueba  =   (oij – eij) 2 ~ 2(k -1) x ( r - 1) eij oij = Frecuencia observada del nivel-i de X, del nivel j de Y eij = Frecuencia esperada del nivel-i de X, del nivel j de Y n = Tamaño de la muestra ei j = Total fila-i x Total Columna-j n k = Nº de columnas r = Nº de filas Reemplazar los valores, y hallar el valor calculado

28 2 = valor crítico o de tabla
Regiones de Aceptación y Rechazo de Ho Se elige un valor para el nivel de significancia “” ó error tipo-1 (entre 1 % y 10%) Función de Probabilidad Chi-Cuadrada con (k-1)x(r-1) grados de libertad ~ 2 (K -1) x ( r - 1) Región de Aceptación Región de rechazo 1-  2 = valor crítico o de tabla Nota : “”= Error tipo 1: Probabilidad de rechazar H0 siendo verdadera.

29 2 = valor crítico o de tabla
Decisión Si el valor calculado es menor al valor critico, se acepta Ho Si el valor calculado excede al valor critico, , Ho se rechaza, y se acepta H1 ~ 2 (k -1) x (r - 1) 1-  2 = valor crítico o de tabla 2 valor calculado

30 Caso Práctico Se ha entrevistado a una muestra de egresados de la Facultad de CC.AA., entre las variables consideradas, se encuentran el nivel de ingresos (intervalos) y sexo X = nivel de ingresos Tres intervalos o niveles * Bajo : < S/. 1,500 * Medio: [1, ,000] * Alto: > S/. 3,000 Y = Sexo

31 Tabla de Contingencia: Datos
Y = X= 2 Valor calculado

32  2 =   (oij – eij) 2 ~ 2(2 -1) x (3 - 1) = 2
Tabla de Contingencia: Datos Y = X= Estadistica de Prueba  =   (oij – eij) 2 ~ 2(2 -1) x (3 - 1) = 2 eij (Chi-cuadrado con 2 grados de libertad) ) Valor Calculado Valor Critico  =  2 = 5.99

33 En e Minitab

34 Chi-Square Test: C1, C2 Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts C1 C2 Total Total Chi-Sq = , DF = 2, P-Value = 0.005

35 Decisión (valor calculado)  2 = < (valor critico)  2 = 5.99 entonces: se rechaza Ho,al 5% de significancia Por tanto: El nivel de ingresos y sexo están relacionados ~ 2 (2 -1) x (3 - 1) = 2 (Chi-cuadrado con 2 grados de libertad) ) 0.05 2 = valor crítico= 5.99 2 valor calculado =

36 Salida del Software SPSS
Nivel de signifiancia del valor calculado Valor calculado Grados de libertad Como  se rechaza Ho. Por lo tanto, el nivel de ingresos y el sexo son dependientes, es decir, están relacionados Nota : El máximo nivel de significancia para rechazar Ho es ó 0.12 (10% ó 12% de error)

37 Conclusiones Mediante el análisis de las Tablas de Contingencia de los datos de la muestrales, se aplica la Prueba de Independencia de Variables con la estadística Chi- cuadrado. Del análisis de los resultados de una encuesta de una doble clasificación de la variables: sexo y nivel de ingresos, de una muestra de 70 egresados, se concluye que los niveles de ingreso está relacionados del sexo de los egresados.

38 EJEMPLO -2: PRUEBA Chi-CUADRADO DE INDEPENDENCIA DE VARIABLES

39 EJEMPLO -2: PRUEBA Chi-CUADRADO DE INDEPENDENCIA DE VARIABLES
Hipótesis. H0: El Nivel Socioeconómico al cual pertenecen las mujeres en edad fértil no influye en el número de hijos que tienen H1: El Nivel Socioeconómico al cual pertenecen las mujeres en edad fértil influye en el número de hijos que tienen Nivel de significación:  = 0,05 Estadístico de Prueba: 2c = 17,156 Valor Crítico: 2(4; 0,95) = 9,48773 Decisión: H0 se rechaza por que 2c > 2(4; 0,95) Conclusión: El Nivel Socioeconómico al cual pertenecen las mujeres en edad fértil influye en el número de hijos que tienen

40 PRUEBA Chi-CUADRADO DE HOMOGENEIDAD DE PROPORCIONES
La prueba se especifica de la siguiente forma: : Formular las Hipótesis. H0: Las proporciones para un j-ésimo grupo son iguales. H1: Las proporciones para un j-ésimo grupo son diferentes. Fijar el nivel de significación: 0 ≤  ≤ 1 Calcular el estadístico de Prueba: Calcular el valor crítico: 2(gl; 1), siendo gl=(r–1)(c–1), r el número de filas y c el número de columnas. Tomar la decisión de acuerdo a la siguiente regla de decisión: H0 se rechaza si: 2c >2(gl; 1), en caso contrario se acepta. Nota:-Si alguna categoría tiene Eij<5, se deben agrupar la(s) categoría(s) hasta lograr que todas las frecuencias observadas sean mayores o iguales que 5.

41 EJEMPLO DE LA PRUEBA Chi-CUADRADO DE HOMOGENEIDAD DE PROPORCIONES
Para un estudio de mercado sobre hábitos de consumo de cigarrillos se dividió una ciudad en 8 zonas y se desea saber si la proporción de fumadores varía de una zona a otra. Para ello se toma una sub muestra de cada una de estas zonas y los resultados se resumen en la siguiente tabla: ¿Se puede inferir, con  = 0.05 que la proporción de fumadores varía de una zona a otra?

42 Prueba de Homogeneidad de Proporciones
H0: La proporción de fumadores no varía de una zona a otra H1: La proporción de fumadores varía de una zona a otra

43 EJEMPLO DE LA PRUEBA Chi-CUADRADO DE HOMOGENEIDAD DE PROPORCIONES
Hipótesis. H0: La proporción de fumadores no varía de una zona a otra H1: La proporción de fumadores varía de una zona a otra Nivel de significación:  = 0,05 Estadístico de Prueba: 2c = 6,101 Valor Crítico: 2(7; 0,95) = 14,0671 Decisión: H0 se acepta por que 2c < 2(7; 0,95) Conclusión: La proporción de fumadores no varía de una zona a otra


Descargar ppt "Estadística Aplicada II PRUEBAS Chi -CUADRADO"

Presentaciones similares


Anuncios Google