La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

INTRODUCCIÓN AL ANÁLISIS DE DATOS CATEGÓRICOS. Temas Carácterísticas de la distribución Chi-cuadrada Prueba de bondad de ajustes Prueba de homogeneidad.

Presentaciones similares


Presentación del tema: "INTRODUCCIÓN AL ANÁLISIS DE DATOS CATEGÓRICOS. Temas Carácterísticas de la distribución Chi-cuadrada Prueba de bondad de ajustes Prueba de homogeneidad."— Transcripción de la presentación:

1 INTRODUCCIÓN AL ANÁLISIS DE DATOS CATEGÓRICOS

2 Temas Carácterísticas de la distribución Chi-cuadrada Prueba de bondad de ajustes Prueba de homogeneidad de proporciones. Prueba de independencia de dos variables.

3 Chi-cuadrado Los estadísticos Z (normal) y los t (t-student) permiten hacer pruebas de hipotesis que involucran promedios y porcentajes, el estadístico chi-cuadrado sirve para hacer pruebas de hipotesis en distribuciones de frecuencias. Chi-cuadrado permite determinar la asociación entre dos variables, la prueba es de tres tipos: De frecuencias (de homogeneidad) De independencia (respecto al total) De bondad de ajuste (ajuste a una distribución o frecuencias) Sin emabargo, la hipotesis nula es la misma, con diferentes impicaciones. Ho: Las frecuencias son iguales (Ho: Fr1-Fr2=0) H1: Las frecuencias son diferentes (H1: Fr1-Fr2≠0)

4 Chi-cuadrado Proporciona una prueba para contrastar frecuencias observadas con las frecuencias esperadas bajo una cierta hipotesis, en caso de haber una base científica que permita formular esa hipotesis nula. Se debe calcular el χ 2 cal, para hacer la prueba de hipotesis Χ 2 cal =Σ(O j -E j ) 2 /E j Donde: O j son los valores observados y E j los esperados bajo hipotesis. Un ejemplo de su uso son las segregaciones Mendelianas

5 Chi-cuadrado Puede usarse hasta con datos medibles en una escala nominal. Un estadístico tiene una distribución chi-cuadrado con k-1 grados de libertad, si n es suficientemente grande (frecuencia absoluta mínimo de 5). Los pasos en el análisis estadístico son los siguientes: 1. Plantear las hipotesis que sometera a prueba (Y el α) 2. Calcular las frecuencias esperadas 3. Calcular el estadístico de prueba X 2 cal 4. Comparar con el valor tabular y tomar la decisión. Si X 2 cal >X 2 tab, entonces rechazo Ho, en caso contrario se dice que no hay evidencia para rechazar Ho (Acepto Ho).

6 Prueba chi-cuadrado

7 Ejemplo (Bondad de ajuste) Un investigador sospecha que el color de un insecto sin reportar se comporta como una carácter de dominancia incompleta, por lo que obtuvo 50 animales diferentes mediante cruces (Gris X Gris) y encontró 10 negros, 28 gris y 12 blanco, ¿estos se comportan como la herencia asociada a dominancia incompleta? 1. Ho: Las frecuancias son iguales, por tanto el caracter se ajusta a las frecuencias de dominancia incompleta. H1: Las frecuancias son diferentes (No dominancia incompleta). α=0.05 (nivel de significancia) 2. Observado= 10 negros, 28 gris y 12 blanco Esperado= 50(1/4) negros, 50(1/2) gris y 50(1/4) blanco  12,5 negro, 25 gris y 12,5 blanco

8 Continuación ejercicio 3. Χ 2 cal =Σ(O j -E j ) 2 /E j Χ 2 cal =(10-12,5) 2 /12,5+(28-25) 2 /25+(12-12,5) 2 /12,5 = 0,5+0,36+0,02=0.88 4. Si busco en la tabla de chi-cuadrado, Χ 2 tab =X 2 (0.05,2) =5,99 Defino los grados de libertad, como gl=k-1, Donde: k son los niveles, en este caso 3 (Negro, gris y blanco) Decisión: Como Χ 2 cal << Χ 2 tab, entonces no hay evidencia para rechazar Ho, por lo tanto parece ser que hay un comportamiento similar a la dominancia incompleta

9

10 La decisión X 2 (0.05,2) =5,99 X 2 tabular X 2 cal =0.88 Como el valor esta en la región de aceptación, entonces no tengo evidencias para rechazar Ho. (Aceptar)

11 Ejercicio Que pasaría si en el mismo ejercicio se aumenta la prueba a 500 y se obtienen las siguientes frecuencias? 120 negros 270 Gris 110 blanco ¿Voluntarios?

12 En Excel

13 Ejemplo (Prueba de homogeneidad) Permite probar si varias muestras de un mismo caracter provienen de la misma población Ejemplo: Si se quiere comprobar la fiabilidad de un software de acuerdo al distribuidor que lo suministra. Para esto se tomaron muestras de 10 software de cada uno de los 3 distribuidores, probando el número de defectuosos en cada lote para cada distribuidor. DefectuososCorrectos Distribuidor 11 (1,33)9 (8,67)10 Distribuidor 22 (1,33)8 (8,67)10 Distribuidor 31 (1,33)9 (8,67)10 Total42630

14 Solución 1. Ho: La fiabilidad entre los tres distribuidores es igual H1: La fiabilidad es diferente (Fd1≠Fd2≠Fd3) 2. Frecuencias esperadas Defectuosos=(4/30)*10=1.33 (En este caso igual para el distribuidor 1, 2 y 3, porque la muestra es igual entre ellos) Correctos= (26/30)*10=8.67 3. Calculando X 2 cal X 2 cal =(1-1.33) 2 /1.33+(2-1.33) 2 /1.33+(1-1.33) 2 /1.33+ (9- 8.67) 2 /8.67+(8-8.67) 2 /8.67+(9-8.67) 2 /8.67=0.578

15 4. Decisión Calculo gl con dos variables, sería: gl=(Nº niveles filas-1)*(Nº de niveles columnas-1)=2 X 2 tab =X 2 (0.05,2) =5.99 Teniendo en cuenta que: X 2 cal << X 2 tab, acepto Ho X 2 tab =5,99 Es decir, que las muestras son homogeneas, osea, que no hay pruebas para decir que un distribuidor es mejor que otro

16 Ejemplo (prueba de independencia) Permite probar si 2 carácterísticas cualitativas están relacionadas entre sí (Ejemplo: el color de los ojos está relacionado con el color del cabello) Ejemplo: Un investigador quiere evaluar la asociación entre fumar y la adicción a la bebida. Por este motivo toma una muestra de individuos FumadorAlcohólicoNo alcohólico Total SI55055 NO26870 TOTAL7118125

17 Solución 1. Defino las hipotesis y alfa=0.05 Ho: Hay independencia entre fumar y ser alcohólico H1: No hay independencia (Ft≠Fr1≠Fr2) 2. Frecuencias esperadas 3. Calculando X 2 cal = (5-3.08) 2 /3.08+(2-3.92) 2 /3.92+(50- 51.92) 2 /51.92+(68-66.08) 2 /66.08 = 2,26 Fumad or AlcohólicoNo alcohólicoTotal SI(55/125)*7=3.08(55/125)*118=51.9255 NO(70/125)*7=3.92(70/125)*118=66.0870 TOTAL7118125

18 Decisión Calculo gl, que sería: gl=(2-1)*(2-1)=1 X 2 tab =X 2 (0.05,1) =3.84 Teniendo en cuenta que: X 2 cal < X 2 tab, acepto Ho X 2 tab = 3.84 Es decir, que no hay evidencia para decir que hay una asociación entre fumar y ser alcohólico (Son independientes).

19 Resumen

20


Descargar ppt "INTRODUCCIÓN AL ANÁLISIS DE DATOS CATEGÓRICOS. Temas Carácterísticas de la distribución Chi-cuadrada Prueba de bondad de ajustes Prueba de homogeneidad."

Presentaciones similares


Anuncios Google