INTRODUCCIÓN AL ANÁLISIS DE DATOS CATEGÓRICOS. Temas Carácterísticas de la distribución Chi-cuadrada Prueba de bondad de ajustes Prueba de homogeneidad.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

ANALISIS PARAMÉTRICOS
Tema 22: Análisis de tablas de contingencia Prueba c2 como medida de asociación y como prueba de contraste. Coeficientes derivados de c2. Interpretación.
FRANCISCO MARÍN HERRADA
PATRONES DE DISTRIBUCIÓN ESPACIAL
Pruebas de significancia para datos cualitativos
Pruebas de hipótesis.
Capítulo 10 Test de Hipótesis.
KRUSKAL WALLIS Jorge Iván Betancur Marta Isabel Naranjo García
ANÁLISIS DE LA VARIANZA (ANOVA)
CATALINA AGUDELO, HAIDY PAOLA, JULIETH PINO
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Contraste de Hipótesis ETSITGC Madrid Unidad Docente de Matemáticas.
PRUEBAS DE HIPOTESIS HIPOTESIS
TABLAS DE CONTINGENCIA
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
Pruebas de hipótesis Walter Valdivia Miranda
Análisis no paramétricos
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Principios de Bioestadística: «PRUEBA t»
Clases 3 Pruebas de Hipótesis
CHI-CUADRADO Y DISTRIBUCION NORMAL
Clases 4 Pruebas de Hipótesis
Estadística Administrativa II
ANALISIS DE DATOS CATEGORICOS
UNIVERSIDAD INCA GARCILASO DE LA VEGA
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Estadística Administrativa II
AÑO DE PROMOCIÓN DE LA INDÚSTRIA RESPONZABLE Y COMPROMISO CLIMÁTICO
Inferencias con datos categóricos
Curso de Bioestadística. ANOVA
Pruebas No paramétricas
CORRELACIÓN y ASOCIACIÓN
Prof. Rosario Martínez Verdú
Estadística Administrativa II
Clase 4a Significancia Estadística y Prueba Z
Inferencia Estadística
PRUEBAS DE BONDAD DE AJUSTE
Análisis de variancia Capítulo once OBJETIVOS
Introducción a la Inferencia Estadistica
Capítulo 1. Conceptos básicos de la Estadística
Tema 5: Contrastes de Hipótesis no-paramétricos
La Distribución Normal.
Maestría en Modelado y Simulación
Pruebas de hipótesis.
El mundo de los negocios se ve abrumado por un número infinito de decisiones que han de ser tomadas a cada momento y que, en gran medida, determinarán.
PRUEBAS ESTADISTICAS NO PARAMETRICAS
Pruebas de hipótesis.
“Año de la consolidación económica social del perú” UNIVERSIDAD NACIONAL DE HUANCAVELICA (CREADA POR LEY N° 25265) FACULTAD DE EDUCACIÓN ESCUELA ACADÉMICA.
Taller 2 Reflexiones sobre Metodología Cuantitativa: Potencial de la comparación de muestras Germán Fromm R.
Universidad autónoma san francisco
Regresión Lineal Simple
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
ESTIMACIÓN DE PARÁMETROS
CONTRASTES NO PARAMÉTRICOS
Revisión estadística.
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
Estadística Aplicada II PRUEBAS Chi -CUADRADO
Aspectos generales de la investigación educativa en el SNIT
Coeficiente de Correlación Ji Cuadrada
Pruebas paramétricas y no paramétricas
Pasos del Método Científico.
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
14. Comparación de frecuencias entre grupos Módulo III: Análisis de datos categóricos Análisis de Datos Aplicado a la Investigación Científica
PRUEBA DE SIGNIFICANCIA
6.1 Las hipótesis Nazira Calleja. Tipos Hipótesis investigación Hipótesis estadísticas.
Inferencia estadística
PRUEBA CHI-CUADRADO UNIDAD 2: ESTADÍSTICA.
PRUEBA DE SIGNIFICANCIA
YASIR MOUBARIK GONZALEZ ESTADISTICA Y TIC SUBGRUPO 19 UNIDAD DOCENTE VIRGEN DEL ROCIO.
Transcripción de la presentación:

INTRODUCCIÓN AL ANÁLISIS DE DATOS CATEGÓRICOS

Temas Carácterísticas de la distribución Chi-cuadrada Prueba de bondad de ajustes Prueba de homogeneidad de proporciones. Prueba de independencia de dos variables.

Chi-cuadrado Los estadísticos Z (normal) y los t (t-student) permiten hacer pruebas de hipotesis que involucran promedios y porcentajes, el estadístico chi-cuadrado sirve para hacer pruebas de hipotesis en distribuciones de frecuencias. Chi-cuadrado permite determinar la asociación entre dos variables, la prueba es de tres tipos: De frecuencias (de homogeneidad) De independencia (respecto al total) De bondad de ajuste (ajuste a una distribución o frecuencias) Sin emabargo, la hipotesis nula es la misma, con diferentes impicaciones. Ho: Las frecuencias son iguales (Ho: Fr1-Fr2=0) H1: Las frecuencias son diferentes (H1: Fr1-Fr2≠0)

Chi-cuadrado Proporciona una prueba para contrastar frecuencias observadas con las frecuencias esperadas bajo una cierta hipotesis, en caso de haber una base científica que permita formular esa hipotesis nula. Se debe calcular el χ 2 cal, para hacer la prueba de hipotesis Χ 2 cal =Σ(O j -E j ) 2 /E j Donde: O j son los valores observados y E j los esperados bajo hipotesis. Un ejemplo de su uso son las segregaciones Mendelianas

Chi-cuadrado Puede usarse hasta con datos medibles en una escala nominal. Un estadístico tiene una distribución chi-cuadrado con k-1 grados de libertad, si n es suficientemente grande (frecuencia absoluta mínimo de 5). Los pasos en el análisis estadístico son los siguientes: 1. Plantear las hipotesis que sometera a prueba (Y el α) 2. Calcular las frecuencias esperadas 3. Calcular el estadístico de prueba X 2 cal 4. Comparar con el valor tabular y tomar la decisión. Si X 2 cal >X 2 tab, entonces rechazo Ho, en caso contrario se dice que no hay evidencia para rechazar Ho (Acepto Ho).

Prueba chi-cuadrado

Ejemplo (Bondad de ajuste) Un investigador sospecha que el color de un insecto sin reportar se comporta como una carácter de dominancia incompleta, por lo que obtuvo 50 animales diferentes mediante cruces (Gris X Gris) y encontró 10 negros, 28 gris y 12 blanco, ¿estos se comportan como la herencia asociada a dominancia incompleta? 1. Ho: Las frecuancias son iguales, por tanto el caracter se ajusta a las frecuencias de dominancia incompleta. H1: Las frecuancias son diferentes (No dominancia incompleta). α=0.05 (nivel de significancia) 2. Observado= 10 negros, 28 gris y 12 blanco Esperado= 50(1/4) negros, 50(1/2) gris y 50(1/4) blanco  12,5 negro, 25 gris y 12,5 blanco

Continuación ejercicio 3. Χ 2 cal =Σ(O j -E j ) 2 /E j Χ 2 cal =(10-12,5) 2 /12,5+(28-25) 2 /25+(12-12,5) 2 /12,5 = 0,5+0,36+0,02= Si busco en la tabla de chi-cuadrado, Χ 2 tab =X 2 (0.05,2) =5,99 Defino los grados de libertad, como gl=k-1, Donde: k son los niveles, en este caso 3 (Negro, gris y blanco) Decisión: Como Χ 2 cal << Χ 2 tab, entonces no hay evidencia para rechazar Ho, por lo tanto parece ser que hay un comportamiento similar a la dominancia incompleta

La decisión X 2 (0.05,2) =5,99 X 2 tabular X 2 cal =0.88 Como el valor esta en la región de aceptación, entonces no tengo evidencias para rechazar Ho. (Aceptar)

Ejercicio Que pasaría si en el mismo ejercicio se aumenta la prueba a 500 y se obtienen las siguientes frecuencias? 120 negros 270 Gris 110 blanco ¿Voluntarios?

En Excel

Ejemplo (Prueba de homogeneidad) Permite probar si varias muestras de un mismo caracter provienen de la misma población Ejemplo: Si se quiere comprobar la fiabilidad de un software de acuerdo al distribuidor que lo suministra. Para esto se tomaron muestras de 10 software de cada uno de los 3 distribuidores, probando el número de defectuosos en cada lote para cada distribuidor. DefectuososCorrectos Distribuidor 11 (1,33)9 (8,67)10 Distribuidor 22 (1,33)8 (8,67)10 Distribuidor 31 (1,33)9 (8,67)10 Total42630

Solución 1. Ho: La fiabilidad entre los tres distribuidores es igual H1: La fiabilidad es diferente (Fd1≠Fd2≠Fd3) 2. Frecuencias esperadas Defectuosos=(4/30)*10=1.33 (En este caso igual para el distribuidor 1, 2 y 3, porque la muestra es igual entre ellos) Correctos= (26/30)*10= Calculando X 2 cal X 2 cal =(1-1.33) 2 /1.33+(2-1.33) 2 /1.33+(1-1.33) 2 /1.33+ ( ) 2 /8.67+(8-8.67) 2 /8.67+(9-8.67) 2 /8.67=0.578

4. Decisión Calculo gl con dos variables, sería: gl=(Nº niveles filas-1)*(Nº de niveles columnas-1)=2 X 2 tab =X 2 (0.05,2) =5.99 Teniendo en cuenta que: X 2 cal << X 2 tab, acepto Ho X 2 tab =5,99 Es decir, que las muestras son homogeneas, osea, que no hay pruebas para decir que un distribuidor es mejor que otro

Ejemplo (prueba de independencia) Permite probar si 2 carácterísticas cualitativas están relacionadas entre sí (Ejemplo: el color de los ojos está relacionado con el color del cabello) Ejemplo: Un investigador quiere evaluar la asociación entre fumar y la adicción a la bebida. Por este motivo toma una muestra de individuos FumadorAlcohólicoNo alcohólico Total SI55055 NO26870 TOTAL

Solución 1. Defino las hipotesis y alfa=0.05 Ho: Hay independencia entre fumar y ser alcohólico H1: No hay independencia (Ft≠Fr1≠Fr2) 2. Frecuencias esperadas 3. Calculando X 2 cal = (5-3.08) 2 /3.08+(2-3.92) 2 /3.92+( ) 2 /51.92+( ) 2 /66.08 = 2,26 Fumad or AlcohólicoNo alcohólicoTotal SI(55/125)*7=3.08(55/125)*118= NO(70/125)*7=3.92(70/125)*118= TOTAL

Decisión Calculo gl, que sería: gl=(2-1)*(2-1)=1 X 2 tab =X 2 (0.05,1) =3.84 Teniendo en cuenta que: X 2 cal < X 2 tab, acepto Ho X 2 tab = 3.84 Es decir, que no hay evidencia para decir que hay una asociación entre fumar y ser alcohólico (Son independientes).

Resumen