Inferencias con datos categóricos

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

ANOVA DE UN FACTOR.
ANALISIS PARAMÉTRICOS
Dr. M. H. Rahbar Profesor de Bioestadística
Tema 16: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
Tema.11. Principales modelos de distribución de probabilidad en Psicología: Variables discretas: binomial y Poisson. Variables continuas: normal, chi.
Tema 22: Análisis de tablas de contingencia Prueba c2 como medida de asociación y como prueba de contraste. Coeficientes derivados de c2. Interpretación.
1.1 Contraste de Bondad de Ajuste para Datos Categóricos
TEMA 6: CONTRASTES NO PARAMÉTRICOS
Estadística Aplicada a Ecología
Ejemplo Grafico.
Test de Hipótesis.
Tema 8: Pruebas no paramétricas.
PRUEBA DE HIPOTESIS LUIS FERNANDO TRUJILLO LEYDER JULIAN GOMEZ
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Contraste de Hipótesis ETSITGC Madrid Unidad Docente de Matemáticas.
DISTRIBUCIONES MUESTRALES, DE LAS MUESTRAS O DE MUESTREO
PRUEBAS DE HIPOTESIS HIPOTESIS
TABLAS DE CONTINGENCIA
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
Bioestadística Aplicada I
Pruebas de hipótesis Walter Valdivia Miranda
بسم الله الرحمن الرحيم.
Clase 5 Hipótesis de diferencias de grupos
UNIVERSIDAD INCA GARCILASO DE LA VEGA
Clases 3 Pruebas de Hipótesis
Inferencia Estadística
Unidad VI: PRUEBAS DE HIPOTESIS
CHI-CUADRADO Y DISTRIBUCION NORMAL
Clases 4 Pruebas de Hipótesis
Curso Práctico de Bioestadística Con Herramientas De Excel Fabrizio Marcillo Morla MBA (593-9)
Diseño Estadístico y Herramientas para la Calidad
Unidad V: Estimación de
ANALISIS DE DATOS CATEGORICOS
UNIVERSIDAD INCA GARCILASO DE LA VEGA
Pronósticos, Series de Tiempo y Regresión
Tema 17: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
AÑO DE PROMOCIÓN DE LA INDÚSTRIA RESPONZABLE Y COMPROMISO CLIMÁTICO
Curso de Bioestadística. ANOVA
Pruebas No paramétricas
Análisis y diseño de experimentos
PRUEBAS DE BONDAD DE AJUSTE
Capítulo 1. Conceptos básicos de la Estadística
Pruebas de hipótesis.
PRUEBAS ESTADISTICAS NO PARAMETRICAS
COMPROBACION DE HIPOTESIS SOBRE DOS PROMEDIOS Mario Briones L. MV, MSc 2005.
Construcción de la tabla del ANOVA
Para comparar proporciones en dos grupos
Regresión Lineal Simple
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
ESTIMACIÓN DE PARÁMETROS
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
Estadística Aplicada II PRUEBAS Chi -CUADRADO
Aspectos generales de la investigación educativa en el SNIT
CONTRASTE DE HIPÓTESIS Dimensiones Largo275mm. 169 mm 2 Ancho175mm.49 mm 2 Alto175mm.49 mm 2 Peso16 Kg.1 Kg 2. SITUACIÓN PROBLEMA.
Pruebas paramétricas y no paramétricas
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
INTRODUCCIÓN AL ANÁLISIS DE DATOS CATEGÓRICOS. Temas Carácterísticas de la distribución Chi-cuadrada Prueba de bondad de ajustes Prueba de homogeneidad.
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
DISTRIBUCIÓN “t” DE STUDENT
RESUMEN DE LA DISTRIBUCION MUESTRAL PARA LA MEDIA MUESTRAL X INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL  TIPO DE PROBLEMA ESPERANZA Y VARIANZA.
PRUEBA DE SIGNIFICANCIA
PRUEBAS DE HIPÓTESIS Y ESTIMACIÓN.  Constituyen el proceso relacionado con aceptar o rechazar declaraciones acerca de los parámetros de la población.
Estadística Inferencial
Tarea # 4 PRUEBAS DE HIPÓTESIS ESTADÍSTICAS. PRUEBA DE HIPÓTESIS Hipótesis es una aseveración de una población elaborado con el propósito de poner a prueba,
Bioestadística Inferencia estadística y tamaño de muestra
PRUEBA CHI-CUADRADO UNIDAD 2: ESTADÍSTICA.
PRUEBA DE SIGNIFICANCIA
ANALISIS DE VARIANZA.
Transcripción de la presentación:

Inferencias con datos categóricos Bioestadística Inferencias con datos categóricos

Posibles escenarios Error Tipo I (α) Error Tipo II (β) ESTADO REAL (VERDAD) desconocido Hay diferencia, Ha es verdadera No hay diferencia, H0 es verdadera Diferencia (Rechazar H0 y aceptar Ha) Error Tipo I (α) NO HAY ERROR EVIDENCIA ( DATOS) observado Error Tipo II (β) No diferencia (No rechazar H0) NO HAY ERROR

Interpretando pruebas: Prob. de error tipo Prob(Ho verdadera) Rechazo Ho y acepto Ha Me preocupo de que Ho pueda ser verdadera, particularmente si el p-value es < 0.05 pero no muy “pequeño” SI P-value de la muestra < 0.05 No puedo rechazar Ho y no puedo afirmar nada sobre la validez de Ha La diferencia/asociación observada tiene relevancia biológica? El tamaño de muestra dió suficiente “potencia” (1-β)? Si es fácil, calcule la potencia α o nivel de significancia NO

Usos de la prueba Chi2: Para determinar si dos variables categóricas están asociadas entre sí Para determinar el ajuste de datos empíricos provenientes de una muestra a una cierta distribución teórica Para hacer estimación por intervalos y prueba de hipótesis de una muestra sobre la varianza de una población

Principio central: Cálculo de las diferencias (al cuadrado) entre los valores observados y esperados de una o mas variables Los valores esperados se calculan de acuerdo a una distribución planteada como hipótesis nula Si la suma de las diferencias es “grande”, la distribución propuesta para los valores esperados (H0) no “predice” bien los valores que hemos observado. Se rechaza H0.

Ejemplo: relación entre el género y el status social

La pregunta de interés: ¿El status social está relacionado con el género en las personas encuestadas en el estudio de DEVIDA? ¿La distribución por clase social es diferente entre varones y mujeres? ¿La proporción de varones y mujeres difiere entre los grupos sociales estudiados?

Hipótesis: Comparando la distribución por clase social: Hipótesis nula (Ho): Claseshombres = Clasesmujeres Hipótesis alternativa (Ha): Claseshombres  Clasesmujeres Comparando la distribución por sexo: Sexoalta = Sexomedia = Sexobaja Sexoalta , Sexomedia , Sexobajano son iguales. Al menos una de estas proporciones difiere de las otras

Entendiendo el método: Un eje para calcular marginales

Calculando valores esperados: 108 * 0.4344 = 46.9 108 * 0.5656 = 61.1 1,261 * 0.4344 = 547.8 1,261 * 0.5656 = 713.2 3,481 * 0.4344 = 2,107.0 3,481 * 0.5656 = 2,473.0

Escogiendo otro eje: Eje para calcular marginales

Calculando valores esperados: 2,107 * 0.0223 = 46.9 2,107 * 0.2600 = 547.8 2,107 * 0.7177 = 1,512.3 2,743 * 0.0223 = 61.1 2,743 * 0.2600 = 713.2 2,743 * 0.7177 = 1,968.7

Cálculo de la Chi2: Grados de libertad = (filas – 1) * (columnas –1) = (3-1) * (2-1) = 2

En Stata:

Chi2 con 2 grados de libertad: Chi2 calculado = 7.10 (p=0.029) Si Chi2>5.99 (α=0.05), rechaza H0

Interpretación: Según el estadístico Chi2 , el sexo no es independiente del status social La proporción de varones y mujeres difiere según el status social La proporción de varones es diferente estadísticamente entre los tres estratos socioeconómicos La distribución según estrato social difiere entre varones y mujeres

La prueba Chi2:

Pregunta de Interés: La distribución entre sexos difiere entre las cuatro regiones El sexo es independiente de la región (?)

Hipótesis Planteadas: Hipótesis nula (Ho): %VaronesLima = %VaronesCosta = %VaronesSierra = %VaronesSelva Hipótesis alternativa (Ha): La proporción de varones difiere al menos entre dos de las regiones

Cálculos: Eje a escoger Valores esperados Grados de libertad

Interpretación: El sexo es independiente de la región geográfica La proporción de varones no cambia entre las cuatro regiones geográficas

Ejemplo 3: La proporción de varones y mujeres en la encuesta es 50%

Prueba exacta de Fisher: Válida para tablas 2x2 y para N x M Usa permutaciones y se basa en las probabilidades marginales observadas No requiere un mínimo valor esperado por celda

Prueba exacta de Fisher:

Concordancia entre dos pruebas: T E S T A Sin enfermedad (A+) Con enfermedad (A-) TEST B A+ y B+ a A- y B+ b Sin enfermedad (B+) A+ y B- c A- y B- d Con enfermedad (B-)

El estadístico Kappa: Concordancia Observada – Concordancia Aleatoria Concordancia Observada = (a + d) / (a + b + c + d) Concordancia Aleatoria = [a / (a + b)] * [a / (a + c)] + (esperada) [d / (c + d)] * [d / (b + d)]

Calculando a mano: Observada: 0.0509 + .6765 = 0.7274 Aleatoria: (86.3 + 3,120.3)/4850 = 0.6612

Cálculos: Kappa = ---------------------------------------------- Concordancia Observada – Concordancia Aleatoria Kappa = ---------------------------------------------- 1 - Concordancia Aleatoria 0.7274 – 0.6612 0.0662 Kappa = ----------------- = -------- = 0.1954 1 – 0.6612 0.3388

Estadístico Kappa:

Que debemos recordar de hoy: El concepto y los supuestos para la aplicación de la prueba Chi2 Como aplicar la prueba Chi2 para determinar si dos variables categóricas están asociadas entre si El uso de la prueba Chi2 para determinar la validez de una cierta distribución teórica sobre un conjunto de datos empíricos La aplicación e interpretación de la prueba Kappa de concordancia