Parte II Chi-Cuadrada χ 2 Maestría de Salud Pública Universidad de Xochicalco 2º Semestre 12 de Junio del 2009 Dr Burgos Dra. Rangel.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

UNIVERSIDAD NACIONAL DE EDUCACIÓN Alma Máter del Magisterio Nacional
MSP César Eduardo Luna Gurrola
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN METODOLOGÍAS DE INVESTIGACIÓN
1.1 Contraste de Bondad de Ajuste para Datos Categóricos
TEMA 6: CONTRASTES NO PARAMÉTRICOS
CONTENIDOS Teoría del muestreo ¿Cómo seleccionar una muestra?
PATRONES DE DISTRIBUCIÓN ESPACIAL
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
PRUEBAS DE HIPOTESIS HIPOTESIS
Prueba de Hipótesis La Prueba t Carlos B. Ruiz-Matuk.
TABLAS DE CONTINGENCIA
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
Estimación por Intervalos de confianza
Pruebas de hipótesis Walter Valdivia Miranda
ANOVA Modelo I: Comparación entre medias
División de Estudios Políticos, CIDE
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Clase 5 Hipótesis de diferencias de grupos
Clases 4 Pruebas de Hipótesis
Curso Práctico de Bioestadística Con Herramientas De Excel Fabrizio Marcillo Morla MBA (593-9)
1 Planteamiento del problema ¿Tenemos los humanos la capacidad de percibir si nos miran desde atrás? O, más exactamente: ¿Es defendible que existen otras.
Prueba para la Bondad de ajuste Validación de Modelo
Probabilidad y prueba de significancia de Chi-Cuadrado (X²)
Diseño Estadístico y Herramientas para la Calidad
HAWKES LEARNING SYSTEMS math courseware specialists Copyright © 2010 by Hawkes Learning Systems/Quant Systems, Inc. All rights reserved. Capítulo 12 Más.
UNIVERSIDAD INCA GARCILASO DE LA VEGA
Pronósticos, Series de Tiempo y Regresión
Tema 17: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Investigación Experimental
AÑO DE PROMOCIÓN DE LA INDÚSTRIA RESPONZABLE Y COMPROMISO CLIMÁTICO
Inferencias con datos categóricos
Curso de Bioestadística. ANOVA
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Pruebas No paramétricas
Inferencia Estadística
CORRELACIÓN y ASOCIACIÓN
Prof. Rosario Martínez Verdú
¿Cuándo usar esta distribución?
Titular: Agustín Salvia
Clase 4a Significancia Estadística y Prueba Z
PRUEBAS DE BONDAD DE AJUSTE
Herramientas básicas.
Tamaño de Muestra y Poder del Estudio de Investigación  Los ingredientes para calcular el tamaño de muestra y como diseñar el estudio  Un ejemplo, con.
Capítulo 1. Conceptos básicos de la Estadística
Pruebas de hipótesis.
PRUEBAS ESTADISTICAS NO PARAMETRICAS
CAPITULO 4 LA ENCUESTA SOCIAL
Prueba de Hipótesis sobre la diferencia de proporciones poblacionales
Aplicaciones Estadísticas a las Finanzas Clase 1
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
ESTIMACIÓN DE PARÁMETROS
Regresión lineal simple Nazira Calleja
Inferencia estadística: Muestreo aleatorio simple
Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…
ESTADÍSTICA DESCRIPTIVA
Aplicaciones Estadísticas a las Finanzas Clase 1
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
INTRODUCCIÓN AL ANÁLISIS DE DATOS CATEGÓRICOS. Temas Carácterísticas de la distribución Chi-cuadrada Prueba de bondad de ajustes Prueba de homogeneidad.
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
MÁS DE DOS MUESTRAS Procedimientos paramétricos. Pruebas de diferencias entre más de dos muestras *Con cálculos diferentes de SC y gl, según el caso.
PRUEBA DE SIGNIFICANCIA
Estadística Inferencial
1 REGRESIÓN CON VARIABLES DICOTÓMICAS TEMA 1 (CONTINUACIÓN)
PRUEBA CHI-CUADRADO UNIDAD 2: ESTADÍSTICA.
PRUEBA DE SIGNIFICANCIA
ANALISIS DE VARIANZA.
Evaluando los promedios de grupos distintos UNIDAD 7 1.
Transcripción de la presentación:

Parte II Chi-Cuadrada χ 2 Maestría de Salud Pública Universidad de Xochicalco 2º Semestre 12 de Junio del 2009 Dr Burgos Dra. Rangel

Temas a tratar Corrección de Yates Prueba de McNemar para muestras correlacionadas Prueba de bondad de ajuste para la distribución χ 2 Combinación de valores-p Repaso Habrá preguntas y Ejercicios

Corrección de Yates Se puede utilizar cuando alguna de las celdas tiene un valor esperado <5 Considerada muy conservadora aumenta el riesgo del error tipo II Es mejor utilizar la prueba exacta de Fisher

Prueba de McNemar Utilizada cuando queremos comparar una variable en el mismo sujeto “antes y después” Se utiliza para muestras correlacionadas donde los “sujetos” son sus “propios controles” o son “pareados”. Útil en variables dicotómicas

Prueba de McNemar: Uso de analgésicos antes y después de vertebroplastía Datos: Evans AJ, et al. Radiology 2003; 226: A 24 B4B4 C 20 D5D5 Antes Después Analg No AnalgNo Total

Cálculos: = (4 - 20) = Prueba de Hipótesis: df= (r - 1)(c - 1) = χ 2 = (1) Rechazar H 0 Resultados Después*Antes Crosstab AntesTotal AnalgNo Despues Analg24428 No20525 Total44953 Prueba de Chi-Cuadrada Valor Exact Sig. (2-colas) Prueba de McNemar N de Casos Validos53

Prueba de Bondad de Ajuste para χ 2 Utilizada cuando tenemos dos o mas categorías de una variable. Determina que tan bien un distribución hipotética se ajusta a la distribución observada

Genética de los rosales En mi patio tengo un grupo de rosales hibridos. Mi hipótesis de genetista es (de acuerdo a la teoría de Mendel) que debo de tener 50% flores rosas, 25% flores blancas, y 25% flores rojas. PpPp PpPp PPPpPpPpPp pp

Flores Tengo 120 de estas plantas. El resultado de los colores de las flores fue el siguiente

Flores – Realidades y Expectativas Recuerden, yo esperaba 50% Rosas, 25% Blancas y 25% Rojas. Si plante 120 semillas, yo esperaría la siguiente variedad de flores

Flores – Realidades y Expectativas Si mi hipótesis es correcta (50%, 25%, 25%), ¿que tan probable es que obtener esta diferencia en la distribución de colores observados y la distribución esperada?

Utilizada para determinar si la probabilidad es < α. En tal caso rechazo la hipótesis 0 O Si la probabilidad es > α, no rechazo mi hipótesis 0 La Prueba χ 2

La Prueba Chi-Cuadrada Hipótesis – H 0 : P(rosa, blanca, roja) =.5,.25,.25 “La proporción de la población de flores rosas, blancas y rojas es de.5,.25, y.25 respectivamente”. – H 1 : P(rosa, blanca, roja) ≠.5,.25,.25 “La proporción de la población de flores rosas, blancas, y rojas es diferente a.5,.25, y.25 respectivamente” Categorías mutuamente excluyentes, exhaustivas (∑P = 1)

La Prueba Chi-Cuadrada La hipótesis para la prueba de bondad-de-ajuste se establece en términos de proporciones. La prueba Chi-Cuadrada se lleva a cabo en frecuencias reales no proporciones. Específicamente, la χ 2 opera en las diferencias entre las frecuencias observadas y las esperadas. Primero asegúrese que todo esta en frecuencias

La prueba de Chi-Cuadrada ∑E = 120 Frecuencias observadas = O Frecuencias esperadas = E E = N x Proporción esperada E = N x P(celda) Note que siempre, ∑E = ∑O ∑O = 120

En la prueba de Chi Cuadrada… …calculamos (O-E) 2 /E en cada celda, sumamos todos los valores de (O-E) 2 de todas las celdas, y comparamos el valor de esta suma a un valor crítico. χ 2 = ∑ (0-E) 2 E

La Distribución Chi Cuadrada Los estadísticos han encontrado que si la H 0 es correcta y calcula la estadística χ 2 para todas las muestras posibles de N tamaño, los valores son de una distribución de probabilidades llamada la distribución χ 2.

Características de la distribución χ 2 Una familia de distribuciones con diferentes grados de libertad (df). Con cola positiva pronunciada; esto disminuye a > df. El valor mínimo = 0 (χ 2 no puede ser negativa) El valor promedio aumenta (toda la distribución se desplaza a la derecha) al aumentar los df.

Características de la distribución χ 2 Una familia de distribuciones que varia de acuerdo a los df.

Si la diferencia entre O’s y E’s es mayor, la χ 2 aumenta. Ya que solo nos interesa rechazar la H 0 si la diferencia entre las frecuencias observadas y esperadas es mayor que lo esperado aleatoriamente, la región para rechazar la H 0 se encuentra en la cola positiva. Características de la distribución χ 2

Chi-Cuadrada: Prueba de una Cola Regla de decisión: rechazar H 0 si χ 2 > χ 2 c 0

Encontrando χ 2 Tabla de χ 2 df = k-1 Por que? – Si tiene tres categorías, solo la suma de dos tiene la libertad para variar Escoja el valor α, lea la lista de df para encontrar la χ 2 c c

Encontrando a la χ 2 c

Los Seis Pasos Obligatorios Establecer H 0 y H 1 Escoja su α La distribución probabilística es χ 2 con k-1 df (grados de libertad). Encuentre y establezca la regla de decisión: se rechaza la H 0 si χ 2 > χ 2 Calcule la χ 2 Aplique la regla de decisión. co o

Calculando la χ 2 o

Encontrando la χ 2 o Siempre, ∑(O-E) = 0

Encontrando la χ 2 o

o ∑[(O-E) 2 /E] = χ 2 = 7.91 Ya que χ 2 > χ 2, rechazamos la H 0 Componentes de la χ 2 oc

Interpretación Ya que rechazamos la H 0, la hipótesis del genetista no se ajustó a los datos. La distribución de categorías (colores) en la población plantas es probablemente diferente a la esperada de.5 rosas,.25 blancas,.25 rojas

Otro Ejemplo La compañía de nutrición enteral “Bimbo” que se encuentra por debajo de “Ensure” en ventas, cree, que dada la oportunidad, la mayoría de los consumidores preferirían “Bimbo”, diseñan una prueba “ciega” para probar su hipótesis. Una muestra aleatoria de 100 ancianos prueban una muestra de cada nutrición enteral y se les pregunta cual les gustó mas. 57 prefieren Bimbo, mientras que 43 escogen “Ensure”.

¿Pueden promocionar que las personas prefieren “Bimbo”? H 0 : p(Bimbo)=P(Ensure) o p(Bimbo, Ensure)=.5,.5 H 1 : p(Bimbo) ≠ p(Ensure) o p(Bimbo, Ensure) ≠.5,.5

Respuestas Utilice α =.05 df = 1, distribución χ2 con 1 df Χ 2 para α =.05, df = 1, es de _____. Rechazar la H 0 si χ 2 ≥ ______ Calcular c 3.84 o

Chi-Cuadrada Hacer el calculo Ya que la χ 2 < χ 2 (1.96 < 3.84), retenemos la H 0 Bimbo no puede asumir que mas personas los prefieren co c

Mejoren calificación Encontramos que 57 vs. 43 no nos permite rechazar la H 0. ¿Cual es el numero mas pequeño en preferencias para Bimbo que nos llevaría a un hallazgo significativo? (rechazar H 0 ) a α = 0.05? Una respuesta correcta ahora puede valer puntos para su calificación final

Supuestos de la prueba de Bondad-de-Ajuste Las observaciones en diferentes categorias son independientes Las categorias son mutuamente excluyentes Las categorias son exahustivas Ninguna Frecuencias esperadas < 2 “Pocas” frecuencias esperadas < 5 – La distribucion χ 2 no describe apropiadamente probabilidades de muestreos cuando las frecuencias esperadas son pequeñas

Combinación de valores p 5 estudios para probar la efectividad encontraron lo siguientes resultados: Estudio 1: p 1 =0.15; Estudio 2: p 2 =0.07; Estudio 3: p 3 =0.5; Estudio 4: p 4 =0.22; Estudio 5: p 5 = 0.09 Para un valor p arbitrario, la hipótesis nula que dice que es correcto, -2log e p puede considerarse derivado de una distribución χ 2 con 2 df. Si hay k estudios independientes, cada uno contribuye 2k df

–2log e (0.15) = 3.79 –2log e (0.7) = 5.32 –2log e (0.50) = 1.39 –2log e (0.22) = 3.03 –2log e (0.9) = 4.82 Total = df = 2k = 2 x 5 = 10 df Χ 2 : ______ p: ______ c Combinación de valores p Calculo de Χ 2

Ojo con la Chi-Cuadrada

Vuelvan a sacar Chi-Cuadrada Ojo con los Resultados ESPURIO Al separar en subgrupos:

Repaso χ 2 La χ 2 – es una prueba no paramétrica aplicada a datos de frecuencia categórica. La distribución probabilística relevante es la distribución χ 2. – Una familia de distribuciones con diferentes grados de libertad (df) – Con asimetría positiva con mínimo = 0 – La asimetría disminuye a > grados de libertad – El centro de la distribución y valores críticos aumentan > grados de libertad.

Repaso χ 2 Área de rechazo en la cola positiva, Regla de decisión: rechazar la H 0 si χ 2 ≥ χ 2 Dos formas de uso: – Prueba de independencia Utilizada para probar si dos o mas variables categóricas están relacionadas Utilizada para saber si dos o mas muestras esta relacionadas – Prueba de Bondad de Ajuste Utilizada para determinar si una distribución observada “se ajusta” a una distribución hipotética (o esperada) c0

Aunque no siempre seamos así! Siendo que la Epidemiología y Bioestadística (al igual que la naturaleza) obedece a las matemáticas, la regla de “nada por nada es la ley” será aplicada en nuestra materia, para darles la oportunidad de obtener una “gran calificación”

En la próxima clase Haremos las evaluaciones del curso, ya que ustedes, nuestros pupilos, van a: 1.resolver unos problemas de epidemiología en el pizarrón y, 2.explicar en forma clara, concreta, breve y exhaustiva (como buen profesional) un tema utilizando las palabras claves indicadas. Son solo cinco minutos para explicar el tema, no se permitirá uso de PowerPoint, solo pizarrón

Próxima Clase, orden aleatorio: Dr. Arellano: Resolver ejercicio #1 en clase y explicar en menos de 5 minutos la “Paradoja de Simpson”. Dr. Oceguera: Resolver ejercicio #2, explicar en que consiste el “Triangulo de Pascal” y demostrar su uso en clase, se espera que dibuje uno en clase (5 min). Dra. Kapika: Resolver ejercicio #3, explicar error tipo I y II (5 min)

Enf. Barreras: Resolver ejercicio # 4 y explicar en menos de 5 minutos las bases matemáticas de la “corrección de Yates” debe de incluir las palabras clave: “distribución continua” y “discreta”. Dr. Villegas: Resolver ejercicio # 5 y explicar en menos de 5 minutos la prueba para proporciones correlacionadas de McNemar. Próxima Clase, orden aleatorio:

Dr. Garcia: Resolver ejercicio #6 y explicar en 5 minutos las bases matemáticas para asignar grados de libertad y como afecta a la distribución de la Chi-Cuadrada (debe incluir las siguientes palabras clave: “proporciones marginales”, “variancia”, “media y “moda” ). Podría haber sorpresas y ejercicios adicionales durante la clase (Todo es posible de acuerdo a la incertidumbre probabilística -epidemiológica) Próxima Clase, orden aleatorio:

MUCHA SUERTE,