Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva

Slides:

Advertisements

Presentaciones similares

DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE

Advertisements

DSITRIBUCION T DE STUDENT.

ANOVA DE UN FACTOR.

ESTIMACION DE PARAMETRO

1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN LAS EMPRESAS GALLEGAS ( Resumen PYMES ) Noviembre de 2004.

Tema 17: Contraste paramétrico de hipótesis II: Pruebas de contraste para más de dos grupos independientes (ANOVA entresujetos): un y dos factores completamente.

MÉTODOS Y DISEÑOS DE INVESTIGACIÓN METODOLOGÍAS DE INVESTIGACIÓN

Tema 13. Inferencia estadística Principales conceptos. Muestreo

Introducción a la Inferencia Estadística

Tema 15. Contraste de hipótesis: Planteamiento de las hipótesis

Respuestas Buscando a Nemo.

Árboles de decisión Tema 9 Parte teórica Minería de datos

I ) CONTRASTE DE HIPÓTESIS.

Pruebas de hipótesis.

Departament destadísticoa Grup destadísticoa Computacional Introducción a la metodología bootstrap Jordi Ocaña Departament destadísticoa Secció Departamental.

Contraste de Hipótesis

CONTROL ESTADÍSTICO DE PROCESOS

Capítulo 10 Test de Hipótesis.

Fco. Javier Burguillo Universidad de Salamanca

Estadística Teórica II

Tema 7: Introducción a los contrastes de hipótesis

La Estadística en 37 preguntas

Bioestadística Diplomado en Sanidad

} LISSET BÁRCENAS MONTERROZA

Comprobación de diferencias entre medias

ANÁLISIS DE LA VARIANZA (ANOVA)

Tema 7: Introducción a los contrastes de hipótesis

La prueba U DE MANN-WHITNEY

La ley de los grandes números

puede o no ser verdadero, relativo a una o más poblaciones.

Estimación por intervalos de confianza.

Tests de permutaciones y tests de aleatorización

Estimación por Intervalos de confianza

Giancarlo Vivanco Juan Pablo Villarroel

CURSO DE ESTADÍSTICA BÁSICA

ESTADÍSTICA INFERENCIAL I

Distribuciones muestrales Procedimientos de muestreo

Diseño de experimentos

ESTADIGRAFOS DE DISPERSION

Estadística Administrativa II

Prueba de hipótesis Equivalencia entre la prueba de hipótesis y los intervalos de confianza Valor de probabilidad Valor de probabilidad unilateral Prueba.

Inferencia Estadística

Unidad VI: PRUEBAS DE HIPOTESIS

Tema 17: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.

Tema 7: Introducción a los contrastes de hipótesis

Fundamentos del contraste de hipótesis

Estadística aplicada a la educación

Contraste de hipótesis: ¿Qué es una hipótesis estadística?

Tema : Introducción a los contrastes de hipótesis

TEMA 15 * CONTRASTES DE HIPÓTESIS

Análisis y diseño de experimentos

Tema 5: Numéricas en varios grupos

Tema: Pruebas de hipótesis

Capítulo 1. Conceptos básicos de la Estadística

INFERENCIA ESTADÍSTICA

Pruebas de hipótesis.

PRUEBAS ESTADISTICAS NO PARAMETRICAS

Bioestadística. U. Málaga. Tema 4: Variables numéricas en 2 grupos 1 Bioestadística Tema 4: Numéricas en dos grupos.

ANÁLISIS CUANTITATIVO II

@ Angel Prieto BenitoMatemáticas 2º Bachillerato CS1 TEMA 15 * CONTRASTES DE HIPÓTESIS MATEMÁTICAS A. CS II.

ESTIMACIÓN DE PARÁMETROS

Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.

Estadística para administradores

CONTRASTE DE HIPÓTESIS Dimensiones Largo275mm. 169 mm 2 Ancho175mm.49 mm 2 Alto175mm.49 mm 2 Peso16 Kg.1 Kg 2. SITUACIÓN PROBLEMA.

Variable aleatoria El resultado de un experimento aleatorio puede ser descrito en ocasiones como una cantidad numérica. En estos casos aparece la noción.

DISTRIBUCIÓN “t” DE STUDENT

Estadística Inferencial

Bioestadística Inferencia estadística y tamaño de muestra

Evaluando los promedios de grupos distintos UNIDAD 7 1.

Transcripción de la presentación:

Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga – España baron@uma.es

Inferencia estadística Hablar de la población, a pesar de haber estudiado sólo a una muestra: Respuestas con probabilidad alta de acertar (típicamente 95%) La respuesta la solemos dar en forma de: intervalo de confianza Contraste de hipótesis.

Error típico/estándar Es “misteriosillo”… …al principio. Es muy fácil de interpretar: El valor obtenido en la muestra se espera que esté cerca del valor buscado en la población. ¿cómo de cerca? Hay una probabilidad del 95% de que no esté a más de 2 errores típicos de distancia

Aplic. de la normal: Estimación en muestras Como ilustración mostramos una variable que presenta valores distribuidos de forma muy asimétrica. Claramente no normal. Saquemos muestras de diferentes tamaños, y usemos la media de cada muestra para estimar la media de la población.

Aplic. de la normal: Estimación en muestras Cada muestra ofrece un resultado diferente: La media muestral es variable aleatoria. Su distribución es más parecida a la normal que la original. También está menos dispersa. A su dispersión (‘desv. típica del estimador media muestral’… ¿os gusta el nombre largo?) se le suele denominar error típico.

Aplic. de la normal: Estimación en muestras Al aumentar el tamaño, n, de la muestra: La normalidad de las estimaciones mejora El error típico disminuye.

Aplic. de la normal: Estimación en muestras Puedo ‘garantizar’ medias muestrales tan cercanas como quiera a la verdadera media, sin más que tomar ‘n bastante grande’ Se utiliza esta propiedad para dimensionar el tamaño de una muestra antes de empezar una investigación.

No hay evidencia en contra El valor medio de BUA en mujeres jóvenes es de 85. ¿Las mujeres de las que se ha extraído la muestra, tienen una BUA similar? Dar respuesta con confianza del 95% Tamaño de la muestra Media Error estándar Respuesta 10 mujeres 77 6 No hay evidencia en contra 100 mujeres 71 1.6 No 1000 mujeres 73 0.5

Contrastando una hipótesis Son demasiados... No se si los fumadores pesarán como el resto… unos 70Kg (hipótesis nula)... ¡Gran diferencia! Rechazo la hipótesis Muestra aleatoria de fumadores

Creo que el porcentaje de enfermos será el 5% ¿Qué es una hipótesis? Creo que el porcentaje de enfermos será el 5% Una creencia sobre la población, principalmente sus parámetros: Media Varianza Proporción/Tasa OJO: Si queremos contrastarla, debe establecerse antes del análisis.

Introducción breve: ¿Los fumadores pesan más? En la población de no fumadores, el peso medio es 70 kg. ¿Cómo podríamos ‘demostrar’ si los fumadores pesan más… ... unos 5 kg más? 70 75 Veamos qué puede ocurrir si tomamos muestras de tamaño 4 y calculamos el peso medio… para cada caso.

Decidir si los fumadores pesan más: Tamaño muestral ¿Qué puede ocurrir si tomamos muestras de tamaño 30 y calculamos el peso medio? 70 75

Decidir si los fumadores pesan más: Tipos de error Tomemos la decisión basándonos en muestras de tamaño 4... Puedo cometer 2 tipos de error. Error de tipo II Se acepta que sí hay diferencias Se acepta que no hay diferencias 70 75 Error de tipo I

Razonamiento básico Si supongo que H0 es cierta... ¿qué hace un científico cuando su teoría no coincide con sus predicciones? ... el resultado del experimento sería improbable. Sin embargo ocurrió.

Razonamiento básico Si supongo que H0 es cierta... Rechazo que H0 sea cierta. ... el resultado del experimento sería improbable. Sin embargo ocurrió.

Razonamiento básico Si supongo que H0 es cierta... No hay evidencia contra H0 No se rechaza H0 El experimento no es concluyente El contraste no es significativo ¿Si una teoría hace predicciones con éxito, queda probado que es cierta? ... el resultado del experimento es coherente.

Significación: p a H0: m=70

Significación: p No se rechaza H0: m=70 a H0: m=70

P P Significación: p a a No se rechaza H0: m=70 Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida. p es conocido después de realizar el experimento aleatorio El contraste es no significativo cuando p>a P a No se rechaza H0: m=70 P a

Significación : p Se rechaza H0: m=70 Se acepta H1: m>70 a

Significación : p El contraste es estadísticamente significativo cuando p<a Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori. a P Se rechaza H0: m=40 Se acepta H1: m>40 a P

Resumen: a, p y criterio de rechazo Sobre a Es número pequeño, preelegido al diseñar el experimento Conocido a sabemos todo sobre la región crítica Sobre p Es conocido tras realizar el experimento Conocido p sabemos todo sobre el resultado del experimento Sobre el criterio de rechazo Contraste significativo = p menor que a

Resumen: a, p y criterio de rechazo Sobre el criterio de rechazo Contraste significativo = p menor que a

Hipótesis nula y alternativa Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito Los datos pueden refutarla La que se acepta si las pruebas no indican lo contrario H0: Hipótesis nula Es inocente No hay diferencias entre grupos H1: Hipótesis alternativa Es culpable Sí hay diferencias entre grupos No debería ser aceptada sin una gran evidencia a favor.

Contrastes de hipótesis clásicos Pruebas para comparar dos grupos Un grupo de individuos recibirá un tratamiento. Otro grupo ‘comparable’ recibirá un placebo. ¿Los resultados son similares? ¿Cómo medimos el resultado? Numéricamente prueba t-student Si/No, Sana/Enferma, … Prueba chi-cuadrado

Problema: Clasificación: ¿Las diferencias numéricas obtenidas al comparar dos tratamientos (o dos poblaciones) son lo suficientemente grandes como para que su única causa sea atribuible al azar? Clasificación: Muestras independientes Muestras apareadas/relacionadas

Muestras relacionadas (apareadas) Cómo: Observamos al mismo individuo dos veces (antes/después,…) O bien, hacemos parejas de individuos “parecidos”… Cuándo: Cuando hay fuentes de variabilidad que pueden tener un efecto grande con respecto a lo que medimos.

Contrastes con muestras relacionadas Hipótesis Nula: No hay diferencias entre las parejas de observaciones Se rechazará cuando la muestra discrepe. (p es pequeño) Hay diferentes aproximaciones: Paramétrica (T- Student) No puede aplicarse así como así… No paramétrica (Wilcoxon) Se puede aplicar siempre.

Ejemplo: Comparar la producción de maiz de dos tipos de semillas. Las semillas influirán, pero posiblemente poco con respecto a otras variables: Sol, viento, terreno,… Idea: Probar los dos tipos de semillas en “idénticas” condiciones.

Ejemplo: Semillas

Muestras independientes Problema: ¿La ingesta de calcio reduce la presión sanguínea? Esquema de estrategia: Elegimos 2 muestras de individuos (independientes) Unos toman dosis fija de calcio. Otros no. Experimental/Placebo Alguna diferencia habrá en los resultados… ¿Se deben al azar? Elección de un contraste y cálculo de significación.

Muestras independientes Hipótesis Nula: No hay diferencias entre los resultados de ambos grupos. Al igual que antes… sigue habiendo diferentes aproximaciones: Paramétrica (T- Student) No puede aplicarse así como así… No paramétrica (Wilcoxon, Mann-Whitney) Se puede aplicar siempre.

Muestras independientes: Ejemplo Se cree que la ingesta de calcio reduce la presión sanguínea. Para contrastarlo se decidió elegir 2 muestras independientes: Casos: A 10 individuos, se les asignó un tratamiento consistente en un suplemento de calcio durante 3 meses y se observó la diferencia producida en la presión arterial la que había “antes” menos la que había “después” Controles: A los 11 individuos restantes se les suministró un placebo y se midió también la diferencia.

… y ahora la inferencia…

Sobre las condiciones de validez (paramétrica) Igualdad en la dispersión en cada muestra es algo a tener en cuenta. No es un problema para dos muestras, !pero sí para casos más complicados! Normalidad en cada muestra: Kolmogorov -Smirnov

Condición de normalidad

Una variable numérica y varios grupos Problema: ¿Las diferencias numéricas obtenidas al comparar dos, tres o más tratamientos (o poblaciones) son lo suficientemente grandes como para que su única causa sea atribuible al azar? Observar que generaliza lo anterior. A la variable numérica que observamos se la suele llamar dependiente. A la variable que clasifica a los individuos en diferentes grupos se la llama factor (o variable independiente). A sus modalidades se les llama niveles del factor.

Muestras independientes Hipótesis Nula: No hay diferencias entre los niveles del factor. Aproximaciones: Paramétricas: ANOVA de un factor Es el caso más simple de toda una familia de técnicas muy poderosas. No paramétricas: Kruskal-Wallis.

Muestras independientes Problema: ¿La ingesta de calcio reduce la presión sanguínea? Esquema de estrategia: Elegimos 2 muestras de individuos (independientes) Unos toman dosis fija de calcio. Otros no. Control/Placebo Alguna diferencia habrá en los resultados… ¿Se deben al azar? Elección de un contraste y cálculo de significación.

Muestras independientes: Ejemplo Ejemplo: Se realizó un experimento para comparar tres métodos de aprendizaje de lectura. Se asignó aleatoriamente los estudiantes a cada uno de los tres métodos. Los métodos de lectura son el factor (lo que explicará los resultados). Cada método fue probado con 22 estudiantes (experimento equilibrado). Cada método es uno de los niveles del factor Se evaluó mediante diferentes pruebas la capacidad de comprensión de los estudiantes, antes y después de recibir la instrucción. Variables dependientes (numéricas).

¿Problemas de diseño? Los individuos fueron asignados al azar a cada grupo… ¿Se repartieron bien? ¿Tenían la misma puntuación “antes”? No se encuentra evidencia en contra (p=0,436)

Sobre las condiciones de validez (paramétrica) Igualdad en la dispersión en cada muestra (Levene) Normalidad de cada muestra.

Y ahora lo interesante… ¿Las tres técnicas de aprendizaje producen el mismo efecto?

Análisis a posteriori de un ANOVA significativo Comparaciones planeadas Hay que ser honestos Comparaciones no planeadas (post-hoc) Muy conservadoras Para que las diferencias sean significativas, tienen que serlo muuuucho.

Versión no paramétrica (Kruskal Wallis) No requerimos ninguna condición que sea de comprobación difícil.