Prueba de Hipótesis Subtítulo

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

PRUEBAS DE HIPÓTESIS.
Tema 16: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
Introducción a la Inferencia Estadística
Tema 15. Contraste de hipótesis: Planteamiento de las hipótesis
Estadística Aplicada a Ecología
ESTADISTICA INFERENCIAL
Test de Hipótesis.
PRUEBA DE HIPOTESIS Denominada también prueba de significación, tiene como objetivo principal evaluar suposiciones o afirmaciones acerca de los valores.
Pruebas de hipótesis.
Contraste de Hipótesis
PRUEBA DE HIPOTESIS LUIS FERNANDO TRUJILLO LEYDER JULIAN GOMEZ
Estadística Teórica II
La prueba U DE MANN-WHITNEY
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
PRUEBAS DE HIPOTESIS HIPOTESIS
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
Uso de pruebas estadísticas paramétricas y no paramétricas
Inferencia Estadística
CURSO DE ESTADÍSTICA BÁSICA
Diseño de experimentos
Pruebas de hipótesis Walter Valdivia Miranda
Prueba de hipótesis Equivalencia entre la prueba de hipótesis y los intervalos de confianza Valor de probabilidad Valor de probabilidad unilateral Prueba.
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Clases 3 Pruebas de Hipótesis
Inferencia Estadística
Unidad VI: PRUEBAS DE HIPOTESIS
Diseño Estadístico y Herramientas para la Calidad
Tema 17: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
Tema 7: Introducción a los contrastes de hipótesis
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Fundamentos del contraste de hipótesis
Estadística 2010 Clase 4 Maestría en Finanzas Universidad del CEMA
Estadística aplicada a la educación
Contraste de hipótesis: ¿Qué es una hipótesis estadística?
Tema : Introducción a los contrastes de hipótesis
Unidad V: Estimación de
TEMA 15 * CONTRASTES DE HIPÓTESIS
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Inferencia Estadística
Análisis Cuantitativo de Datos (Básico)
Clase 4a Significancia Estadística y Prueba Z
ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA
Tema: Pruebas de hipótesis
Capítulo 1. Conceptos básicos de la Estadística
INFERENCIA ESTADÍSTICA
Pruebas de hipótesis.
PRUEBAS ESTADISTICAS NO PARAMETRICAS
Pruebas de hipótesis.
Métodos Cuantitativos
Prueba de Hipótesis Subtítulo
Estimación y contraste de hipótesis
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
ESTIMACIÓN DE PARÁMETROS
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
PRUEBA DE HIPÓTESIS DE LA DISTRIBUCIÓN “Z” PARA DOS PROPORCIONES.
Estadística para administradores
Aspectos generales de la investigación educativa en el SNIT
CONTRASTE DE HIPÓTESIS Dimensiones Largo275mm. 169 mm 2 Ancho175mm.49 mm 2 Alto175mm.49 mm 2 Peso16 Kg.1 Kg 2. SITUACIÓN PROBLEMA.
INFERENCIA ESTADÍSTICA
Metodología de la Investigación Cát. I
Pruebas paramétricas y no paramétricas
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
POBLACIÓN Y MUESTRA CÁLCULO DEL TAMAÑO MUESTRAL. Descripción e inferencia Población Muestra Muestreo Inferencia Resultado.
Estadística Inferencial
Bioestadística Inferencia estadística y tamaño de muestra
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
PRUEBA DE SIGNIFICANCIA
Evaluando los promedios de grupos distintos UNIDAD 7 1.
Transcripción de la presentación:

Prueba de Hipótesis Subtítulo NOTA: Para cambiar esta imagen, selecciónela y bórrela. Luego use el icono Insertar imagen para reemplazarla por una propia.

La estadística inferencial Una de las aplicaciones de la estadística es extraer inferencias en poblaciones a partir del estudio de muestras. Este proceso recibe el nombre de Estadística Inferencial y sus estudios pretenden deducir (inferir) propiedades o características de una población a partir de una muestra representativa.

La estadística inferencial y la prueba de hipótesis Hipótesis estadística Para realizar el proceso inferencial se suele partir de hipótesis, es decir, de unas suposiciones cuya validez cabe confirmar o rechazar. Prueba de hipótesis es una técnica estadística que se sigue para decidir si rechazamos o no una hipótesis estadística con base en la información de una muestra.

lo que es verdad, deberemos buscar lo que es más probable.” “Es una verdad muy cierta que, cuando no esté a nuestro alcance determinar lo que es verdad, deberemos buscar lo que es más probable.” Descartes, en su Discurso del Método

SI NO PASO 1 Formaliza las hipótesis: Hipótesis nula Vs. Hipótesis alternativa PASO 2 Elige el test adecuado: Paramétrico Vs. No paramétrico PASO 3 Determinar si la prueba de significancia tendrá dos direcciones o una sola PASO 4 Especifica el nivel de significación PASO 5 Calcula el valor del test La probabilidad teórica de obtener las diferencias observadas es menor o igual que el nivel de significación? Aceptar la hipótesis nula: las diferencias observadas se deben simplemente a errores de muestreo Rechaza la hipótesis nula: las diferencias entre los grupos son significativas SI NO

Formaliza las hipótesis: Hipótesis nula Vs. Hipótesis alternativa Paso 1 Formaliza las hipótesis: Hipótesis nula Vs. Hipótesis alternativa

Formaliza las hipótesis: Hipótesis nula Vs. Hipótesis alternativa indica que NO hay diferencias significativas entre dos medias muestrales y afirma que la diferencia entre dos medias muestrales es debida al azar, a la suerte, al error de muestreo Hipótesis de Investigación asume que SI hay diferencias significativas entre dos medias muestrales y que esa diferencia se debe al empleo de un método (medicamento, tratamiento,etc.) que es más efectivo que otro Un contraste de hipótesis estadístico se plantea como una decisión entre dos hipótesis. En estadística, un resultado se denomina estadísticamente significativo cuando no es probable que haya sido debido al azar.

El propósito del experimento es decidir si la prueba tiende a apoyar o a refutar la Hipótesis Nula.

Veamos un ejemplo El efecto "Mozart vs. Reggaeton” : Se sospecha que los individuos rinden más en un test de inteligencia tras escuchar música de Mozart que cuando han escuchado Reggaeton Hipótesis científica: Escuchar la música de Mozart tiene un efecto sobre el CI diferente al Reggaeton. Experimento: De la población venezolana seleccionamos 20 niños al azar en dos grupos de 10. Un grupo escuchará Mozart antes de hacer el test de CI. El otro escuchará Reggaeton. Después de realizar el test, se calculan las medias en cada uno de los dos grupos.

Supongamos que la media del CI del grupo de Mozart fue 110, mientras que la media del grupo de Reggaeton fue de 102 . Entonces: ¿Podemos decir que hay diferencias a nivel poblacional entre ambos grupos?. Para tomar tal decisión necesitaremos plantear DOS hipótesis: Hipótesis: Hipótesis nula. Es la que proporciona la solución "más sencilla". En nuestro ejemplo sería que la media de ambos grupos es la misma. (Es decir, que no hay un efecto de la música sobre el CI.) H0: μ1 = μ2 Hipótesis de Investigación. Es la hipótesis complementaria (y "más compleja"). En nuestro caso sería que la media de ambos grupos es diferente. (Es decir, que hay un efecto de la música sobre el CI.) H1: μ1 ≠ μ2

Hay cuatro posibilidades: La pregunta del investigador entonces es:…se acepta o no se acepta la hipótesis nula Hay cuatro posibilidades: La hipótesis nula es cierta y el investigador concluye que lo es…una decisión correcta La hipótesis nula es falsa y el investigador concluye que lo es…una decision correcta La hipótesis nula es cierta pero el investigador concluye que es falsa…una decision incorrecta La hipótesis nula es falsa pero el investigador concluye que es cierta…una decision incorrecta

TIPOS DE ERROR Decisiones Aceptar Ho Decisión Correcta Error Tipo II Aceptar la Hipótesis Nula cuando ha debido rechazarse)) (β) Rechazar Ho Error Tipo I (α) Un falso positivo. Rechazar la Ho (H. Nula) cuando ha debido Aceptarse Verdadera Falsa Decisiones

Ho: El sujeto es inocente Hi: el sujeto es culpable

Obviamente interesa minimizar ambos errores, aunque en Estadística se da prioridad al error de tipo I, es decir se intenta evitar los falsos positivos, ya que es mejor dejar libre a un culpable que condenar a un inocente. Reducir ambos errores a cero es imposible y, además, al disminuir uno se aumenta el otro, por lo que hay que elegir bien el test empleado para llegar al mejor balance posible entre el error de tipo I y el error de tipo II. La única manera de disminuir ambos es aumentar el tamaño de muestra.

Elige el test adecuado: Paramétrico Vs. No paramétrico PASO 2 Elige el test adecuado: Paramétrico Vs. No paramétrico

Pruebas paramétricas y NO paramétricas para contrastar la veracidad o falsedad de las hipótesis enunciadas aplicamos unas pruebas estadísticas que se clasifican en pruebas paramétricas y pruebas no paramétricas. Cuál elegir? Pruebas paramétricas Son las mas potentes Requiere que se cumplan una serie de supuestos paramétricos Pruebas NO paramétricas Son las mas potentes Son más flexibles porque NO Requiere que se cumplan una serie de supuestos paramétricos

Con respecto a la potencia Las pruebas paramétricas son más potentes que las NO paramétricas Potencia Error Tipo II 1.0 Si hay un efecto será detectado 0.8 Si hay un efecto será detectado el 80% de las veces 0.5 Si hay un efecto será detectado el 50% de las veces 0.2 Si hay un efecto será detectado el 20% de las veces 0.0 Si hay un efecto nunca será detectado Qué es la potencia es la probabilidad de que la hipótesis nula sea rechazada cuando la hipótesis alternativa es verdadera (es decir, la probabilidad de NO cometer un error del tipo II) Las pruebas paramétricas tienen menos posibilidades de cometer un error tipo II.

la potencia de un test estadístico aumenta cuando lo hace el tamaño de la muestra; de esta forma, para conseguir la misma potencia que tiene un prueba paramétrica con una No paramétrica, necesitaremos aumentar el tamaño de la muestra Por ejemplo, la U de Mann-Whitney tiene una potencia relativa del 95% con respecto a la prueba paramétrica t de Student (significa que con una muestra de 100 sujetos, se consigue la misma potencia con la U de Mann-Whitney que con 95 sujetos para la t de Student). U de Mann-Whitney t de Student 100 sujetos 95 sujetos Igual potencia

Con respecto a los supuestos paramétricos Supuestos que subyacen a la utilización de pruebas paramétricas Normalidad La VD debe ser medida en una escala de intervalo o razón Homocedasticidad o igualdad de varianza Una muestra igual o superior a los 30 sujetos

Descripción Normalidad La población al estar constituida por un número grande de casos tiende a tener una distribución normal. Como las pruebas paramétricas estiman los parámetros de la población a partir de muestras estadísticas, se parte del supuesto que estas muestras también tienen una distribución normal La VD debe ser medida en una escala de intervalo o razón Los métodos estadísticos paramétricos requieren del empleo de datos medidos en una escala de intervalo o de razón. En estos niveles de medición tienen sentido las operaciones aritméticas como el análisis de medias, desviación estándar y varianzas . Homocedasticidad o igualdad de varianza Las varianzas de la variable dependiente en los grupos que se comparan deben ser aproximadamente iguales. Existen varias pruebas que permiten comprobar la igualdad de varianzas, una de las más conocidas es la prueba de Levene Una muestra igual o superior a los 30 sujetos Dado que las pruebas paramétricas realizan estimación de parámetros de la población a partir de muestras estadísticas, es lógico pensar que cuanto más grande sea la muestra, más exacta será la estimación; en cambio, cuanto más pequeña, más distorsionada será la media de las muestras por los valores raros extremos.

Criterio paramétrico: Normalidad distribución normal o distribución de Gauss o es la distribuciones de probabilidad de variable continua que con más frecuencia aparece aproximada en fenómenos reales. La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos.  La población de cualquier fenómeno, al estar constituida por un número grande de casos tiende a tener una distribución normal. Una observación es NORMAL cuando su comportamiento es Frecuente de acuerdo con un modelo matemático teórico que diferencia lo Frecuente de lo Raro

Como las pruebas paramétricas estiman los parámetros de la población a partir de muestras estadísticas, se parte del supuesto que estas muestras también tienen una distribución normal a partir de la cual se hará una estimación adecuada Sin embargo, algunos autores han señalado que en ocasiones en el campo de las ciencias sociales puede resultar poco frecuente encontrar variables que se ajusten a este tipo de comportamiento. Debido a esto es preciso comprobar si la distribución de nuestro estudio sigue esta estructura teórica. Una de las pruebas más usada para verificarlo es la prueba de Kolmogorov Smirnov

Criterio paramétrico: La VD debe ser medida en una escala de intervalo o razón ordinal Nominal Pruebas paramétricas Pruebas NO paramétricas Mas cuantitativas Mas cualitativas Los métodos estadísticos paramétricos requieren del empleo de datos medidos en una escala de intervalo o de razón. En estos niveles de medición tienen sentido las operaciones aritméticas como el análisis de medias, desviación estándar y varianzas .

Criterio paramétrico: Homocedasticidad La homocedasticidad o igualdad de la varianza, significa que todos los grupos a analizar poseen la misma varianza El dibujo de caja y bigote nos muestra “la media” en la línea central, el limite inferior es el Q1 y el límite superior es el Q3 y de esta forma se abarca el 95% de los casos Cuando compramos 2 grupos y proyectamos la línea media de un grupo sobre el otro y esta proyección cae dentro de la caja, concluimos que los dos grupos son iguales. Pero si la proyección de la línea media de un grupo sobre el otro cae fuera de la caja, entonces los grupos son diferentes. Por supuesto estos grupos tienen que tener una distribución normal. Las cajas tienen que tener las cajas del mismo tamaño (la misma varianza)

Si las varianzas son distintas (aunque se mantenga la simetría para el grupo comparativo) , ya no podemos usar el principio de proyectar la línea media de un grupo hacia otro para observar si cae dentro o fuera de la caja y así decidir si son iguales o distintos, puesto que ya las proyecciones NO son equivalentes Para poder comparar grupos, la variabilidad tiene que ser equivalente

Criterio paramétrico: N > 30 Dado que las pruebas paramétricas realizan estimación de parámetros de la población a partir de muestras estadísticas, es lógico pensar que cuanto más grande sea la muestra, más exacta será la estimación; en cambio, cuanto más pequeña, más distorsionada será la media de las muestras por los valores raros extremos.

Pruebas estadísticas que se aplican Número de muestrass Pruebas estadísticas que se aplican Pruebas Paramétricas Pruebas No Paramétricas Una muestra Prueba t de Student para una muestra nominal X2 ordinal Z de Kolmogorov-Smirnov Dos muestras Indep. T de Student para muestras independientes Fisher Mediana y U de Mann Whitney Relac. T de Student para muestras relacionadas Nominal Mc Nemar Signos y Wilcoxon Más de dos muestras ANOVA 1 VI: ANOVA de 1 factor Chi Cuadrado 2 VI: ANOVA factorial Ordinal kruskal Wallis ANOVA de una via (intragrupos) Q de Cochran Friedman Tipo de prueba a elegir depende de Número de muestras una dos Más de dos Cumplimiento de Supuestos Paramétricos SI Use prueba paramétrica NO Use prueba NO paramétrica

PASO 3 Determinar si la prueba de significancia tendrá dos direcciones o una sola

Si la hipótesis alternativa se formula simplemente como “la hipótesis nula no es cierta”, el contraste es bilateral o de dos colas. Por el contrario cuando se indica el sentido de la diferencia, el contraste es unilateral o de una sola cola

Contraste de dos colas Una prueba es de dos colas cuando no se establece una dirección específica de la hipótesis de investigación : H0: el ingreso medio de las mujeres es igual al ingreso medio de los hombres. H1 : el ingreso medio de las mujeres no es igual al ingreso medio de los hombres. - /2= 0.025 área de rechazo de Ho Área de no rechazo de Ho Z t F x2 Estadísticos de prueba /2= 0.025 área de rechazo de Ho prueba de dos colas, nivel de significancia de 0.05

Contraste de una cola Significación Una prueba es de una cola cuando la hipótesis de investigación establece una dirección, como: H0 : el ingreso medio de las mujeres es igual al ingreso medio de los hombres. H1 : el ingreso medio de las mujeres es mayor que el de los hombres. = 0.05 área de rechazo de Ho Z t F x2 Significación Estadísticos de prueba Area de no rechazo de Ho prueba de una cola, nivel de significancia de .05

Especifica el nivel de significación Paso 4 Especifica el nivel de significación

El nivel de significación de un test es un concepto estadístico asociado a la verificación de una hipótesis. En pocas palabras, se define como la probabilidad de tomar la decisión de rechazar la hipótesis nula (H0) cuando ésta es verdadera. Esta probabilidad (denotada como α) se suele especificar antes de tomar la muestra, de manera que los resultados obtenidos no influyan en la decisión

Los valores más comunes de significancia son de 0. 05, 0. 01, 0 Los valores más comunes de significancia son de 0.05, 0.01, 0.001, estos valores dependen de la rigurosidad que establezca el investigador para su análisis. Probabilidad del 95% 1-α = 0.95 α = 0.05 del 90% 1-α = 0.90 α = 0.10 del 99% 1-α = 0.99 α = 0.01

Cuando se define un a: 0.05 se está diciendo que se está dispuesto a cometer el error tipo I como máximo el 5% de las veces; o sea que de cada 100 veces que a partir de los datos se concluya a favor de la hipótesis alterna, se tolera equivocarse como máximo, en cinco de esas 100 veces.  p < 0.05 A≠B p ≥ 0.05 A = B Se rechaza la hipótesis nula Se acepta la hipótesis nula No parece que el azar pueda explicarlo todo No se puede descartar que el azar lo explique todo Hay diferencias estadísticamente significativas NO hay diferencias estadísticamente significativas Existen evidencias a favor de la Hipótesis de investigación No existen evidencias a favor de la Hipótesis de investigación La decisión se toma a menudo utilizando el valor P (o p-valor): si el valor P es inferior al nivel de significación, entonces la hipótesis nula es rechazada. Cuanto mayor sea la p (p > 0,05) más fuerte y segura será la evidencia a favor de la hipótesis nula (igualdad).

Calcular el valor del test Paso 5 Calcular el valor del test

Este paso se hará en cada una de las presentaciones al comparar la media de un grupo, de dos grupos y de más de dos grupos. Sin embargo, debemos aclarar algo sobre este paso final en el contraste de hipótesis: Hay 2 maneras de hacer una prueba de hipótesis

Método Tradicional Estamos estudiando el efecto del estrés sobre la presión arterial. Nuestra hipótesis es que la presión sistólica media en varones jóvenes estresados es mayor que 18 cm de Hg. Estudiamos una muestra de 36 sujetos y encontramos: 1. Se trata de un contraste sobre medias. La hipótesis nula (lo que queremos rechazar) es: 2. la hipótesis alternativa es un contraste lateral derecho. 3. Fijamos "a priori" el nivel de significación en 0,05 .

4. El estadístico para el contraste es Y la región crítica T > ta Si el contraste hubiera sido lateral izquierdo, la región crítica sería T<t1-a   si hubiera sido bilateral T < t1- a/2 o T > t a/2 En este ejemplo t(35)0,05=1,69. 5. Calculamos el valor de t en la muestra no está en la región crítica (no es mayor que 1,69), por tanto no rechazamos H0.

Método moderno: usando software Otra manera equivalente de hacer lo mismo (lo que hacen los paquetes estadísticos) es buscar en las tablas el "valor p" que corresponde a T=0,833, que para 35 g.l. es aproximadamente 0,20. dicho de otra manera la probabilidad de equivocarnos si rechazamos H0 es 0,20, como la frontera se establece en 0,05 No rechazamos Ho