La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Prueba de Hipótesis Subtítulo

Presentaciones similares


Presentación del tema: "Prueba de Hipótesis Subtítulo"— Transcripción de la presentación:

1 Prueba de Hipótesis Subtítulo
NOTA: Para cambiar esta imagen, selecciónela y bórrela. Luego use el icono Insertar imagen para reemplazarla por una propia.

2 La estadística inferencial
Una de las aplicaciones de la estadística es extraer inferencias en poblaciones a partir del estudio de muestras. Este proceso recibe el nombre de Estadística Inferencial y sus estudios pretenden deducir (inferir) propiedades o características de una población a partir de una muestra representativa.

3 La estadística inferencial y la prueba de hipótesis
Hipótesis estadística Para realizar el proceso inferencial se suele partir de hipótesis, es decir, de unas suposiciones cuya validez cabe confirmar o rechazar. Prueba de hipótesis es una técnica estadística que se sigue para decidir si rechazamos o no una hipótesis estadística con base en la información de una muestra.

4 lo que es verdad, deberemos buscar lo que es más probable.”
“Es una verdad muy cierta que, cuando no esté a nuestro alcance determinar lo que es verdad, deberemos buscar lo que es más probable.” Descartes, en su Discurso del Método

5 SI NO PASO 1 Formaliza las hipótesis:
Hipótesis nula Vs. Hipótesis alternativa PASO 2 Elige el test adecuado: Paramétrico Vs. No paramétrico PASO 3 Determinar si la prueba de significancia tendrá dos direcciones o una sola PASO 4 Especifica el nivel de significación PASO 5 Calcula el valor del test La probabilidad teórica de obtener las diferencias observadas es menor o igual que el nivel de significación? Aceptar la hipótesis nula: las diferencias observadas se deben simplemente a errores de muestreo Rechaza la hipótesis nula: las diferencias entre los grupos son significativas SI NO

6 Formaliza las hipótesis: Hipótesis nula Vs. Hipótesis alternativa
Paso 1 Formaliza las hipótesis: Hipótesis nula Vs. Hipótesis alternativa

7 Formaliza las hipótesis: Hipótesis nula Vs. Hipótesis alternativa
indica que NO hay diferencias significativas entre dos medias muestrales y afirma que la diferencia entre dos medias muestrales es debida al azar, a la suerte, al error de muestreo Hipótesis de Investigación asume que SI hay diferencias significativas entre dos medias muestrales y que esa diferencia se debe al empleo de un método (medicamento, tratamiento,etc.) que es más efectivo que otro Un contraste de hipótesis estadístico se plantea como una decisión entre dos hipótesis. En estadística, un resultado se denomina estadísticamente significativo cuando no es probable que haya sido debido al azar.

8 El propósito del experimento es decidir si la prueba tiende a apoyar o a refutar la Hipótesis Nula.

9 Veamos un ejemplo El efecto "Mozart vs. Reggaeton” : Se sospecha que los individuos rinden más en un test de inteligencia tras escuchar música de Mozart que cuando han escuchado Reggaeton Hipótesis científica: Escuchar la música de Mozart tiene un efecto sobre el CI diferente al Reggaeton. Experimento: De la población venezolana seleccionamos 20 niños al azar en dos grupos de 10. Un grupo escuchará Mozart antes de hacer el test de CI. El otro escuchará Reggaeton. Después de realizar el test, se calculan las medias en cada uno de los dos grupos.

10 Supongamos que la media del CI del grupo de Mozart fue 110, mientras que la media del grupo de Reggaeton fue de Entonces: ¿Podemos decir que hay diferencias a nivel poblacional entre ambos grupos?. Para tomar tal decisión necesitaremos plantear DOS hipótesis: Hipótesis: Hipótesis nula. Es la que proporciona la solución "más sencilla". En nuestro ejemplo sería que la media de ambos grupos es la misma. (Es decir, que no hay un efecto de la música sobre el CI.) H0: μ1 = μ2 Hipótesis de Investigación. Es la hipótesis complementaria (y "más compleja"). En nuestro caso sería que la media de ambos grupos es diferente. (Es decir, que hay un efecto de la música sobre el CI.) H1: μ1 ≠ μ2

11 Hay cuatro posibilidades:
La pregunta del investigador entonces es:…se acepta o no se acepta la hipótesis nula Hay cuatro posibilidades: La hipótesis nula es cierta y el investigador concluye que lo es…una decisión correcta La hipótesis nula es falsa y el investigador concluye que lo es…una decision correcta La hipótesis nula es cierta pero el investigador concluye que es falsa…una decision incorrecta La hipótesis nula es falsa pero el investigador concluye que es cierta…una decision incorrecta

12 TIPOS DE ERROR Decisiones Aceptar Ho Decisión Correcta Error Tipo II
Aceptar la Hipótesis Nula cuando ha debido rechazarse)) (β) Rechazar Ho Error Tipo I (α) Un falso positivo. Rechazar la Ho (H. Nula) cuando ha debido Aceptarse Verdadera Falsa Decisiones

13 Ho: El sujeto es inocente
Hi: el sujeto es culpable

14 Obviamente interesa minimizar ambos errores, aunque en Estadística se da prioridad al error de tipo I, es decir se intenta evitar los falsos positivos, ya que es mejor dejar libre a un culpable que condenar a un inocente. Reducir ambos errores a cero es imposible y, además, al disminuir uno se aumenta el otro, por lo que hay que elegir bien el test empleado para llegar al mejor balance posible entre el error de tipo I y el error de tipo II. La única manera de disminuir ambos es aumentar el tamaño de muestra.

15 Elige el test adecuado: Paramétrico Vs. No paramétrico
PASO 2 Elige el test adecuado: Paramétrico Vs. No paramétrico

16 Pruebas paramétricas y NO paramétricas
para contrastar la veracidad o falsedad de las hipótesis enunciadas aplicamos unas pruebas estadísticas que se clasifican en pruebas paramétricas y pruebas no paramétricas. Cuál elegir? Pruebas paramétricas Son las mas potentes Requiere que se cumplan una serie de supuestos paramétricos Pruebas NO paramétricas Son las mas potentes Son más flexibles porque NO Requiere que se cumplan una serie de supuestos paramétricos

17 Con respecto a la potencia
Las pruebas paramétricas son más potentes que las NO paramétricas Potencia Error Tipo II 1.0 Si hay un efecto será detectado 0.8 Si hay un efecto será detectado el 80% de las veces 0.5 Si hay un efecto será detectado el 50% de las veces 0.2 Si hay un efecto será detectado el 20% de las veces 0.0 Si hay un efecto nunca será detectado Qué es la potencia es la probabilidad de que la hipótesis nula sea rechazada cuando la hipótesis alternativa es verdadera (es decir, la probabilidad de NO cometer un error del tipo II) Las pruebas paramétricas tienen menos posibilidades de cometer un error tipo II.

18 la potencia de un test estadístico aumenta cuando lo hace el tamaño de la muestra; de esta forma, para conseguir la misma potencia que tiene un prueba paramétrica con una No paramétrica, necesitaremos aumentar el tamaño de la muestra Por ejemplo, la U de Mann-Whitney tiene una potencia relativa del 95% con respecto a la prueba paramétrica t de Student (significa que con una muestra de 100 sujetos, se consigue la misma potencia con la U de Mann-Whitney que con 95 sujetos para la t de Student). U de Mann-Whitney t de Student 100 sujetos 95 sujetos Igual potencia

19 Con respecto a los supuestos paramétricos
Supuestos que subyacen a la utilización de pruebas paramétricas Normalidad La VD debe ser medida en una escala de intervalo o razón Homocedasticidad o igualdad de varianza Una muestra igual o superior a los 30 sujetos

20 Descripción Normalidad La población al estar constituida por un número grande de casos tiende a tener una distribución normal. Como las pruebas paramétricas estiman los parámetros de la población a partir de muestras estadísticas, se parte del supuesto que estas muestras también tienen una distribución normal La VD debe ser medida en una escala de intervalo o razón Los métodos estadísticos paramétricos requieren del empleo de datos medidos en una escala de intervalo o de razón. En estos niveles de medición tienen sentido las operaciones aritméticas como el análisis de medias, desviación estándar y varianzas . Homocedasticidad o igualdad de varianza Las varianzas de la variable dependiente en los grupos que se comparan deben ser aproximadamente iguales. Existen varias pruebas que permiten comprobar la igualdad de varianzas, una de las más conocidas es la prueba de Levene Una muestra igual o superior a los 30 sujetos Dado que las pruebas paramétricas realizan estimación de parámetros de la población a partir de muestras estadísticas, es lógico pensar que cuanto más grande sea la muestra, más exacta será la estimación; en cambio, cuanto más pequeña, más distorsionada será la media de las muestras por los valores raros extremos.

21 Criterio paramétrico: Normalidad
distribución normal o distribución de Gauss o es la distribuciones de probabilidad de variable continua que con más frecuencia aparece aproximada en fenómenos reales. La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos.  La población de cualquier fenómeno, al estar constituida por un número grande de casos tiende a tener una distribución normal. Una observación es NORMAL cuando su comportamiento es Frecuente de acuerdo con un modelo matemático teórico que diferencia lo Frecuente de lo Raro

22 Como las pruebas paramétricas estiman los parámetros de la población a partir de muestras estadísticas, se parte del supuesto que estas muestras también tienen una distribución normal a partir de la cual se hará una estimación adecuada Sin embargo, algunos autores han señalado que en ocasiones en el campo de las ciencias sociales puede resultar poco frecuente encontrar variables que se ajusten a este tipo de comportamiento. Debido a esto es preciso comprobar si la distribución de nuestro estudio sigue esta estructura teórica. Una de las pruebas más usada para verificarlo es la prueba de Kolmogorov Smirnov

23 Criterio paramétrico: La VD debe ser medida en una escala de intervalo o razón
ordinal Nominal Pruebas paramétricas Pruebas NO paramétricas Mas cuantitativas Mas cualitativas Los métodos estadísticos paramétricos requieren del empleo de datos medidos en una escala de intervalo o de razón. En estos niveles de medición tienen sentido las operaciones aritméticas como el análisis de medias, desviación estándar y varianzas .

24 Criterio paramétrico: Homocedasticidad
La homocedasticidad o igualdad de la varianza, significa que todos los grupos a analizar poseen la misma varianza El dibujo de caja y bigote nos muestra “la media” en la línea central, el limite inferior es el Q1 y el límite superior es el Q3 y de esta forma se abarca el 95% de los casos Cuando compramos 2 grupos y proyectamos la línea media de un grupo sobre el otro y esta proyección cae dentro de la caja, concluimos que los dos grupos son iguales. Pero si la proyección de la línea media de un grupo sobre el otro cae fuera de la caja, entonces los grupos son diferentes. Por supuesto estos grupos tienen que tener una distribución normal. Las cajas tienen que tener las cajas del mismo tamaño (la misma varianza)

25 Si las varianzas son distintas (aunque se mantenga la simetría para el grupo comparativo) , ya no podemos usar el principio de proyectar la línea media de un grupo hacia otro para observar si cae dentro o fuera de la caja y así decidir si son iguales o distintos, puesto que ya las proyecciones NO son equivalentes Para poder comparar grupos, la variabilidad tiene que ser equivalente

26 Criterio paramétrico: N > 30
Dado que las pruebas paramétricas realizan estimación de parámetros de la población a partir de muestras estadísticas, es lógico pensar que cuanto más grande sea la muestra, más exacta será la estimación; en cambio, cuanto más pequeña, más distorsionada será la media de las muestras por los valores raros extremos.

27 Pruebas estadísticas que se aplican
Número de muestrass Pruebas estadísticas que se aplican Pruebas Paramétricas Pruebas No Paramétricas Una muestra Prueba t de Student para una muestra nominal X2 ordinal Z de Kolmogorov-Smirnov Dos muestras Indep. T de Student para muestras independientes Fisher Mediana y U de Mann Whitney Relac. T de Student para muestras relacionadas Nominal Mc Nemar Signos y Wilcoxon Más de dos muestras ANOVA 1 VI: ANOVA de 1 factor Chi Cuadrado 2 VI: ANOVA factorial Ordinal kruskal Wallis ANOVA de una via (intragrupos) Q de Cochran Friedman Tipo de prueba a elegir depende de Número de muestras una dos Más de dos Cumplimiento de Supuestos Paramétricos SI Use prueba paramétrica NO Use prueba NO paramétrica

28 PASO 3 Determinar si la prueba de significancia tendrá dos direcciones o una sola

29 Si la hipótesis alternativa se formula simplemente como “la hipótesis nula no es cierta”, el contraste es bilateral o de dos colas. Por el contrario cuando se indica el sentido de la diferencia, el contraste es unilateral o de una sola cola

30 Contraste de dos colas Una prueba es de dos colas cuando no se establece una dirección específica de la hipótesis de investigación : H0: el ingreso medio de las mujeres es igual al ingreso medio de los hombres. H1 : el ingreso medio de las mujeres no es igual al ingreso medio de los hombres. - /2= 0.025 área de rechazo de Ho Área de no rechazo de Ho Z t F x2 Estadísticos de prueba /2= 0.025 área de rechazo de Ho prueba de dos colas, nivel de significancia de 0.05

31 Contraste de una cola Significación
Una prueba es de una cola cuando la hipótesis de investigación establece una dirección, como: H0 : el ingreso medio de las mujeres es igual al ingreso medio de los hombres. H1 : el ingreso medio de las mujeres es mayor que el de los hombres. = 0.05 área de rechazo de Ho Z t F x2 Significación Estadísticos de prueba Area de no rechazo de Ho prueba de una cola, nivel de significancia de .05

32 Especifica el nivel de significación
Paso 4 Especifica el nivel de significación

33 El nivel de significación de un test es un concepto estadístico asociado a la verificación de una hipótesis. En pocas palabras, se define como la probabilidad de tomar la decisión de rechazar la hipótesis nula (H0) cuando ésta es verdadera. Esta probabilidad (denotada como α) se suele especificar antes de tomar la muestra, de manera que los resultados obtenidos no influyan en la decisión

34 Los valores más comunes de significancia son de 0. 05, 0. 01, 0
Los valores más comunes de significancia son de 0.05, 0.01, 0.001, estos valores dependen de la rigurosidad que establezca el investigador para su análisis. Probabilidad del 95% 1-α = 0.95 α = 0.05 del 90% 1-α = 0.90 α = 0.10 del 99% 1-α = 0.99 α = 0.01

35 Cuando se define un a: 0.05 se está diciendo que se está dispuesto a cometer el error tipo I como máximo el 5% de las veces; o sea que de cada 100 veces que a partir de los datos se concluya a favor de la hipótesis alterna, se tolera equivocarse como máximo, en cinco de esas 100 veces.  p < A≠B p ≥ A = B Se rechaza la hipótesis nula Se acepta la hipótesis nula No parece que el azar pueda explicarlo todo No se puede descartar que el azar lo explique todo Hay diferencias estadísticamente significativas NO hay diferencias estadísticamente significativas Existen evidencias a favor de la Hipótesis de investigación No existen evidencias a favor de la Hipótesis de investigación La decisión se toma a menudo utilizando el valor P (o p-valor): si el valor P es inferior al nivel de significación, entonces la hipótesis nula es rechazada. Cuanto mayor sea la p (p > 0,05) más fuerte y segura será la evidencia a favor de la hipótesis nula (igualdad).

36 Calcular el valor del test
Paso 5 Calcular el valor del test

37 Este paso se hará en cada una de las presentaciones al comparar la media de un grupo, de dos grupos y de más de dos grupos. Sin embargo, debemos aclarar algo sobre este paso final en el contraste de hipótesis: Hay 2 maneras de hacer una prueba de hipótesis

38 Método Tradicional Estamos estudiando el efecto del estrés sobre la presión arterial. Nuestra hipótesis es que la presión sistólica media en varones jóvenes estresados es mayor que 18 cm de Hg. Estudiamos una muestra de 36 sujetos y encontramos: 1. Se trata de un contraste sobre medias. La hipótesis nula (lo que queremos rechazar) es: 2. la hipótesis alternativa es un contraste lateral derecho. 3. Fijamos "a priori" el nivel de significación en 0,05 .

39 4. El estadístico para el contraste es
Y la región crítica T > ta Si el contraste hubiera sido lateral izquierdo, la región crítica sería T<t1-a si hubiera sido bilateral T < t1- a/2 o T > t a/2 En este ejemplo t(35)0,05=1,69. 5. Calculamos el valor de t en la muestra no está en la región crítica (no es mayor que 1,69), por tanto no rechazamos H0.

40 Método moderno: usando software
Otra manera equivalente de hacer lo mismo (lo que hacen los paquetes estadísticos) es buscar en las tablas el "valor p" que corresponde a T=0,833, que para 35 g.l. es aproximadamente 0,20. dicho de otra manera la probabilidad de equivocarnos si rechazamos H0 es 0,20, como la frontera se establece en 0, No rechazamos Ho


Descargar ppt "Prueba de Hipótesis Subtítulo"

Presentaciones similares


Anuncios Google