Capítulo III Análisis de varianza.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

DSITRIBUCION T DE STUDENT.
ANOVA DE UN FACTOR.
BUENAS TARDES.
Tema 16: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
Tema 15. Contraste de hipótesis: Planteamiento de las hipótesis
Tema.11. Principales modelos de distribución de probabilidad en Psicología: Variables discretas: binomial y Poisson. Variables continuas: normal, chi.
Comprobación de diferencias entre medias
Chi cuadrada y otras Pruebas no paramétricas
La prueba U DE MANN-WHITNEY
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Estimación por intervalos de confianza.
Prueba de Hipótesis La Prueba t Carlos B. Ruiz-Matuk.
Medidas de Dispersión Estadística E.S.O.
ANOVA Modelo I: Comparación entre medias
COEFICIENTE DE CORRELACIÓN PRODUCTO-MOMENTO DE PEARSON
Potencias de exponente natural mayor que 1
Prueba de hipótesis Equivalencia entre la prueba de hipótesis y los intervalos de confianza Valor de probabilidad Valor de probabilidad unilateral Prueba.
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Clase 5 Hipótesis de diferencias de grupos
Clases 3 Pruebas de Hipótesis
Inferencia Estadística
CHI-CUADRADO Y DISTRIBUCION NORMAL
Clases 4 Pruebas de Hipótesis
ANALISIS DE DATOS CATEGORICOS
UNIVERSIDAD INCA GARCILASO DE LA VEGA
Pronósticos, Series de Tiempo y Regresión
Pronósticos, Series de Tiempo y Regresión
Tema 17: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
Descomposición Factorial Unidad 5
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Estadística 2010 Clase 4 Maestría en Finanzas Universidad del CEMA
Estadística Administrativa II
ESTADISTICA TEMA y 223.
Medidas de Dispersión.
Curso de Bioestadística. ANOVA
Medidas de Variabilidad
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Pruebas No paramétricas
Análisis de variancia Capítulo once OBJETIVOS
Estadística Administrativa II
Ecuaciones Algebraicas
LA ESTADÍSTICA.
Pruebas de hipótesis.
Clase 6 Hipótesis de diferencias de grupos
Estimación Diferencia de dos medias
FACTORIZACION.
Análisis de los Datos Cuantitativos
Capitulo 4 Análisis descriptivo inferencial: comparaciones múltiples
Regresión Lineal Simple
ESTIMACIÓN DE PARÁMETROS
CISO 3155: Capítulo 91 Evaluando los promedios de dos grupos distintos Capítulo 9.
INFERENCIA ESTADÍSTICA
DISEÑOS POR BLOQUES ALEATORIZADOS
(niveles o categorías)
REGRESIÓN LINEAL SIMPLE
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
DISTRIBUCIÓN “t” DE STUDENT
RESUMEN DE LA DISTRIBUCION MUESTRAL PARA LA MEDIA MUESTRAL X INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL  TIPO DE PROBLEMA ESPERANZA Y VARIANZA.
MÁS DE DOS MUESTRAS Procedimientos paramétricos. Pruebas de diferencias entre más de dos muestras *Con cálculos diferentes de SC y gl, según el caso.
PRUEBA DE SIGNIFICANCIA
Estimación estadística
Yulieth ariza Villarreal Estadística II. Historia La distribución de Student fue descrita en 1908 por William Sealy Gosset. Gosset trabajaba en una fábrica.
TAMAÑO DE LA MUESTRA Alvaro Alfredo Bravo Dpto. de Matemáticas y Estadística Universidad de Nariño - Colombia.
Viviana Acosta Estadística II. Que es Es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida.
PRUEBA DE SIGNIFICANCIA
ANALISIS DE VARIANZA.
Evaluando los promedios de grupos distintos UNIDAD 7 1.
Transcripción de la presentación:

Capítulo III Análisis de varianza

Introducción En el capítulo anterior se analizaron únicamente dos grupos, sin embargo, la realidad es usualmente más compleja que eso. Frecuentemente se requiere comparar tres, cuatro, cinco o más muestras de grupos. No es posible emplear la razón t para comparar por pares dichas muestras, ya que implicaría gran trabajo y errores (alpha), por ello existe el ANÁLISIS DE VARIANZA.

La lógica del análisis de varianza Para efectuar dicho análisis se requieren dos conceptos: VARIACIÓN DENTRO DE LOS GRUPOS: Es la distancia entre los puntajes crudos y su media del grupo. VARIACIÓN ENTRE GRUPOS: La distancia entre las medias de los grupos.

La lógica del análisis de varianza Dichas variaciones se pueden relacionar con la prueba de la razón t, así: Este análisis de varianza produce una razón F, cuyo numerador indica la variación entre los grupos, y cuyo denominador representa la variación dentro de los grupos. Variación entre grupos Variación dentro de los grupos

La sumas de cuadrados Este concepto se empleó al obtener la desviación estándar, cuando se elevaron al cuadrado las desviaciones de la media de una distribución. Dicho procedimiento eliminaba de manera matemática sólida, los signos negativos que pudieran existir. Existen distintas sumas de cuadrados: SCTotal: Suma de cuadrados total. SCent: Suma de cuadrados entre grupos. SCdentro: Suma de cuadrados dentro de los grupos.

La suma de cuadrados dentro de los grupos (SCdentro) Por fórmula: Donde: X=Un puntaje de desviación (X-X) APLICANDO LA FÓRMULA PARA LOS SIGUIENTES DATOS: X1= 1,2,1,2 X2= 1,3,2,2

La suma de cuadrados dentro de los grupos (SCdentro) CONSERVADORES (N=4) MODERADOS (N=4) X1 X=X-X X2 1 -0.50 0.25 -1.00 2 0.50 3 1.00

La suma de cuadrados dentro de los grupos (SCdentro) LIBERALES (N=4) RADICALES (N=4) X3 X=X-X X2 X4 1 -0.75 0.56 3 1.25 1.56 2 0.25 0.06 -0.25

La suma de cuadrados entre los grupos (SCent) La suma de cuadrados entre los grupos representa la suma de las desviaciones de cada media muestral de la media total elevadas al cuadrado. Por fórmula: Donde: X=cualquier media muestral Xtotal= la media total (la media de los puntajes crudos de la totalidad de las muestras combinadas) N=el número de puntajes de cualquier muestra SCent=la suma de cuadrados entre los grupos.

La suma de cuadrados entre los grupos (SCent) (1.75-1.75)2 4 + (1.75-1.75) 2 4 SCent= (-0.25)2 4 + (0.25) 2 4 + (0)2 4 + (0) 2 4 SCent= (0.06)4 + (0.06)4 + (0)4 + (0)4 SCent= 0.24+ 0.24 SCent= 0.48

La suma total de cuadrados (SCtotal) La suma total de cuadrados es igual a la combinación de sus componentes dentro y entre los grupos. Por fórmula: SCTotal= SCent + SCdentro SCTotal= 0.48 + 6.48 SCTotal= 6.96

La suma total de cuadrados (SCtotal) También se puede hallar con la fórmula: Donde: X=un puntaje crudo en cualquier muestra. Xtotal= la media total (la media de todos los puntajes crudos de todas las muestras combinadas). SCTotal=la suma total de cuadrados. Se suman todas las desviaciones al cuadrado con respecto de la media total. Ver pág. 71.

Cómo calcular las suma de cuadrados Los procedimientos anteriores son en extremos tardados y difíciles, por ello existen fórmulas más simples para calcular las sumas de cuadrados. Donde: N total=el número total de puntajes de todas las muestras combinadas.

Cómo calcular las suma de cuadrados CONSERVADORES (N=4) MODERADOS (N=4) X1 X2 1 2 4 3 9

Cómo calcular las suma de cuadrados (SCtotal) LIBERALES (N=4) RADICALES (N=4) X3 X2 X4 1 3 9 2 4

La suma de cuadrados entre los grupos (SCent) En nuestro caso: Donde: = A la sumatoria de los puntajes de cada muestra al cuadrado. = A la sumatoria de todos los puntajes al cuadrado. N=el número total de puntajes en cualquier muestra. N total= el número total de puntajes en todas las muestras combinadas.

La suma de cuadrados entre los grupos (SCent) Sustituyendo:

La suma de cuadrados dentro los grupos (SCdentro) Se puede calcular por simple despeje:

La suma de cuadrados dentro los grupos (SCdentro) Solo para verificar en busca de errores:

La media cuadrática La suma de cuadrados tiende a crecer conforme aumenta N, por lo cual, dichas medidas no se pueden considerar “puras”. Por ello, se requiere un medio de control que evite esto. Para eso existe la “media cuadrática”. Por fórmula: Donde: =la media cuadrática entre los grupos. SCent = la suma de cuadrados entre los grupos. glent =los grados de libertad entre los grupos.

La media cuadrática Y también: Donde: = la media cuadrática dentro de los grupos. SCdentro = la suma de cuadrados dentro de los grupos. gldentro = los grados de libertad dentro de los grupos.

La media cuadrática Pero primero hay que obtener los grados de libertad apropiados: Para la media cuadrática entre los grupos: glent= K-1 Donde: K= el número de muestras. Para encontrar la media cuadrática dentro de los grupos. gldentro= N total – K Donde: N total= el número total de puntajes en todas las muestras combinadas. K= el número de muestras.

La media cuadrática Sustituyendo con los datos anteriores: glent= K-1 Para encontrar la media cuadrática dentro de los grupos. gldentro= N total – K gldentro= 16-4 gldentro= 12

La media cuadrática Ahora solo falta obtener las medias cuadráticas:

Razón o cociente F El análisis de varianza produce una razón f que sirve para comparar la variación entre los grupos y dentro de los grupos. Por fórmula: Para los datos vistos: Ahora estamos listos para rechazar o para aceptar la hipótesis nula. (Con la tabla D).

Razón o cociente F La tabla D se interpreta, para el numerador (glent: grados de libertad entre) se indican en la parte superior de la tabla; el denominador (gldentro) se indican al lado izquierdo. Para nuestro caso: glent =3 gldentro =12 Así se encuentra un valor de: 3.49.

Razón o cociente F Así que la razón F de la tabla fue de 3.49. Y la razón F calculada fue de 0.31 Por lo tanto la razón F calculada, debe ser igual o mayor que la de la tabla para rechazar la hipótesis nula; sin embargo, en este caso como fue de solo 0.31, debemos aceptar que no hay diferencias significativas entre los grupos y se acepta la hipótesis nula. PARA EL EJEMPLO COMPLETO. (Ver. Págs. 77-80).

Comparación múltiple de medias Con el fin de averiguar dónde se encuentran exactamente las diferencias significativas entre los grupos, cuando F obtenida, es igual o mayor que la F de la tabla, se emplea una nueva prueba, a saber: la DSH (Honestly significant difference: diferencia honestamente significartiva) de Turkey.

Comparación múltiple de medias Por fórmula: Donde: qa = un valor de la tabla a un nivel de confianza dado para el número máximo de medias que se estén comparando. = la media cuadrática dentro de los grupos. n= el número de entrevistados en cada grupo (debe ser el mismo).

Comparación múltiple de medias Paso 1: Construir una tabla de diferencias entre medias ordenadas. (Ver pág. 77). Paso 2: Encontrar qa en la tabla I. (Primero verificando en la columna los gl, y en los renglones K (el mayor número de medias). (X3 )=97.0 (X2 )=114.4 (X1 )=125.4 (X3 ) - 17.4 28.4 (X2 ) 11.0 (X1 )

Comparación múltiple de medias Paso 3: Encontrar la DSH. Paso 4: Comparar la DSH con la tabla de las diferencias entre medias.

Comparación múltiple de medias Para que se le considere estadísticamente significativa, cualquier diferencia entre medias debe ser igual o mayor que la DSH. Por lo tanto se concluye las diferencias entre X1 y X3; X2 y X3, son estadísticamente significativas; No así entre X1 y X2, que solo es de 11.0, menor que 11,08 obtenido en el paso 3.

Comparación múltiple de medias En tu equipo, analicen el ejemplo y resuelvan un ejercicio asociado (número 5 ó 7). REALICEN LOS PROBLEMAS DE LAS PÁGINAS: 83-85.