La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

CO-2124 Análisis de Varianza con Un Criterio de Clasificación En clases anteriores se deseaba determinar si existían diferencias entre las medias de dos.

Presentaciones similares


Presentación del tema: "CO-2124 Análisis de Varianza con Un Criterio de Clasificación En clases anteriores se deseaba determinar si existían diferencias entre las medias de dos."— Transcripción de la presentación:

1 CO-2124 Análisis de Varianza con Un Criterio de Clasificación En clases anteriores se deseaba determinar si existían diferencias entre las medias de dos conjuntos de datos, en el ANÁLISIS DE VARIANZA se considera como una generalización de esa idea. Si se tiene un “FACTOR” se desea determinar si es influyente. y 11 y 12... y k1 y 12 y 22... y k2 y 1n1 y 1n2... y knk Se desea saber si hay diferencias entre los grupos. El modelo para el análisis es: y ij =  i +  ij i = 1,...,k; j = 1,..., n i. Se supone que los errores tienen distribución normal con media cero, varianza común  2 y son independientes.  ~N(0,  2 I)

2 CO-2124 Análisis de Varianza con Un Criterio de Clasificación Para determinar si existen diferencia entre los grupos, puede probarse la hipótesis: Ho:  1 =  2 =... =  k vs. H1: algún  i distinto Esta prueba equivale a comparar los modelos Modelo 1 y ij =  +  ij Modelo 2 y ij =  i +  ij Los modelos están anidados, y la comparación se realiza a través de la tabla de análisis de varianza correspondiente a la prueba de significancia del modelo. Se rechaza Ho si F > F k-1,N-k

3 CO-2124 Análisis de Varianza con Un Criterio de Clasificación Ejemplo: Un ingeniero que desarrolla productos está interesado en maximizar la resistencia a la tensión de una nueva fibra sintética que se empleará en la manufactura de tela para camisas de hombre. La resistencia es influida por el porcentaje de algodón presente en la fibra. El ingeniero decide probar muestras a cinco niveles de porcentaje de algodón: 15,20,25,30,35%. Los resultados son los siguientes: porcentaje = (15, 15, 15, 15, 20, 20, 20, 20, 20, 20, 25, 25, 25, 25, 25, 30, 30, 30, 35, 35, 35, 35, 35, 35, 35) contenido = (3, 3, 5, 2, 9, 12, 17,12, 18, 18, 14, 18, 18, 19, 19, 19, 25, 22, 19, 23, 7, 10, 11, 15, 11) Una herramienta para conocer la resistencia para cada nivel de algodón el a través del diagrama de caja. Para ello utilizamos la instrucción: Stat>ANOVA>One- way... Como variable respuesta se coloca el contenido o resistencia y en el factor el porcentaje de algodón utilizado. Adicional, se pide el gráfico de caja para visualizar si existen diferencia por cada nivel del factor. Los resultado son los siguientes:

4 CO-2124 Análisis de Varianza con Un Criterio de Clasificación Current worksheet: Worksheet 1 One-way Analysis of Variance Analysis of Variance for contenid Source DF SS MS F P porcenta 4 720,2 180,1 11,90 0,000 Error 20 302,7 15,1 Total 24 1023,0 Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --+---------+---------+---------+---- 15 4 3,250 1,258 (----*----) 20 6 14,333 3,830 (---*---) 25 5 17,600 2,074 (----*----) 30 3 22,000 3,000 (-----*----) 35 7 13,714 5,619 (---*---) --+---------+---------+---------+---- Pooled StDev = 3,890 0,0 8,0 16,0 24,0

5 CO-2124 Análisis de Varianza con Un Criterio de Clasificación A partir de los resultados de la tabla de Análisis de varianza, existen diferencias entre el nivel de algodón presente en la fibra y la resistencia. Frecuentemente se emplea la siguiente reparametrización: y ij =  +  i +  ij i = 1,...,k; j = 1,..., n i. Este modelo es equivalente al anterior (  i =  +  i ), tiene un parámetro adicional, y las ecuaciones normales correspondientes a esta reparametrización van a tener infinitas soluciones (los parámetros del modelo no son identificables). Para resolver este problema, es necesario imponer una restricción sobre los  i. Algunos de los más usados son: La suma de los n i  i son iguales a cero. Los  i representan las desviaciones de la media de cada grupo con respecto de la media general.  1 = 0  i i = 2,..., k representan las desviaciones respecto al primer grupo. Por defecto MINITAB utiliza la condición de que  1 = 0.

6 CO-2124 Análisis de Varianza con Un Criterio de Clasificación Los coeficientes del modelo, los genera MINITAB al realizar el análisis de varianza: (Intercept) porcentaje20 porcentaje25 porcentaje30 porcentaje35 3.25000 11.08333 14.35000 18.75000 10.46429 Por defecto, MINITAB toma la restricción  1 = 0. Si se rechaza Ho:  1 =  2 =... =  k las hipótesis de interés son: Ho :  i =  j vs H1:  i   j Para identificar cuáles promedios son diferentes utilizamos la Mínima Diferencia Significativa. Para ello se utiliza en la la instrucción para la tabla ANOVA la herramienta comparaciones:

7 CO-2124 Análisis de Varianza con Un Criterio de Clasificación Fisher's pairwise comparisons Family error rate = 0,264 Individual error rate = 0,0500 Critical value = 2,086 Intervals for (column level mean) - (row level mean) 15 20 25 30 20 -16,322 -5,845 25 -19,794 -8,181 -8,906 1,647 30 -24,948 -13,405 -10,327 -12,552 -1,928 1,527 35 -15,551 -3,896 -0,866 2,686 -5,378 5,134 8,638 13,886

8 Al igual que cualquier modelo, es necesario analizar los residuos para verificar que cumple con las hipótesis. De nuevo utilizamos los gráficos de residuos como en el caso de regresión. Ya que el modelo es desbalanceado, es decir, cada tratamiento difiere del número de observaciones y la varianza no es constante (forma de embudo) se realiza una transformación de las observaciones para tratar de resolver el posible problema de heterocedasticidad. CO-2124 Análisis de Varianza con Un Criterio de Clasificación

9 CO-2124 Análisis de Varianza con Un Criterio de Clasificación Suposición e Normalidad Suposición de Independencia de los residuos Si se conoce el orden en que se recopilaron los datos se puede utilizar para detectar alguna correlación entre ellos. Si esto ocurre la suposición de independencia ha sido violada.

10 CO-2124 Análisis de Varianza Estabilizar la Varianza Cuando los residuos no presentan estabilidad en la varianza puede ser debido a que son muy pocas observaciones por nivel o que realmente las varianzas no son constantes (Heterocedasticidad). En presencia de inestabilidad de varianza utilizamos la transformación: Log(  ) = log  +  log(  ) Deben existir réplicas para cada nivel, de lo contrario no se podría determinar la transformación por este método. Para ello determinamos los promedios y desviaciones para cada nivel, en nuestro caso tomamos la información de la tabla ANOVA:: Current worksheet: Worksheet 1 One-way Analysis of Variance Analysis of Variance for contenid Source DF SS MS F P porcenta 4 720,2 180,1 11,90 0,000 Error 20 302,7 15,1 Total 24 1023,0 Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --+---------+---------+---------+---- 15 4 3,250 1,258 (----*----) 20 6 14,333 3,830 (---*---) 25 5 17,600 2,074 (----*----) 30 3 22,000 3,000 (-----*----) 35 7 13,714 5,619 (---*---) --+---------+---------+---------+---- Pooled StDev = 3,890 0,0 8,0 16,0 24,0

11 CO-2124 Análisis de Varianza con Un Criterio de Clasificación Se estima una recta de regresión con estos datos: mediadesviacion log(des) log(media) 3,25 1,25831 0,22977 1,17865 14,33 3,82971 1,34279 2,66236 17,60 2,07364 0,72931 2,86790 22,00 3,00000 1,09861 3,09104 13,71 5,61885 1,72613 2,61844 Realizamos la estimación del modelo de regresión con el modelo planteado: Stat >Regression >Regression... La variable predictora es log de los promedios y la respuesta log de las desviaciones, el resultado es el siguiente: Regression Analysis The regression equation is log(des) = - 0,200 + 0,494 log(media) Predictor Coef StDev T P Constant -0,2005 0,8626 -0,23 0,831 log(medi 0,4935 0,3352 1,47 0,237 S = 0,5050 R-Sq = 42,0% R-Sq(adj) = 22,6% El coeficiente del logaritmo de las medias para cada nivel es:  = 0.4935  0.5 La transformación que le corresponde a las observaciones es: = 1 -  = 1 - 0.5 = 0.5 Luego, la transformación para los datos es la raíz cuadrada.

12 CO-2124 Análisis de Varianza con Un Criterio de Clasificación Calc > Calculator...> resultado: raiz(contenido) expresion: sqrt(contenido) Una vez aplicad ala transformación a la variable Contenido, se estima nuevamente el modelo inicial para analizar si el problema de los residuos se modificó. La transformación no modificó los residuos, esto indica que la variabilidad en la varianza se debe al tamaño de la muestra en cada nivel.


Descargar ppt "CO-2124 Análisis de Varianza con Un Criterio de Clasificación En clases anteriores se deseaba determinar si existían diferencias entre las medias de dos."

Presentaciones similares


Anuncios Google