Tema 3. Análisis de Varianza Estadística Aplicada 2. Tema 3. Análisis de Varianza
Definición Estudio del efecto que distintas situaciones experimentales tienen sobre ciertas respuestas cuantitativas. Todo experimento contiene: Conjetura: Hipótesis original. Experimento: Prueba efectuada para investigar la conjetura. Análisis: Estudio estadístico de los datos obtenidos durante el experimento. Conclusión: Lo que se ha aprendido con la realización del experimento.
Ejemplos Estudiar el efecto de una marca de combustible sobre el desempeño de un motor de automóvil (distancia recorrida por litro de gasolina). Estudiar el efecto de cuatro soluciones azucaradas (glucosa, sacarosa, fructosa y una mezcla) en el desarrollo bacteriano. Investigar el efecto de la concentración de madera dura en la pulpa sobre la resistencia de las bolsas fabricadas con la pulpa. Determinar si la densidad de color de la tela depende de la cantidad de colorante utilizado.
Definiciones Factores Cualitativos Cuantitativos Factor: Característica que diferencia a los tratamientos (o poblaciones) entre sí. Niveles: Diferentes tratamientos (o poblaciones) Factores Cualitativos Cuantitativos Los niveles corresponden a posibles categorías del factor Los niveles corresponden a diferentes ajustes del factor
Tema 3. Análisis de Varianza Experimentos con un factor
Diseño de experimentos de un factor Deseamos comprobar si la media de cada nivel de factor (cada tratamiento) es igual para todos. Esto es lo mismo que decir que el efecto de cada nivel es nulo. La hipótesis alternativa es que al menos un factor difiere de los demás
Análisis de Varianza La prueba de hipótesis anterior infiere información sobre las medias. El proceso anterior se le conoce como análisis de varianza. El nombre puede resultar engañoso (¿por qué no se llama Análisis de Medias?) pero hay que ver el nombre como la técnica que intenta explicar el origen de las diferencias (varianza) para extraer conclusiones.
Ejemplo con cuatro niveles Los cuatro niveles tienen amplia variabilidad, que podría proceder de la muestra.
Situación inversa
Efecto del tratamiento Modelo estadístico Un modelo lineal para analizar las diferencias sería el siguiente: Otra forma de entender la relación sería i=1,…,nA (alternativas / tratamientos) j=1,…,n (observaciones) Residuo N(0,σ2) Efecto del tratamiento
Representación de las observaciones Las observaciones acostumbran a ordenarse mediante una matriz como la mostrada a posteriori. Es importante identificar la notación y.. ya que se usa extensivamente a lo largo del tema. Observaciones Tratamiento Totales Promedios 1 y 11 12 … 1n . 2 21 22 2n nA nA1 nA2 nAn y.. ..
Experimento con un factor El efecto de los tratamientos corresponde a desviaciones respecto a una media global μ. Por tanto: Y la prueba de hipótesis queda definida por: Para alguna i
Notas Este modelo supone implícitamente que el factor no varía la varianza de la muestra (su único efecto es el cambio del valor medio esperado). El modelo puede plantearse como una regresión múltiple con diversas variables “dummy”. ¿Cómo? El experimento requiere aleatoriedad.
Tipos de experimentos Existen tres tipos principales de experimento cuyas diferencias pueden resultar confusas en ocasiones: Modelo de efectos fijos: Experimentos en el que los niveles (tratamientos) de los factores han sido escogidos a priori, y en los que se intenta extraer conclusiones únicamente de esos niveles.
Tipos de experimentos Modelo de efectos aleatorios: Experimentos en que el número de niveles (tratamientos) es demasiado grande como para considerarse completamente, por lo que los niveles estudiados se escogen aleatoriamente. Posteriormente, se desea extraer conclusiones que sirvan para otros niveles usando la información disponible con los niveles considerados.
Tipos de experimentos Modelo de efectos mixtos: En este caso aparecen factores fijos y factores aleatorios de forma conjunta. Este tipo de problema no será tratado en el presente curso, pero cabe indicar que existe este tipo de modelos.
Ejemplos Modelo de tipo fijo: Se desea estudiar la modernización de la flota de camiones de una empresa y para ello se desea estudiar el efecto en los costes operativos de cuatro alternativas de un fabricante de camiones. Modelo de tipo aleatorio: Se desea estudiar el efecto en los costes operativos de los diferentes tipos de camiones que actualmente componen la flota de la empresa. Modelo de efectos mixtos: En este caso se desea estudiar posibles cambios (efecto aleatorio) en los modelos ofrecidos por el fabricante (efecto fijo).
Tema 3. Análisis de Varianza Un factor. Efectos Fijos
Modelo de efectos fijos En este caso la variabilidad total de los datos puede descomponerse en dos factores como sigue: Variabilidad Total de los Datos Variabilidad Debido al tratamiento (Variabilidad Entre) Variabilidad Inherente de los datos (Variabilidad Dentro)
(variabilidad dentro) Efectos fijos Matemáticamente, el modelo equivale a: Dif. entre tratamientos (variabilidad entre) Error aleatorio (variabilidad dentro) yij i=1,…,nA (alternativas) j=1,…,n (observaciones) Recordemos:
Diferencia Entre Tratamientos Relación de cálculos Observaciones Tratamiento Totales Promedios 1 y 11 12 … 1n . 2 21 22 2n nA nA1 nA2 nAn y.. .. Diferencia Entre Tratamientos Error Aleatorio Caso Regresión:
Estimación de la varianza Puede demostrarse que: Por tanto, si H0 es cierta: Pero si Ha es cierta: Recordemos:
Estimación de la varianza Por tanto, si H0 es cierta: Pero si Ha es cierta: El cuadrado medio de los tratamientos equivale a: Si H0 es falsa, MSTr sobreestima σ2, si no es un estimador insesgado.
Estimación del error aleatorio Podemos demostrar que: Por lo que: Y el error cuadrático medio equivale a: MSE siempre es un estimador insesgado de σ2.
Test de hipótesis nula Considerando a todas las muestras como observaciones procedentes de distribuciones normales, podemos verificar que: Cuando la H0 es cierta, F0 debería ser cercana a 1, mientras que el valor debería de crecer si H0 es falsa.
Test de hipótesis nula El estadístico debe cumplir la siguiente condición: Como F0 se distribuye según una distribución F con ν1=nA-1 y ν2=nA (n-1) grados de libertad, la región de rechazo de la hipótesis nula corresponde a:
Fórmulas de cálculo N: número total de observaciones Muestras con igual tamaño en cada tratamiento Muestras con distinto tamaño en cada tratamiento N: número total de observaciones
Tabla ANOVA Igual número de observaciones por tratamiento: Diferente número de observaciones : Fuente de Variación Grados de Libertad Suma de Cuadrados Cuadrado Medio f Tratamientos nA-1 SSTr MSTr = SSTr / (nA-1) MSTr/ MSE Error nA(n-1) SSE MSE = SSE / [nA(n-1)] Total nAn-1 SST Fuente de Variación Grados de Libertad Suma de Cuadrados Cuadrado Medio f Tratamientos nA-1 SSTr MSTr = SSTr / (nA-1) MSTr/ MSE Error N-nA SSE MSE = SSE / [N-nA] Total N-1 SST
Ejemplo 1 Un fabricante de papel utilizado para fabricar bolsas de caramelo, está interesado en mejorar la resistencia a la tensión del producto medida en [psi] . El grupo de ingeniería del producto piensa que la resistencia a la tensión es una función de la concentración de madera dura en la pulpa El rango de interés práctico de las concentraciones de madera dura está entre 5% y 20%.
Ejemplo 1 Se decide investigar cuatro niveles de concentración de madera dura: 5, 10, 15 y 20%. Se fabrican seis especímenes de prueba para cada nivel de concentración, utilizando una planta piloto. Los 24 especímenes se someten a prueba de tensión en laboratorio, siguiendo un orden aleatorio. Los datos obtenidos aparecen en la siguiente tabla:
Concentración de madera dura (%) Datos y notas Notas: Se sigue un modelo de efectos fijos. Es importante recalcar que las pruebas se han hecho en orden aleatorio. Concentración de madera dura (%) Observaciones 1 2 3 4 5 6 7 8 15 11 9 10 12 17 13 18 19 14 16 20 25 22 23
Cálculos …
Tabla ANOVA Los cálculos ordenados en forma tabular son: En este caso el valor p = P(F3,20 ≥ 19,6) = 3,5910-6 Por lo tanto al menos una de las concentraciones de pulpa de madera permite variación en la resistencia. ¿Podemos determinar qué tratamientos son significativamente distintos? Fuente de Variación Grados de Libertad Suma de Cuadrados Cuadrado Medio f Tratamientos 3 382,79 127,6 19,6 Error 20 130,17 6,51 Total 23 512,96
Métodos de comparación múltiple Alternativas: Método LSD de Fisher: Fácil de calcular Trabaja con la t de student Muy sensible a pequeñas variaciones Confianza individual y no grupal Método de Tuckey Distribución de rango estudentizado Fuerte evidencia para detectar diferencias Confianza grupal Concepto de tasa de error por experimento
Método LSD de Fisher Deseamos encontrar un intervalo de confianza para la diferencia entre dos tratamientos. El estimador puntual es: La varianza es: por tanto:
Método LSD de Fisher Con lo cual tenemos que: y el intervalo de confianza del 100(1-α)% para la diferencia entre las medias de dos tratamientos µi - µj es:
Ejemplo 1 (continuación) Para el ejemplo 1, si comparamos los tratamientos 2 y 3: Las diferencias no son significativas con un α=0,05. Puesto que el “0” se encuentra en el intervalo, existiendo la posibilidad de que: µ3-µ2=0
Múltiples comparaciones El par de medias i - j se considera diferente si: Tamaños de muestra iguales Tamaños de muestra desiguales
Ejemplo 2 Apliquemos el método LSD a los datos del ejemplo 1. nA = 4, n = 6, MSE = 6,51 y además t0,025;20 = 2,086. Las medias de tratamiento son:
Ejemplo 2 Con los datos disponibles podemos obtener el valor de LSD. Por tanto, cualquier par de medias que difiera en más de 3,07 unidades implica que los tratamientos son significativamente distintos. Las comparaciones se detallan en la siguiente transparencia.
Ejemplo 2 Existen diferencias significativas entre todos los pares de medias excepto los pares 2 y 3. Esto implica que el 10 y 15% de concentración son parecidos y el resto diferentes.
Ejemplo 2 Visualmente se puede observar el efecto mostrado por la prueba LSD de Fisher: Pueden verse diferencias significativas las diferentes concentraciones, pero las concentraciones de 10% y 15% son muy parecidas.
Valor crítico de la cola superior de α con m=nA y ν=nAn Método de Tuckey Como se indicó con anterioridad, el método usa una distribución conocida como “Distribución de rango estudentizado”. Al igual que la distribución F, ésta distribución depende de dos parámetros, los grados de libertad del numerador (m) y los del denominador (ν). Por lo tanto, se define como: Valor crítico de la cola superior de α con m=nA y ν=nAn
Método de Tuckey El intervalo de confianza se construye como sigue: Al igual que en el LSD de Fisher, si el intervalo no incluye el 0, las medias difieren significativamente.
Procedimiento Seleccionar α y buscar Determinar W como: Cualquier par de medias que difieran en más que la cantidad definida por W son juzgadas como significativamente diferentes entre sí. Para realizar este último paso, es práctico ordenar las medias muestrales en orden no decreciente.
Ejemplo 3 Se efectuó un experimento para comparar 5 marcas distintas de filtros de aceite automotrices, en relación con su capacidad para capturar materia extraña. Se usó una muestra de nueve filtros de cada marca y se obtuvieron las siguientes cantidades promedio:
Ejemplo 3. Tabla ANOVA Partiendo de la siguiente ANOVA: ¿Los datos indican que la cantidad promedio real de material capturado depende de la marca de los filtros? Utilice un nivel = 0,05. Si es así, use el método de Tuckey para identificar diferencias significativas. Fuente de Variación Grados de Libertad Suma de Cuadrados Cuadrado Medio f Tratamientos 4 13,32 3,33 37,73 Error 40 3,53 0,088 Total 44 16,85
Resolución Inicialmente comprobamos el análisis ANOVA: El parámetro de interés es el efecto de la marca i sobre el material capturado. H0: τ1=τ2=τ3=τ4=τ5=0. Ha: Al menos uno diferente. El estadístico es: a comparar con Se rechaza H0
Resolución Posteriormente se pasa a verificar las diferencias mediante Tuckey. El valor Determinamos W. Al ordenar verificamos que: 13,1 13,3 13,8 14,3 14,5
Procedimiento de Tuckey-Kramer Útil para tamaños muestrales diferentes n1, n2, ..., nnA que son razonablemente cercanos entre sí. Se utilizan promedios entre parejas (es decir 1/ni en vez de 1/n). El nivel de confianza simultáneo es al menos del 100(1-)% (sólo aproximado, no exacto), para tamaños muestrales desiguales.
Ejemplo 4 Un artículo presentó los siguientes datos del módulo de elasticidad, en GPa, obtenidos con un nuevo método ultrasónico, para muestras de cierta aleación producida con tres métodos de colado diferente.
Resolución Inicialmente comprobamos el análisis ANOVA: El parámetro de interés es el efecto del módulo de elasticidad en el promedio del proceso. H0: τ1=τ2=τ3=τ4=0. Ha: Al menos uno diferente. Para obtener el estadístico necesitamos realizar algunos cálculos intermedios:
Resolución El valor p = P(F2, 19 ≥ 12,56) = 0,0003 indica que se debe rechazar H0 a cualquier nivel de significancia. Por lo tanto, el módulo de elasticidad promedio depende de cierta forma del proceso de colado que se utilice.
Resolución Posteriormente se pasa a verificar las diferencias mediante Tuckey-Kramer. n1=8, n2=8, n3=6 y nA=3; N–nA=19 y MSE = 0,316. Por lo tanto, un nivel de confianza simultáneo de aproximadamente 95% requiere:
Resolución En este caso tras ordenar los datos: Se concluye que 1 y 2 no son considerablemente diferentes, sin embargo tanto 1 como 2 parecen diferir en forma significativa de 3. 2. A presión 1. Permanente 3. Yeso 44,06 44,71 45,58
Verificación de las hipótesis del modelo Las hipótesis de partida son: Normalidad (eij ~ N(0, 2)) Homocedasticidad (igualdad de varianzas) La verificación se realiza mediante: Gráficas de probabilidad normal. Gráficas de los ei vs. los niveles del factor. Gráficas de los ei vs. medias de tratamiento observadas
Volviendo al ejemplo 3.1 Los residuos son los siguientes:
Gráfico de probabilidad normal
Gráfico de residuos respecto al factor
Gráfico de residuos respecto respuesta
Tema 3. Análisis de Varianza Un factor. Efectos Aleatorios
Modelo Efectos Aleatorios El factor de interés tiene un número muy grande de niveles posibles. El analista está interesado en obtener conclusiones respecto todos los posibles niveles del factor. Si se selecciona al azar nA de estos niveles de la población de todos los niveles del factor, entonces se dice que el factor es aleatorio. Las conclusiones pueden generalizarse debido a la aleatoriedad.
Variable aleatoria que explica el efecto aleatorio del factor, Efectos aleatorios El modelo lineal es: Variable aleatoria que explica el efecto aleatorio del factor, i ~ N(0,σ2) (Para efectos fijos, se suponía que σ2 = 0 y que el efecto era únicamente en la media) Residuos, ij ~ N(0,σ2)
Consideraciones del modelo Los i son independientes para i = 1…nA, cada uno con varianza σ2 Los εij son independientes para i = 1…nA, y j = 1…n cada uno con σ2 Los i y εij son independientes para cada combinación de i y j La varianza del modelo es: donde cada término del lado derecho es denominado componente de la varianza.
Consideraciones del modelo La hipótesis que las {i } son independientes, implica que la hipótesis usual que: del modelo de efectos fijos no se aplica al modelo de efectos aleatorios. Las hipótesis apropiadas a probar son: Y la descomposición sigue siendo:
Determinación de cuadrados medios En el modelo ANOVA de un solo factor, experimento completamente aleatoriezado, el valor esperado de la media de cuadrados de los tratamientos es: El valor esperado de los cuadrados del error: Y los estimadores de los componentes de la varianza:
Ejemplo 5 Una compañía textil produce en varios telares. Interesa estudiar la la variabilidad de la resistencia a la tensión de un telar a otro. Se seleccionan al azar cuatro telares y se determina la resistencia a la tensión de observaciones aleatorias. Observaciones Telar 1 2 3 4 Totales Promedios 98 97 99 96 391 97,5 91 90 93 92 368 91,5 95 386 95,75 392 1537 95,44
Solución Tabla ANOVA: El valor de F y su p valor permiten concluir que los telares influyen en la resistencia a la tensión de los telares. La varianza estimada es s2 = 1,90 y:
Solución La varianza total es: Por tanto, la mayor parte de la varianza se debe a los telares. El aislamiento de diversas fuentes de aleatoriedad es un tema recurrente en los problemas de control y mejora de la calidad.
Aplicación al control de calidad En el ejemplo anterior, la estimación de los parámetros del proceso son: Suponiendo un límite inferior de resistencia de 90 [psi] Aprox. 3,37% de fallos
Aplicación al control de calidad Si se eliminaran las fuentes de variabilidad causadas por los telares (sτ2=0): En ese caso, la reducción en la variabilidad de la resistencia disminuye en gran medida la degradación del proceso, lo que trae como resultado: Menores costes Mayor calidad Clientes satisfechos Ventaja competitiva
Tema 3. Análisis de Varianza Un factor. Diseño por Bloques
Diseño aleatorio por bloques Técnica que extiende la prueba t para datos emparejados para el caso en que hay más de dos niveles. Los bloques han sido creados por las condiciones y el diseño del experimento. Bloque 1 Bloque 2 Bloque 3 Bloque 4 t1 t2 t3 t1 t2 t3 t1 t2 t3 t1 t2 t3
Ejemplo del concepto “Bloque” Suponga que deseamos comprobar diferentes métodos para cortar una viga. Se opta por probar tres métodos de corte (factores) y se comprobará el resultado en cuatro vigas. Idealmente deberíamos realizar: Tratamiento Bloques (Viga) (Método) 1 2 3 4 A y11 y12 y13 y14 B y21 y22 y23 y24 C y31 y32 y33 y34
Procedimiento general A Grosso Modo, la “dimensión observaciones” se sustituye por la “dimensión bloques”, pero ahora también tienen sentido las diferencias y promedios de los bloques. Bloques Tratamiento 1 2 … nB Totales Promedios y 11 12 1nB . 21 22 2nB nA nA1 nA2 nAnB y. y.. ..
Modelo Lineal El modelo lineal que tiene en cuenta bloques es el siguiente: El modelo asume que: El efcto de tratamientos y bloques es fijo. Los bloques no interactúan. Dentro de cada bloque las unidades son homogéneas frente a otros factores que podrían afectar
Hipótesis de la prueba La hipótesis de la prueba son: Y la suma de cuadrados: De forma resumida: (tratamientos) (bloques)
Fórmulas de cálculo Cuadrados Medios Valores Esperados
Fórmulas de cálculo Por tanto:
Tabla ANOVA Fuente de Variación Grados de Libertad Suma de Cuadrados Cuadrado Medio f Tratamientos nA-1 SSA MSA = SSA / (nA-1) MSA / MSE Bloques nB-1 SSB MSB = SSB / (nB-1) Error (nA-1)(nB-1) SSE MSE = SSE / (nA-1)(nB-1) Total nAnB-1 SST
Ejemplo 3.6 Experimento del efecto de cuatro sustancias químicas sobre la resistencia de una tela. Se escogen cinco muestras de tela y se aplica un diseño completamente aleatorizado por bloques mediante la prueba de cada sustancia en un orden aleatorio sobre cada una de las muestras de tela. En caso de existir efecto por parte de las sustancias químicas sobre la resistencia de las telas, se identificarán aquéllas que provoquen efecto sobre la resistencia, con = 0,01.
Ejemplo 3.6 Datos Muestra de Tela Sustancia Química 1 2 3 4 5 Totales Muestra de Tela Sustancia Química 1 2 3 4 5 Totales Promedios 1,3 1,6 0,5 1,2 1,1 5,7 1,14 2,2 2,4 0,4 2,0 1,8 8,8 1,76 1,7 0,6 1,5 6,9 1,38 3,9 4,4 4,1 3,4 17,8 3,56 9,2 10,1 3,5 7,6 39,2 2,3 2,5 0,9 1,9 1,96
Resultados MINITAB Factor Tipo Niveles Valores ANOVA: Resistencia de la Tela vs. Sustancia Química. Muestra de Tela Factor Tipo Niveles Valores Sustancia Química fijo 4 1. 2. 3. 4 Muestra de Tela fijo 5 1. 2. 3. 4. 5 Análisis de varianza de Resistencia de la Tela Fuente GL SC MC F P Sustancia 3 18,0440 6,0147 75,89 0,000 Muestra 4 6,6930 1,6733 21,11 0,000 Error 12 0,9510 0,0793 Total 19 25,6880 S = 0,281514 R-cuad. = 96,30% R-cuad.(ajustado) = 94,14%
Análisis de resultado La tabla ANOVA muestra que el estadístico de prueba f0 = 75,89 > f0,01;3;12 = 5,95. Concluimos que hay diferencias significativas en las resistencias de las telas bajo los distintos tipos de sustancias químicas. El p Valor 0.000 también podría usarse para llegar a la misma conclusión. Además como el valor p = 0, indica que no cambiaría la decisión independientemente del nivel de significación usado en la prueba.
Identificación efectos Utilizaremos LSD de Fisher
Identificación de efectos Los resultados muestran que la sustancia química 4 tiene da más resistencia que las otras. Nótese que el método no se ha modificado excepto por el cambio de notación (nB en vez de n).
Adecuación del modelo Los residuos se definen como: Dónde: Por tanto: El valor ajustado representa la estimación de la respuesta media cuando el i-ésimo tratamiento se efectúa en el j-ésimo bloque.
Ejemplo 3.6 Los residuos ajustados del experimento son: A continuación se muestran los gráficos de residuos Muestra de Tela Sustancia Química 1 2 3 4 5 -0,18 -0,10 0,44 -0,02 0,1 0,08 -0,28 0,00 0,10 -0,24 0,30 -0,12 0,28 -0,48 -0,30
Gráfico de probabilidad normal
Gráfico de residuos por tratamiento
Gráfico de residuos por bloques
Residuos respecto al valor esperado
Tema 3. Análisis de Varianza Diseños Factoriales
Experimentos con varios factores Un experimento es una prueba o serie de pruebas El diseño del experimento juega un papel principal en el análisis estadístico de éste. Un diseño factorial es aquél en el que se realizan ensayos con todas las configuraciones de los niveles de los factores. Se usa ANOVA como herramienta para analizar estadísticamente los resultados del experimento.
Definición Se entiende por experimento factorial a aquél en que se investigan todas las combinaciones posibles de los niveles de los factores en cada ensayo o réplica completa del experimento. Factor B Factor A Alto Bajo 10 20 30 40
Ejemplo El caso anterior es un experimento factorial sin interacción Rectas Paralelas
Ejemplo con interacción Nota: Ambos ejemplos son exagerados. Factor B Factor A Alto Bajo 10 20 30
Ejemplo con interacción No Paralelas
Representación 3-D caso sin interacción Superficie del experimento sin interacción en 3 D (vertical: resultado, plano factor A y B)
Representación 3-D con interacción
Representación isocurvas Rendimiento vs. Tiempo de reacción a temperatura constante (155 oF).
Representación isocurvas Rendimiento vs. Temperatura a tiempo de reacción constante (1,7 horas).
Representación isocurvas Gráfica de contorno en función de temperatura y tiempo
Datos Cada combinación de dos niveles se conoce como Configuración Experimental. La cantidad observaciones es: N = nAnBn. Factor B 1 2 … nB Totales Promedios Factor A y111,..y11n y121,..y12n y1nB1,..y1nBn y1.. y211,.. y221,.. y2nB1,.. y2.. nA ynA11,… ynA21,… ynAnB1,..ynAnBn ynA.. y.1. y.2. y.nB. y...
Modelo Lineal Con: Yijk es la k-ésima observación tomada en el i-ésimo nivel del Factor A y en el j-ésimo nivel del Factor B.
Análisis estadístico del modelo
Estimación de parámetros del modelo Se deduce de y de
Suma de cuadrados Suma de cuadrados: Y grados de libertad:
Cálculo de cuadrados Fórmulas de cálculo:
Prueba de hipótesis Efectos sin interacción Interacciones lineales
Estadísticos Para probar H0: i = 0 usar la razón: Para probar H0: j = 0 usar la razón: Para probar H0: ()ij = 0 usar la razón:
MSAB = SSAB / [(nA-1)(nB-1)] Tabla ANOVA Fuente de Variación Grados de Libertad Suma de Cuadrados Cuadrado Medio F Tratamiento A nA-1 SSA MSA = SSA / (nA-1) MSA / MSE Tratamiento B nB-1 SSB MSB = SSB / (nB-1) MSB / MSE Interacción (nA-1)(nB-1) SSAB MSAB = SSAB / [(nA-1)(nB-1)] MSAB / MSE Error nAnB (n-1) SSE MSE = SSE / [nAnB(n-1)] Total nAnBn-1 SST
Ejemplo 3.7 Se estudia el efecto del tapaporos en la pintura en superficies de aluminio, con dos métodos: inmersión y rociado. La de la pintura es mejorar la adhesión de la pintura. El grupo de ingeniería de procesos responsable de esta operación se encuentra interesado en saber si existen diferencias entre tres tapaporos diferentes y los dos métodos de aplicación.
Ejemplo 3.7 Tipo de Tapaporo Inmersión Σ Rociado yi .. 1 4,0; 4,5; 4,3 yi .. 1 4,0; 4,5; 4,3 12,8 5,4; 4,9; 5,6 15,9 28,7 2 5,6; 4,9; 5,4 5,8; 6,1; 6,3 18,2 34,1 3 3,8; 3,7; 4,0 11,5 5,5; 5,0; 5,0 15,5 27,0 y. j . 40,2 49,6 y… = 89,8
Ejemplo 3.7
Ejemplo 3.7
ANOVA El modelo indica que no existe interacción entre los diferentes tratamientos. Fuente de Variación Grados de Libertad Suma de Cuadrados Cuadrado Medio F P Tipo de Tapaporos 4,58 2 2,29 28,63 2,7E-5 Métodos de Aplicación 4,91 1 61,38 5,0E-7 Interacción 0,24 0,12 1,50 0,26 Error 0,99 12 0,08 Total 10,72 17
Gráficos Los gráficos de interacción nos permiten visualizar si existen interacciones. Aproximadamente paralelas Id. Curvas / Líneas paralelas indican que no hay interacción
Gráficas El gráfico de efectos principales permite detectar el efecto de cada factor en la respuesta
Ejemplo 3.7. Minitab ANOVA de dos factores: Fuerza de Adhesi vs. Tipo de Tapaporo. Método de Aplica Fuente GL SC MC F P Tipo de Tapaporo 2 4,5811 2,29056 27,86 0,000 Método de Aplicación 1 4,9089 4,90889 59,70 0,000 Interacción 2 0,2411 0,12056 1,47 0,269 Error 12 0,9867 0,08222 Total 17 10,7178 S = 0,2867 R-cuad. = 90,79% R-cuad.(ajustado) = 86,96%
Adecuación del modelo Los residuos se definen como: Método de Aplicación Tipo de Tapaporo Inmersión Rociado 1 -0.27, 0.23, 0.03 0.10, -0.40, 0.30 2 0.30, -0.40, 0.10 -0.27, 0.03, 0.23 3 -0.03, -0.13, 0.17 0.33, -0,17, -0.17
Gráfico de probabilidad de los residuos
Gráfico de residuos por tipo Por tipo de tapaporos:
Gráfico de residuos por tipo Por método de aplicación:
Gráfico de residuos respecto estimados
Diseños factoriales generales Caso con tres factores: Interacciones de 2 factores Interacción de los 3 factores
Tabla ANOVA Fuente de Variación Grados de Libertad Suma de Cuadrados Cuadrado Medio F Tratamiento A nA-1 SSA MSA = SSA / (nA-1) MSA / MSE Tratamiento B nB-1 SSB MSB = SSB / (nB-1) MSB / MSE Tratamiento C nC-1 SSC MSC = SSC / (nC-1) MSC / MSE Interacción AB (nA-1)(nB-1) SSAB MSAB = SSAB / [(nA-1)(nB-1)] MSAB / MSE Interacción AC (nA-1)(nC-1) SSAC MSAC = SSAC / [(nA-1)(nC-1)] MSAC / MSE Interacción BC (nB-1)(nC-1) SSBC MSBC = SSBC / [(nB-1)(nC-1)] MSBC / MSE Interacción ABC (nA-1)(nB-1)(nC-1) SSABC MSABC = SSABC / [(nA-1)(nB-1) (nC-1)] MSABC / MSE Error nAnBnC(n-1) SSE MSE = SSE / [nAnBnC(n-1)] Total nAnBnCn-1 SST
Ejemplo 8 Se estudia la rugosidad superficial de una pieza en una operación de corte de metal. Se exploran tres factores: Rapidez con la que se hace el corte (A) Profundidad de éste (B) Ángulo de la herramienta (C) Cada factor tiene dos niveles Se realizan dos réplicas del diseño factorial.
Ejemplo 8 Profundidad de corte (B) 0,025 '' 0,040 '' Rapidez de Corte (A) Ángulo de la herramienta (C) 15° 25° yi… 20''/min. 9 11 10 75 7 8 16 21 20 18 30''/min. 12 102 13 15 14 22 23 27 30 Totales BxC y.jk. 38 44 47 48 177 y….
Ejemplo 8. Minitab S=1,56125 R-cuad.=79,02% R-cuad.(aj)=60,66% Factor Tipo Niveles Valores Rapidez de Corte (A) fijo 2 20. 30 Profundidad de Corte (B) fijo 2 0,025. 0,040 Ángulo de la herramienta (C) fijo 2 15. 25 Análisis de varianza Fuente GL SC sec. SC ajust. MC ajust. F P 1 45,562 45,562 45,562 18,69 0,003 1 10,563 10,563 10,563 4,33 0,071 (C) 1 3,063 3,063 3,063 1,26 0,295 (A)*(B) 1 7,563 7,563 7,563 3,10 0,116 (A)*(C) 1 0,063 0,063 0,063 0,03 0,877 (B)*(C) 1 1,563 1,563 1,563 0,64 0,446 (A)*(B)*(C) 1 5,062 5,062 5,062 2,08 0,188 Error 8 19,500 19,500 2,438 Total 15 92,938 S=1,56125 R-cuad.=79,02% R-cuad.(aj)=60,66%
Diseños factoriales Diseño 22
Diseños 2k Diseño 22 El efecto principal del primer factor (A) se estima como: Y para el factor (B) como:
ContrasteA = a + ab – b – (1) Diseños 2k y contrastes El efecto de la interacción es: A las cantidades entre corchetes, se les denomina contrastes. Por ejemplo, el contraste de A es: ContrasteA = a + ab – b – (1)
Contrastes Los contrastes se utilizan para determinar los efectos principales y las interacciones. Los residuos se pueden determinar como:
Ejemplo 9 Un artículo describe la aplicación de diseños factoriales de dos factores a la fabricación de circuitos integrados. Los factores utilizados son: A: Tiempo de descomposición (-=corto, +=largo) B: Rapidez de flujo de arsénico (-=55%, +=59%) La variable de respuesta es el grosor de la capa epitaxial (μm). Se usan 4 réplicas (n=4)
Datos Tratamiento Factor Grosor A B AB Total Media (1) - + 14,037 14,165 13,972 13,907 56,081 14,020 a 14,821 14,757 14,843 14,878 59,299 14,825 b 13,880 13,860 14,032 13,914 55,686 13,922 ab 14,888 14,921 14,415 14,932 59,156 14,789
Cálculos
Cálculos
Gráfico normal de residuos
Gráfico de residuos con factor tiempo
Gráfico residuos / Rapidez flujo
Desviación estándar
Diseños factoriales 2k para k≥3
Interacciones Representación de contrastes asociados a los efectos principales y sus interacciones en un diseño 23. (a) efectos principales. (b) Interacciones entre dos factores. (c) interacción entre tres factores.
Estimación de efectos principales Estimación del efecto de A, B y C:
Estimación interacciones Interacción entre dos factores: Interacción de los tres factores:
Interacciones en formato tabular
Aparte de la columna de la identidad (I), cada columna tiene la misma cantidad de “-” y de “+” 2. La suma-producto de cualquier pareja de columnas es cero; es decir que las columnas son ortogonales La multiplicación de cualquier columna por I no cambia la columna; es decir que I es un elemento de identidad El producto de cualquier pareja de columnas da una columna que está en la tabla,
Contrastes Se calculan de forma parecida al caso anterior:
Ejemplo 10 Considérese el ejemplo 8. Éste es un experimento con 3 factores (A) velocidad de corte, (B) profundidad de corte y (C) ángulo de la herramienta con 2 réplicas. La tabla siguiente muestra los datos observados de rugosidad:
Solución Para A se calcula: Se actúa de forma idéntica para el resto de factores (las columnas) Minitab reporta los siguientes resultados:
Resultados
Gráfico de probabilidad para residuos
Réplica única del diseño para k grande Según aumenta k, el número de observaciones que deben realizarse aumenta, haciendo difícil poder realizar réplicas del diseño. Además, la falta de réplicas haría que el número de grados de libertad disminuyera. Una solución es considerar sólo algunas interacciones.
Ejemplo 11 Se estudia un problema de grabado con cuatro factores. Se realiza una única réplica del diseño. El diseño sigue un esquema 24. Se consideran sólo interacciones hasta nivel 2.
Observaciones
Resolución Los valores de la tabla anterior, junto a los signos, pueden utilizarse para estimar el efecto de cada factor.
Tabla de contrastes para 24
Ejemplo La tabla completa de contrastes es la siguiente:
Ejemplo
Gráfico de probabilidad de los efectos
Gráfico de interacción
Gráfico de los residuos