La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Tema 3. Análisis de Varianza

Presentaciones similares


Presentación del tema: "Tema 3. Análisis de Varianza"— Transcripción de la presentación:

1 Tema 3. Análisis de Varianza
Estadística Aplicada 2. Tema 3. Análisis de Varianza

2 Definición Estudio del efecto que distintas situaciones experimentales tienen sobre ciertas respuestas cuantitativas. Todo experimento contiene: Conjetura: Hipótesis original. Experimento: Prueba efectuada para investigar la conjetura. Análisis: Estudio estadístico de los datos obtenidos durante el experimento. Conclusión: Lo que se ha aprendido con la realización del experimento.

3 Ejemplos Estudiar el efecto de una marca de combustible sobre el desempeño de un motor de automóvil (distancia recorrida por litro de gasolina). Estudiar el efecto de cuatro soluciones azucaradas (glucosa, sacarosa, fructosa y una mezcla) en el desarrollo bacteriano. Investigar el efecto de la concentración de madera dura en la pulpa sobre la resistencia de las bolsas fabricadas con la pulpa. Determinar si la densidad de color de la tela depende de la cantidad de colorante utilizado.

4 Definiciones Factores Cualitativos Cuantitativos
Factor: Característica que diferencia a los tratamientos (o poblaciones) entre sí. Niveles: Diferentes tratamientos (o poblaciones) Factores Cualitativos Cuantitativos Los niveles corresponden a posibles categorías del factor Los niveles corresponden a diferentes ajustes del factor

5 Tema 3. Análisis de Varianza
Experimentos con un factor

6 Diseño de experimentos de un factor
Deseamos comprobar si la media de cada nivel de factor (cada tratamiento) es igual para todos. Esto es lo mismo que decir que el efecto de cada nivel es nulo. La hipótesis alternativa es que al menos un factor difiere de los demás

7 Análisis de Varianza La prueba de hipótesis anterior infiere información sobre las medias. El proceso anterior se le conoce como análisis de varianza. El nombre puede resultar engañoso (¿por qué no se llama Análisis de Medias?) pero hay que ver el nombre como la técnica que intenta explicar el origen de las diferencias (varianza) para extraer conclusiones.

8 Ejemplo con cuatro niveles
Los cuatro niveles tienen amplia variabilidad, que podría proceder de la muestra.

9 Situación inversa

10 Efecto del tratamiento
Modelo estadístico Un modelo lineal para analizar las diferencias sería el siguiente: Otra forma de entender la relación sería i=1,…,nA (alternativas / tratamientos) j=1,…,n (observaciones) Residuo N(0,σ2) Efecto del tratamiento

11 Representación de las observaciones
Las observaciones acostumbran a ordenarse mediante una matriz como la mostrada a posteriori. Es importante identificar la notación y.. ya que se usa extensivamente a lo largo del tema. Observaciones Tratamiento Totales Promedios 1 y 11 12 1n . 2 21 22 2n nA nA1 nA2 nAn y.. ..

12 Experimento con un factor
El efecto de los tratamientos corresponde a desviaciones respecto a una media global μ. Por tanto: Y la prueba de hipótesis queda definida por: Para alguna i

13 Notas Este modelo supone implícitamente que el factor no varía la varianza de la muestra (su único efecto es el cambio del valor medio esperado). El modelo puede plantearse como una regresión múltiple con diversas variables “dummy”. ¿Cómo? El experimento requiere aleatoriedad.

14 Tipos de experimentos Existen tres tipos principales de experimento cuyas diferencias pueden resultar confusas en ocasiones: Modelo de efectos fijos: Experimentos en el que los niveles (tratamientos) de los factores han sido escogidos a priori, y en los que se intenta extraer conclusiones únicamente de esos niveles.

15 Tipos de experimentos Modelo de efectos aleatorios: Experimentos en que el número de niveles (tratamientos) es demasiado grande como para considerarse completamente, por lo que los niveles estudiados se escogen aleatoriamente. Posteriormente, se desea extraer conclusiones que sirvan para otros niveles usando la información disponible con los niveles considerados.

16 Tipos de experimentos Modelo de efectos mixtos: En este caso aparecen factores fijos y factores aleatorios de forma conjunta. Este tipo de problema no será tratado en el presente curso, pero cabe indicar que existe este tipo de modelos.

17 Ejemplos Modelo de tipo fijo: Se desea estudiar la modernización de la flota de camiones de una empresa y para ello se desea estudiar el efecto en los costes operativos de cuatro alternativas de un fabricante de camiones. Modelo de tipo aleatorio: Se desea estudiar el efecto en los costes operativos de los diferentes tipos de camiones que actualmente componen la flota de la empresa. Modelo de efectos mixtos: En este caso se desea estudiar posibles cambios (efecto aleatorio) en los modelos ofrecidos por el fabricante (efecto fijo).

18 Tema 3. Análisis de Varianza
Un factor. Efectos Fijos

19 Modelo de efectos fijos
En este caso la variabilidad total de los datos puede descomponerse en dos factores como sigue: Variabilidad Total de los Datos Variabilidad Debido al tratamiento (Variabilidad Entre) Variabilidad Inherente de los datos (Variabilidad Dentro)

20 (variabilidad dentro)
Efectos fijos Matemáticamente, el modelo equivale a: Dif. entre tratamientos (variabilidad entre) Error aleatorio (variabilidad dentro) yij i=1,…,nA (alternativas) j=1,…,n (observaciones) Recordemos:

21 Diferencia Entre Tratamientos
Relación de cálculos Observaciones Tratamiento Totales Promedios 1 y 11 12 1n . 2 21 22 2n nA nA1 nA2 nAn y.. .. Diferencia Entre Tratamientos Error Aleatorio Caso Regresión:

22 Estimación de la varianza
Puede demostrarse que: Por tanto, si H0 es cierta: Pero si Ha es cierta: Recordemos:

23 Estimación de la varianza
Por tanto, si H0 es cierta: Pero si Ha es cierta: El cuadrado medio de los tratamientos equivale a: Si H0 es falsa, MSTr sobreestima σ2, si no es un estimador insesgado.

24 Estimación del error aleatorio
Podemos demostrar que: Por lo que: Y el error cuadrático medio equivale a: MSE siempre es un estimador insesgado de σ2.

25 Test de hipótesis nula Considerando a todas las muestras como observaciones procedentes de distribuciones normales, podemos verificar que: Cuando la H0 es cierta, F0 debería ser cercana a 1, mientras que el valor debería de crecer si H0 es falsa.

26 Test de hipótesis nula El estadístico debe cumplir la siguiente condición: Como F0 se distribuye según una distribución F con ν1=nA-1 y ν2=nA (n-1) grados de libertad, la región de rechazo de la hipótesis nula corresponde a:

27 Fórmulas de cálculo N: número total de observaciones
Muestras con igual tamaño en cada tratamiento Muestras con distinto tamaño en cada tratamiento N: número total de observaciones

28 Tabla ANOVA Igual número de observaciones por tratamiento:
Diferente número de observaciones : Fuente de Variación Grados de Libertad Suma de Cuadrados Cuadrado Medio f Tratamientos nA-1 SSTr MSTr = SSTr / (nA-1) MSTr/ MSE Error nA(n-1) SSE MSE = SSE / [nA(n-1)] Total nAn-1 SST Fuente de Variación Grados de Libertad Suma de Cuadrados Cuadrado Medio f Tratamientos nA-1 SSTr MSTr = SSTr / (nA-1) MSTr/ MSE Error N-nA SSE MSE = SSE / [N-nA] Total N-1 SST

29 Ejemplo 1 Un fabricante de papel utilizado para fabricar bolsas de caramelo, está interesado en mejorar la resistencia a la tensión del producto medida en [psi] . El grupo de ingeniería del producto piensa que la resistencia a la tensión es una función de la concentración de madera dura en la pulpa El rango de interés práctico de las concentraciones de madera dura está entre 5% y 20%.

30 Ejemplo 1 Se decide investigar cuatro niveles de concentración de madera dura: 5, 10, 15 y 20%. Se fabrican seis especímenes de prueba para cada nivel de concentración, utilizando una planta piloto. Los 24 especímenes se someten a prueba de tensión en laboratorio, siguiendo un orden aleatorio. Los datos obtenidos aparecen en la siguiente tabla:

31 Concentración de madera dura (%)
Datos y notas Notas: Se sigue un modelo de efectos fijos. Es importante recalcar que las pruebas se han hecho en orden aleatorio. Concentración de madera dura (%) Observaciones 1 2 3 4 5 6 7 8 15 11 9 10 12 17 13 18 19 14 16 20 25 22 23

32 Cálculos

33 Tabla ANOVA Los cálculos ordenados en forma tabular son:
En este caso el valor p = P(F3,20 ≥ 19,6) = 3,5910-6 Por lo tanto al menos una de las concentraciones de pulpa de madera permite variación en la resistencia. ¿Podemos determinar qué tratamientos son significativamente distintos? Fuente de Variación Grados de Libertad Suma de Cuadrados Cuadrado Medio f Tratamientos 3 382,79 127,6 19,6 Error 20 130,17 6,51 Total 23 512,96

34 Métodos de comparación múltiple
Alternativas: Método LSD de Fisher: Fácil de calcular Trabaja con la t de student Muy sensible a pequeñas variaciones Confianza individual y no grupal Método de Tuckey Distribución de rango estudentizado Fuerte evidencia para detectar diferencias Confianza grupal Concepto de tasa de error por experimento

35 Método LSD de Fisher Deseamos encontrar un intervalo de confianza para la diferencia entre dos tratamientos. El estimador puntual es: La varianza es: por tanto:

36 Método LSD de Fisher Con lo cual tenemos que:
y el intervalo de confianza del 100(1-α)% para la diferencia entre las medias de dos tratamientos µi - µj es:

37 Ejemplo 1 (continuación)
Para el ejemplo 1, si comparamos los tratamientos 2 y 3: Las diferencias no son significativas con un α=0,05. Puesto que el “0” se encuentra en el intervalo, existiendo la posibilidad de que: µ3-µ2=0

38 Múltiples comparaciones
El par de medias i - j se considera diferente si: Tamaños de muestra iguales Tamaños de muestra desiguales

39 Ejemplo 2 Apliquemos el método LSD a los datos del ejemplo 1.
nA = 4, n = 6, MSE = 6,51 y además t0,025;20 = 2,086. Las medias de tratamiento son:

40 Ejemplo 2 Con los datos disponibles podemos obtener el valor de LSD.
Por tanto, cualquier par de medias que difiera en más de 3,07 unidades implica que los tratamientos son significativamente distintos. Las comparaciones se detallan en la siguiente transparencia.

41 Ejemplo 2 Existen diferencias significativas entre todos los pares de medias excepto los pares 2 y 3. Esto implica que el 10 y 15% de concentración son parecidos y el resto diferentes.

42 Ejemplo 2 Visualmente se puede observar el efecto mostrado por la prueba LSD de Fisher: Pueden verse diferencias significativas las diferentes concentraciones, pero las concentraciones de 10% y 15% son muy parecidas.

43 Valor crítico de la cola superior de α con m=nA y ν=nAn
Método de Tuckey Como se indicó con anterioridad, el método usa una distribución conocida como “Distribución de rango estudentizado”. Al igual que la distribución F, ésta distribución depende de dos parámetros, los grados de libertad del numerador (m) y los del denominador (ν). Por lo tanto, se define como: Valor crítico de la cola superior de α con m=nA y ν=nAn

44 Método de Tuckey El intervalo de confianza se construye como sigue:
Al igual que en el LSD de Fisher, si el intervalo no incluye el 0, las medias difieren significativamente.

45 Procedimiento Seleccionar α y buscar Determinar W como:
Cualquier par de medias que difieran en más que la cantidad definida por W son juzgadas como significativamente diferentes entre sí. Para realizar este último paso, es práctico ordenar las medias muestrales en orden no decreciente.

46 Ejemplo 3 Se efectuó un experimento para comparar 5 marcas distintas de filtros de aceite automotrices, en relación con su capacidad para capturar materia extraña. Se usó una muestra de nueve filtros de cada marca y se obtuvieron las siguientes cantidades promedio:

47 Ejemplo 3. Tabla ANOVA Partiendo de la siguiente ANOVA:
¿Los datos indican que la cantidad promedio real de material capturado depende de la marca de los filtros? Utilice un nivel  = 0,05. Si es así, use el método de Tuckey para identificar diferencias significativas. Fuente de Variación Grados de Libertad Suma de Cuadrados Cuadrado Medio f Tratamientos 4 13,32 3,33 37,73 Error 40 3,53 0,088 Total 44 16,85

48 Resolución Inicialmente comprobamos el análisis ANOVA:
El parámetro de interés es el efecto de la marca i sobre el material capturado. H0: τ1=τ2=τ3=τ4=τ5=0. Ha: Al menos uno diferente. El estadístico es: a comparar con Se rechaza H0

49 Resolución Posteriormente se pasa a verificar las diferencias mediante Tuckey. El valor Determinamos W. Al ordenar verificamos que: 13,1 13,3 13,8 14,3 14,5

50 Procedimiento de Tuckey-Kramer
Útil para tamaños muestrales diferentes n1, n2, ..., nnA que son razonablemente cercanos entre sí. Se utilizan promedios entre parejas (es decir 1/ni en vez de 1/n). El nivel de confianza simultáneo es al menos del 100(1-)% (sólo aproximado, no exacto), para tamaños muestrales desiguales.

51 Ejemplo 4 Un artículo presentó los siguientes datos del módulo de elasticidad, en GPa, obtenidos con un nuevo método ultrasónico, para muestras de cierta aleación producida con tres métodos de colado diferente.

52 Resolución Inicialmente comprobamos el análisis ANOVA:
El parámetro de interés es el efecto del módulo de elasticidad en el promedio del proceso. H0: τ1=τ2=τ3=τ4=0. Ha: Al menos uno diferente. Para obtener el estadístico necesitamos realizar algunos cálculos intermedios:

53 Resolución El valor p = P(F2, 19 ≥ 12,56) = 0,0003 indica que se debe rechazar H0 a cualquier nivel de significancia. Por lo tanto, el módulo de elasticidad promedio depende de cierta forma del proceso de colado que se utilice.

54 Resolución Posteriormente se pasa a verificar las diferencias mediante Tuckey-Kramer. n1=8, n2=8, n3=6 y nA=3; N–nA=19 y MSE = 0,316. Por lo tanto, un nivel de confianza simultáneo de aproximadamente 95% requiere:

55 Resolución En este caso tras ordenar los datos:
Se concluye que 1 y 2 no son considerablemente diferentes, sin embargo tanto 1 como 2 parecen diferir en forma significativa de 3. 2. A presión 1. Permanente 3. Yeso 44,06 44,71 45,58

56 Verificación de las hipótesis del modelo
Las hipótesis de partida son: Normalidad (eij ~ N(0, 2)) Homocedasticidad (igualdad de varianzas) La verificación se realiza mediante: Gráficas de probabilidad normal. Gráficas de los ei vs. los niveles del factor. Gráficas de los ei vs. medias de tratamiento observadas

57 Volviendo al ejemplo 3.1 Los residuos son los siguientes:

58 Gráfico de probabilidad normal

59 Gráfico de residuos respecto al factor

60 Gráfico de residuos respecto respuesta

61 Tema 3. Análisis de Varianza
Un factor. Efectos Aleatorios

62 Modelo Efectos Aleatorios
El factor de interés tiene un número muy grande de niveles posibles. El analista está interesado en obtener conclusiones respecto todos los posibles niveles del factor. Si se selecciona al azar nA de estos niveles de la población de todos los niveles del factor, entonces se dice que el factor es aleatorio. Las conclusiones pueden generalizarse debido a la aleatoriedad.

63 Variable aleatoria que explica el efecto aleatorio del factor,
Efectos aleatorios El modelo lineal es: Variable aleatoria que explica el efecto aleatorio del factor, i ~ N(0,σ2) (Para efectos fijos, se suponía que σ2 = 0 y que el efecto era únicamente en la media) Residuos, ij ~ N(0,σ2)

64 Consideraciones del modelo
Los i son independientes para i = 1…nA, cada uno con varianza σ2 Los εij son independientes para i = 1…nA, y j = 1…n cada uno con σ2 Los i y εij son independientes para cada combinación de i y j La varianza del modelo es: donde cada término del lado derecho es denominado componente de la varianza.

65 Consideraciones del modelo
La hipótesis que las {i } son independientes, implica que la hipótesis usual que: del modelo de efectos fijos no se aplica al modelo de efectos aleatorios. Las hipótesis apropiadas a probar son: Y la descomposición sigue siendo:

66 Determinación de cuadrados medios
En el modelo ANOVA de un solo factor, experimento completamente aleatoriezado, el valor esperado de la media de cuadrados de los tratamientos es: El valor esperado de los cuadrados del error: Y los estimadores de los componentes de la varianza:

67 Ejemplo 5 Una compañía textil produce en varios telares.
Interesa estudiar la la variabilidad de la resistencia a la tensión de un telar a otro. Se seleccionan al azar cuatro telares y se determina la resistencia a la tensión de observaciones aleatorias. Observaciones Telar 1 2 3 4 Totales Promedios 98 97 99 96 391 97,5 91 90 93 92 368 91,5 95 386 95,75 392 1537 95,44

68 Solución Tabla ANOVA: El valor de F y su p valor permiten concluir que los telares influyen en la resistencia a la tensión de los telares. La varianza estimada es s2 = 1,90 y:

69 Solución La varianza total es:
Por tanto, la mayor parte de la varianza se debe a los telares. El aislamiento de diversas fuentes de aleatoriedad es un tema recurrente en los problemas de control y mejora de la calidad.

70 Aplicación al control de calidad
En el ejemplo anterior, la estimación de los parámetros del proceso son: Suponiendo un límite inferior de resistencia de 90 [psi] Aprox. 3,37% de fallos

71 Aplicación al control de calidad
Si se eliminaran las fuentes de variabilidad causadas por los telares (sτ2=0): En ese caso, la reducción en la variabilidad de la resistencia disminuye en gran medida la degradación del proceso, lo que trae como resultado: Menores costes Mayor calidad Clientes satisfechos Ventaja competitiva

72 Tema 3. Análisis de Varianza
Un factor. Diseño por Bloques

73 Diseño aleatorio por bloques
Técnica que extiende la prueba t para datos emparejados para el caso en que hay más de dos niveles. Los bloques han sido creados por las condiciones y el diseño del experimento. Bloque 1 Bloque 2 Bloque 3 Bloque 4 t1 t2 t3 t1 t2 t3 t1 t2 t3 t1 t2 t3

74 Ejemplo del concepto “Bloque”
Suponga que deseamos comprobar diferentes métodos para cortar una viga. Se opta por probar tres métodos de corte (factores) y se comprobará el resultado en cuatro vigas. Idealmente deberíamos realizar: Tratamiento Bloques (Viga) (Método) 1 2 3 4 A y11 y12 y13 y14 B y21 y22 y23 y24 C y31 y32 y33 y34

75 Procedimiento general
A Grosso Modo, la “dimensión observaciones” se sustituye por la “dimensión bloques”, pero ahora también tienen sentido las diferencias y promedios de los bloques. Bloques Tratamiento 1 2 nB Totales Promedios y 11 12 1nB . 21 22 2nB nA nA1 nA2 nAnB y. y.. ..

76 Modelo Lineal El modelo lineal que tiene en cuenta bloques es el siguiente: El modelo asume que: El efcto de tratamientos y bloques es fijo. Los bloques no interactúan. Dentro de cada bloque las unidades son homogéneas frente a otros factores que podrían afectar

77 Hipótesis de la prueba La hipótesis de la prueba son:
Y la suma de cuadrados: De forma resumida: (tratamientos) (bloques)

78 Fórmulas de cálculo Cuadrados Medios Valores Esperados

79 Fórmulas de cálculo Por tanto:

80 Tabla ANOVA Fuente de Variación Grados de Libertad Suma de Cuadrados
Cuadrado Medio f Tratamientos nA-1 SSA MSA = SSA / (nA-1) MSA / MSE Bloques nB-1 SSB MSB = SSB / (nB-1) Error (nA-1)(nB-1) SSE MSE = SSE / (nA-1)(nB-1) Total nAnB-1 SST

81 Ejemplo 3.6 Experimento del efecto de cuatro sustancias químicas sobre la resistencia de una tela. Se escogen cinco muestras de tela y se aplica un diseño completamente aleatorizado por bloques mediante la prueba de cada sustancia en un orden aleatorio sobre cada una de las muestras de tela. En caso de existir efecto por parte de las sustancias químicas sobre la resistencia de las telas, se identificarán aquéllas que provoquen efecto sobre la resistencia, con = 0,01.

82 Ejemplo 3.6 Datos Muestra de Tela Sustancia Química 1 2 3 4 5 Totales
Muestra de Tela Sustancia Química 1 2 3 4 5 Totales Promedios 1,3 1,6 0,5 1,2 1,1 5,7 1,14 2,2 2,4 0,4 2,0 1,8 8,8 1,76 1,7 0,6 1,5 6,9 1,38 3,9 4,4 4,1 3,4 17,8 3,56 9,2 10,1 3,5 7,6 39,2 2,3 2,5 0,9 1,9 1,96

83 Resultados MINITAB Factor Tipo Niveles Valores
ANOVA: Resistencia de la Tela vs. Sustancia Química. Muestra de Tela Factor Tipo Niveles Valores Sustancia Química fijo Muestra de Tela fijo Análisis de varianza de Resistencia de la Tela Fuente GL SC MC F P Sustancia 3 18, , ,89 0,000 Muestra , , ,11 0,000 Error , ,0793 Total ,6880 S = 0, R-cuad. = 96,30% R-cuad.(ajustado) = 94,14%

84 Análisis de resultado La tabla ANOVA muestra que el estadístico de prueba f0 = 75,89 > f0,01;3;12 = 5,95. Concluimos que hay diferencias significativas en las resistencias de las telas bajo los distintos tipos de sustancias químicas. El p Valor también podría usarse para llegar a la misma conclusión. Además como el valor p = 0, indica que no cambiaría la decisión independientemente del nivel de significación usado en la prueba.

85 Identificación efectos
Utilizaremos LSD de Fisher

86 Identificación de efectos
Los resultados muestran que la sustancia química 4 tiene da más resistencia que las otras. Nótese que el método no se ha modificado excepto por el cambio de notación (nB en vez de n).

87 Adecuación del modelo Los residuos se definen como: Dónde: Por tanto:
El valor ajustado representa la estimación de la respuesta media cuando el i-ésimo tratamiento se efectúa en el j-ésimo bloque.

88 Ejemplo 3.6 Los residuos ajustados del experimento son:
A continuación se muestran los gráficos de residuos Muestra de Tela Sustancia Química 1 2 3 4 5 -0,18 -0,10 0,44 -0,02 0,1 0,08 -0,28 0,00 0,10 -0,24 0,30 -0,12 0,28 -0,48 -0,30

89 Gráfico de probabilidad normal

90 Gráfico de residuos por tratamiento

91 Gráfico de residuos por bloques

92 Residuos respecto al valor esperado

93 Tema 3. Análisis de Varianza
Diseños Factoriales

94 Experimentos con varios factores
Un experimento es una prueba o serie de pruebas El diseño del experimento juega un papel principal en el análisis estadístico de éste. Un diseño factorial es aquél en el que se realizan ensayos con todas las configuraciones de los niveles de los factores. Se usa ANOVA como herramienta para analizar estadísticamente los resultados del experimento.

95 Definición Se entiende por experimento factorial a aquél en que se investigan todas las combinaciones posibles de los niveles de los factores en cada ensayo o réplica completa del experimento. Factor B Factor A Alto Bajo 10 20 30 40

96 Ejemplo El caso anterior es un experimento factorial sin interacción
Rectas Paralelas

97 Ejemplo con interacción
Nota: Ambos ejemplos son exagerados. Factor B Factor A Alto Bajo 10 20 30

98 Ejemplo con interacción
No Paralelas

99 Representación 3-D caso sin interacción
Superficie del experimento sin interacción en 3 D (vertical: resultado, plano factor A y B)

100 Representación 3-D con interacción

101 Representación isocurvas
Rendimiento vs. Tiempo de reacción a temperatura constante (155 oF).

102 Representación isocurvas
Rendimiento vs. Temperatura a tiempo de reacción constante (1,7 horas).

103 Representación isocurvas
Gráfica de contorno en función de temperatura y tiempo

104 Datos Cada combinación de dos niveles se conoce como Configuración Experimental. La cantidad observaciones es: N = nAnBn. Factor B 1 2 nB Totales Promedios Factor A y111,..y11n y121,..y12n y1nB1,..y1nBn y1.. y211,.. y221,.. y2nB1,.. y2.. nA ynA11,… ynA21,… ynAnB1,..ynAnBn ynA.. y.1. y.2. y.nB. y...

105 Modelo Lineal Con: Yijk es la k-ésima observación tomada en el i-ésimo nivel del Factor A y en el j-ésimo nivel del Factor B.

106 Análisis estadístico del modelo

107 Estimación de parámetros del modelo
Se deduce de y de

108 Suma de cuadrados Suma de cuadrados: Y grados de libertad:

109 Cálculo de cuadrados Fórmulas de cálculo:

110 Prueba de hipótesis Efectos sin interacción Interacciones lineales

111 Estadísticos Para probar H0: i = 0 usar la razón:
Para probar H0: j = 0 usar la razón: Para probar H0: ()ij = 0 usar la razón:

112 MSAB = SSAB / [(nA-1)(nB-1)]
Tabla ANOVA Fuente de Variación Grados de Libertad Suma de Cuadrados Cuadrado Medio F Tratamiento A nA-1 SSA MSA = SSA / (nA-1) MSA / MSE Tratamiento B nB-1 SSB MSB = SSB / (nB-1) MSB / MSE Interacción (nA-1)(nB-1) SSAB MSAB = SSAB / [(nA-1)(nB-1)] MSAB / MSE Error nAnB (n-1) SSE MSE = SSE / [nAnB(n-1)] Total nAnBn-1 SST

113 Ejemplo 3.7 Se estudia el efecto del tapaporos en la pintura en superficies de aluminio, con dos métodos: inmersión y rociado. La de la pintura es mejorar la adhesión de la pintura. El grupo de ingeniería de procesos responsable de esta operación se encuentra interesado en saber si existen diferencias entre tres tapaporos diferentes y los dos métodos de aplicación.

114 Ejemplo 3.7 Tipo de Tapaporo Inmersión Σ Rociado yi .. 1 4,0; 4,5; 4,3
yi .. 1 4,0; 4,5; 4,3 12,8 5,4; 4,9; 5,6 15,9 28,7 2 5,6; 4,9; 5,4 5,8; 6,1; 6,3 18,2 34,1 3 3,8; 3,7; 4,0 11,5 5,5; 5,0; 5,0 15,5 27,0  y. j . 40,2 49,6 y… = 89,8

115 Ejemplo 3.7

116 Ejemplo 3.7

117 ANOVA El modelo indica que no existe interacción entre los diferentes tratamientos. Fuente de Variación Grados de Libertad Suma de Cuadrados Cuadrado Medio F P Tipo de Tapaporos 4,58 2 2,29 28,63 2,7E-5 Métodos de Aplicación 4,91 1 61,38 5,0E-7 Interacción 0,24 0,12 1,50 0,26 Error 0,99 12 0,08 Total 10,72 17

118 Gráficos Los gráficos de interacción nos permiten visualizar si existen interacciones. Aproximadamente paralelas Id. Curvas / Líneas paralelas indican que no hay interacción

119 Gráficas El gráfico de efectos principales permite detectar el efecto de cada factor en la respuesta

120 Ejemplo 3.7. Minitab ANOVA de dos factores: Fuerza de Adhesi vs. Tipo de Tapaporo. Método de Aplica Fuente GL SC MC F P Tipo de Tapaporo , , ,86 0,000 Método de Aplicación , , ,70 0,000 Interacción , , ,47 0,269 Error , ,08222 Total ,7178 S = 0, R-cuad. = 90,79% R-cuad.(ajustado) = 86,96%

121 Adecuación del modelo Los residuos se definen como:
Método de Aplicación Tipo de Tapaporo Inmersión Rociado 1 -0.27, 0.23, 0.03 0.10, -0.40, 0.30 2 0.30, -0.40, 0.10 -0.27, 0.03, 0.23 3 -0.03, -0.13, 0.17 0.33, -0,17, -0.17

122 Gráfico de probabilidad de los residuos

123 Gráfico de residuos por tipo
Por tipo de tapaporos:

124 Gráfico de residuos por tipo
Por método de aplicación:

125 Gráfico de residuos respecto estimados

126 Diseños factoriales generales
Caso con tres factores: Interacciones de 2 factores Interacción de los 3 factores

127 Tabla ANOVA Fuente de Variación Grados de Libertad Suma de Cuadrados
Cuadrado Medio F Tratamiento A nA-1 SSA MSA = SSA / (nA-1) MSA / MSE Tratamiento B nB-1 SSB MSB = SSB / (nB-1) MSB / MSE Tratamiento C nC-1 SSC MSC = SSC / (nC-1) MSC / MSE Interacción AB (nA-1)(nB-1) SSAB MSAB = SSAB / [(nA-1)(nB-1)] MSAB / MSE Interacción AC (nA-1)(nC-1) SSAC MSAC = SSAC / [(nA-1)(nC-1)] MSAC / MSE Interacción BC (nB-1)(nC-1) SSBC MSBC = SSBC / [(nB-1)(nC-1)] MSBC / MSE Interacción ABC (nA-1)(nB-1)(nC-1) SSABC MSABC = SSABC / [(nA-1)(nB-1) (nC-1)] MSABC / MSE Error nAnBnC(n-1) SSE MSE = SSE / [nAnBnC(n-1)] Total nAnBnCn-1 SST

128 Ejemplo 8 Se estudia la rugosidad superficial de una pieza en una operación de corte de metal. Se exploran tres factores: Rapidez con la que se hace el corte (A) Profundidad de éste (B) Ángulo de la herramienta (C) Cada factor tiene dos niveles Se realizan dos réplicas del diseño factorial.

129 Ejemplo 8 Profundidad de corte (B) 0,025 '' 0,040 ''
Rapidez de Corte (A) Ángulo de la herramienta (C) 15° 25° yi… 20''/min. 9 11 10 75 7 8 16 21 20 18 30''/min. 12 102 13 15 14 22 23 27 30 Totales BxC y.jk. 38 44 47 48 177 y….

130 Ejemplo 8. Minitab S=1,56125 R-cuad.=79,02% R-cuad.(aj)=60,66%
Factor Tipo Niveles Valores Rapidez de Corte (A) fijo Profundidad de Corte (B) fijo ,025. 0,040 Ángulo de la herramienta (C) fijo Análisis de varianza Fuente GL SC sec. SC ajust. MC ajust F P 1 45, , , ,69 0,003 1 10, , , ,33 0,071 (C) , , , ,26 0,295 (A)*(B) , , , ,10 0,116 (A)*(C) , , , ,03 0,877 (B)*(C) , , , ,64 0,446 (A)*(B)*(C) , , , ,08 0,188 Error , , ,438 Total ,938 S=1,56125 R-cuad.=79,02% R-cuad.(aj)=60,66%

131 Diseños factoriales Diseño 22

132 Diseños 2k Diseño 22 El efecto principal del primer factor (A) se estima como: Y para el factor (B) como:

133 ContrasteA = a + ab – b – (1)
Diseños 2k y contrastes El efecto de la interacción es: A las cantidades entre corchetes, se les denomina contrastes. Por ejemplo, el contraste de A es: ContrasteA = a + ab – b – (1)

134 Contrastes Los contrastes se utilizan para determinar los efectos principales y las interacciones. Los residuos se pueden determinar como:

135 Ejemplo 9 Un artículo describe la aplicación de diseños factoriales de dos factores a la fabricación de circuitos integrados. Los factores utilizados son: A: Tiempo de descomposición (-=corto, +=largo) B: Rapidez de flujo de arsénico (-=55%, +=59%) La variable de respuesta es el grosor de la capa epitaxial (μm). Se usan 4 réplicas (n=4)

136 Datos Tratamiento Factor Grosor A B AB Total Media (1) - + 14,037
14,165 13,972 13,907 56,081 14,020 a 14,821 14,757 14,843 14,878 59,299 14,825 b 13,880 13,860 14,032 13,914 55,686 13,922 ab 14,888 14,921 14,415 14,932 59,156 14,789

137 Cálculos

138 Cálculos

139 Gráfico normal de residuos

140 Gráfico de residuos con factor tiempo

141 Gráfico residuos / Rapidez flujo

142 Desviación estándar

143 Diseños factoriales 2k para k≥3

144 Interacciones Representación de contrastes asociados a los efectos principales y sus interacciones en un diseño 23. (a) efectos principales. (b) Interacciones entre dos factores. (c) interacción entre tres factores.

145 Estimación de efectos principales
Estimación del efecto de A, B y C:

146 Estimación interacciones
Interacción entre dos factores: Interacción de los tres factores:

147 Interacciones en formato tabular

148 Aparte de la columna de la identidad (I), cada columna tiene la misma cantidad de “-” y de “+”
2. La suma-producto de cualquier pareja de columnas es cero; es decir que las columnas son ortogonales La multiplicación de cualquier columna por I no cambia la columna; es decir que I es un elemento de identidad El producto de cualquier pareja de columnas da una columna que está en la tabla,

149 Contrastes Se calculan de forma parecida al caso anterior:

150 Ejemplo 10 Considérese el ejemplo 8. Éste es un experimento con 3 factores (A) velocidad de corte, (B) profundidad de corte y (C) ángulo de la herramienta con 2 réplicas. La tabla siguiente muestra los datos observados de rugosidad:

151 Solución Para A se calcula:
Se actúa de forma idéntica para el resto de factores (las columnas) Minitab reporta los siguientes resultados:

152 Resultados

153 Gráfico de probabilidad para residuos

154 Réplica única del diseño para k grande
Según aumenta k, el número de observaciones que deben realizarse aumenta, haciendo difícil poder realizar réplicas del diseño. Además, la falta de réplicas haría que el número de grados de libertad disminuyera. Una solución es considerar sólo algunas interacciones.

155 Ejemplo 11 Se estudia un problema de grabado con cuatro factores.
Se realiza una única réplica del diseño. El diseño sigue un esquema 24. Se consideran sólo interacciones hasta nivel 2.

156 Observaciones

157 Resolución Los valores de la tabla anterior, junto a los signos, pueden utilizarse para estimar el efecto de cada factor.

158 Tabla de contrastes para 24

159 Ejemplo La tabla completa de contrastes es la siguiente:

160 Ejemplo

161 Gráfico de probabilidad de los efectos

162 Gráfico de interacción

163 Gráfico de los residuos


Descargar ppt "Tema 3. Análisis de Varianza"

Presentaciones similares


Anuncios Google