Experimentos Industriales y sus procedimientos en

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

ANALISIS PARAMÉTRICOS
Tema 15. Contraste de hipótesis: Planteamiento de las hipótesis
DISEÑO DE EXPERIMENTOS
Ejemplo La empresa Producciones Valencianas, en el análisis de sus operaciones del último trimestre, muestra una disminución de la producción en comparación.
ESTADISTICA INFERENCIAL
Contraste de Hipótesis
Pronósticos, Series de Tiempo y Regresión
Bivariadas y Multivariadas
La prueba U DE MANN-WHITNEY
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
El método científico Ing. Nelson Velásquez.
MUESTREO DE ACEPTACIÓN DE LOTES POR VARIABLES
ANOVA Modelo I: Comparación entre medias
Estadística Descriptiva: 4. Correlación y Regresión Lineal
9 Regresión Lineal Simple
Control estadístico de Proceso
DISEÑOS DE COMPOSICION CENTRAL
ANALISIS DE DATOS CON EXCEL
Clases 3 Pruebas de Hipótesis
Unidad VI: PRUEBAS DE HIPOTESIS
Clases 4 Pruebas de Hipótesis
1 Planteamiento del problema ¿Tenemos los humanos la capacidad de percibir si nos miran desde atrás? O, más exactamente: ¿Es defendible que existen otras.
Población y Muestra.
TIPOS DE MODELOS DE REGRESIÓN Y SUPUESTOS PARA EL MODELO A
EMPLEAR COMO DISEÑO UNA FRACCION FACTORIAL
Diseño Estadístico y Herramientas para la Calidad
ANALISIS DE DATOS CATEGORICOS
Curso de Bioestadística. ANOVA
Pronósticos, Series de Tiempo y Regresión
Modelo de regresión simple: Y =  1 +  2 X + u 1 Hemos visto que los coeficientes de regresión b 1 y b 2 son variables aleatorias. Estos, respectivamente,
Investigación Experimental
VALIDACION DE METODOS ANALITICOS.
DISTRIBUCIONES DE MUESTREO
ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población.
Datos: Estadística.
ESTADÍSTICAS DESCRIPTIVA
Métodos de calibración: regresión y correlación
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Análisis Cuantitativo de Datos (Básico)
Grupo Continental Control de Procesos.
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
Capacidad de Proceso.
Herramientas básicas.
Capítulo 1. Conceptos básicos de la Estadística
UNIDAD 1.- EVALUACIÓN DE DATOS ANALITICOS
CO-2124 Análisis de Varianza con Un Criterio de Clasificación En clases anteriores se deseaba determinar si existían diferencias entre las medias de dos.
Pruebas de hipótesis.
coeficientes de correlación de
PRUEBAS ESTADISTICAS NO PARAMETRICAS
Estimación y contraste de hipótesis
Diseños Generales. 2 Propósito implícito del diseño experimental El propósito implícito de todo diseño experimental consiste en imponer restricciones.
Análisis de los Datos Cuantitativos
Regresión Lineal Simple
Control Estadístico de Procesos
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
MODELAMIENTO MATEMÁTICO DE PROCESOS INDUSTRIALES
Clase N°11 Métodos de reducción de varianza
INFERENCIA ESTADÍSTICA
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
DISEÑOS POR BLOQUES ALEATORIZADOS
REGRESIÓN LINEAL SIMPLE
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
METODO DE MAXIMA PENDIENTE
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
ANALISIS DE VARIANZA.
Evaluando los promedios de grupos distintos UNIDAD 7 1.
Transcripción de la presentación:

Experimentos Industriales y sus procedimientos en David R. González Barreto

Rol del diseño experimental en la búsqueda del conocimiento – Un ciclo que se repite (ANDREWS) Verdad Conocimiento Hipótesis y Diseño Conducir Experimento Análisis

La búsqueda científica del conocimiento como un ciclo Desarrollo de Ideas Hipótesis Planificar Prueba para la idea. Diseño experimental Conducir Experimento Analizar Datos Del Experimento

Definiciones y principios básicos Experimento es una prueba o serie de pruebas en la(s) cual(es) ciertas variables de entrada de un proceso son alteradas sistemáticamente con el propósito de identificar su efecto en la(s) variable(s) de salida. Los experimentos diseñados estadísticamente permiten diseñar pruebas que son eficientes y económicas, el uso de métodos estadísticos a la hora de examinar los datos obtenidos de estas pruebas resultan en conclusiones válidas y objetivas desde la perspectiva científica. Todos los experimentos se diseñan, algunos se diseñan de forma incorrecta resultando en conclusiones no válidas y/o un mal uso de recursos.

Definiciones y principios básicos Factor es cualquier variable cuyo impacto en la respuesta queremos estudiar y que podemos controlar. Nivel es el número de alternativas o ajustes para cada factor. Tratamiento o condición experimental es una combinación de factores para obtener una respuesta.

Definiciones y principios básicos Repetición se refiere al número de ocasiones que una misma condición experimental se efectúa durante la prueba. En este ejemplo, tendríamos cuatro (4) condiciones experimentales. Si cada una de las condiciones experimentales se repite el mismo número de veces, en este caso sería dos (2) veces como se presenta en la casilla superior izquierda, entonces decimos que el experimento es balanceado. De lo contrario, el experimento es considerado como desbalanceado con ciertas repercusiones que estudiaremos. Temperatura Presión X

Experimentación X y Proceso o Sistema Recursos Variables de Entrada Variables Controlables Factores Proceso o Sistema Variables de Salida Variables de Respuesta X y Recursos Personal Equipo de Medidas Otros

Experimentación Aspiramos a obtener un modelo matemático de la forma: y = f ( X ) + 

Definiciones y principios básicos Aleatoriedad se refiere al orden en que se ejecutan las condiciones experimentales durante el experimento. El objetivo de la aleatoriedad es el de ‘neutralizar’ los efectos de variables ajenas al experimento que puedan intervenir o estar presentes en el mismo. Bloque es la técnica utilizada con el fin de aumentar la precisión en un experimento. Un bloque es una porción del material experimental que debe ser más homogénea que el conjunto completo del material.

Pasos a seguir en el diseño y análisis de experimentos Reconocimiento y establecimiento del problema Selección de factores y los niveles de estos Selección de la variable respuesta Determinar el diseño experimental a llevarse a cabo Llevar a cabo el experimento Analizar los datos Conclusiones y recomendaciones Estudio de confirmación

Clasificación de variables controlables (Factores) Cualitativas (e.g Tipo de Material, Sujeto) Cuantitativas (e.g Temperatura, Presión) Variable de Respuesta (e.g producto aceptable o defectuoso) (e.g Viscosidad, Tiempo)

Modelos según las variables analizadas X Cuantitativa Cualitativa Y Diagramas de Dispersión, Regresión Análisis de Varianza Regresión Logística Tablas de contingencia

Efectos fijos vs. Efectos aleatorios Efectos fijos - el experimentador puede seleccionar los a tratamientos. En esta situación nos interesa probar la hipótesis sobre si los promedios para estos tratamientos seleccionados pueden considerarse iguales. Las conclusiones en este experimento no pueden extenderse a tratamientos que no fueron considerados en el mismo. Efectos Aleatorios - los a tratamientos pueden ser una muestra aleatoria de una población mas amplia de tratamientos. En estas circunstancias nos gustaría poder extender las conclusiones a todos los tratamientos, sin importar si todos estuvieron explícitamente considerados en el experimento. Los efectos i son considerados variables aleatorias y conocer sobre los efectos particulares tiene poca importancia. Lo que nos importa es qué % de la variabilidad total se debe a este efecto.

Pruebas de hipótesis estadísticas Las Hipótesis Estadísticas son supuestos o conjeturas acerca de cierto parámetro ( ó ) de una o más poblaciones de interés. La herramienta estadística para verificar dicho reclamo sobre el parámetro de la población se conoce como Pruebas de Hipótesis. La estructura de las Pruebas de Hipótesis está dada por la formulación de dos términos: H0: Hipótesis nula que establece el valor exacto del parámetro que queremos probar. H1: Hipótesis alterna la cual establece la posibilidad de que el valor del parámetro se encuentre entre una serie de valores distintos al establecido en H0.

Pruebas de hipótesis estadísticas El aceptar la hipótesis nula (H0) solo implica que la muestra analizada no da suficiente evidencia para refutarla. Sin embargo, rechazar la hipótesis nula implica que la muestra analizada da evidencia para rechazarla. Este rechazo da paso a la aceptación de la hipótesis alterna (H1).

Pruebas de hipótesis estadísticas Para llevar a cabo una prueba de hipótesis debemos asegurarnos de que establecemos y conocemos lo siguiente: Estadística de prueba - función de la muestra aleatoria que se utiliza para tomar una decisión en la prueba de hipótesis. Valor crítico - número que marca el límite entre aceptación y rechazo de la H0. Región de aceptación - rango marcado por el valor o valores críticos que de contener el valor de la H0 daría paso a la aceptación de la misma. Región de rechazo - rango marcado por el valor o valores críticos que de contener el valor de la H0 daría paso al rechazo de la misma.

Pruebas de hipótesis estadísticas H0 es cierto H0 es falso acepto H0 decisión correcta error tipo II rechazo H0 error tipo I Error tipo I - rechazar H0 cuando se debió aceptar. Error tipo II - aceptar la H0 cuando se debió rechazar.  - probabilidad de cometer error tipo I. ß - probabilidad de cometer error tipo II.

Pruebas de hipótesis estadísticas Potencial de la prueba (1-ß) - probabilidad de rechazar la H0 cuando se debió rechazar. Valor p - nivel mínimo al cual el valor observado de la estadística de prueba es estadísticamente significativo. El procedimiento para llevar a cabo pruebas de hipótesis es el siguiente: 1) Establezca H0. 2) Escoja la H1 apropiada. 3) Establezca . 4) Seleccione la estadística de prueba. 5) Establezca la región crítica. 6) Calcule el valor de la estadística de prueba para la muestra analizada. 7) Compare la estadística de prueba con la región crítica y decida si acepta o rechaza H0.

Concepto del Valor P (“P Value”) El valor p se define como el nivel mínimo de significancia al cual la hipótesis nula Ho sería rechazada. En el caso de la distribución F que usamos en nuestro ANOVA si: Fcalculada > Fcrítica entonces uno rechaza la hipótesis nula Ho en favor de la hipótesis alterna H1. Este concepto se ilustra en la siguiente Figura.

Concepto del Valor P (“P Value”) Como puede notarse en este caso la hipótesis nula Ho no puede ser rechazada ya que la Fcalculada < Fcrítica, de igual manera el valor p nos daría la misma decisión bajo la condición: valor p > a Por lo tanto, el valor p puede ser interpretado como la posibilidad de que la hipótesis nula no sea rechazada. Magnitudes altas del valor p estarán asociadas con no poder rechazar la hipótesis nula mientras que magnitudes bajas del valor p estarán asociadas con el rechazo de la hipótesis nula. Regularmente el valor p es comparado con el nivel a establecido para la prueba.

Concepto del Valor P (“P Value”) Usando el valor p como criterio de aceptación o rechazo de una hipótesis es como comúnmente los programas de análisis estadístico le permiten al usuario tomar una decisión. Así que, en general, si el valor p es menor que el  establecido rechazamos la hipótesis nula de lo contrario no podemos rechazar.

Pruebas de hipótesis estadísticas Ejemplo 1 La especificación para el grueso de una tableta es 0.03 mm. Se sabe que el grosor de las tabletas sigue una distribución normal con  = 0.001. Se toma una muestra aleatoria de 32 tabletas del proceso y se le mide el grosor. ¿Sería correcto decir que el grueso promedio de las tabletas en el lote es 0.03 mm?

Pruebas de hipótesis estadísticas Ejemplo 1 Observación Grosor (cm) 1 0.031 17 0.0283 2 0.0285 18 0.0291 3 0.029 19 0.0287 4 0.0279 20 5 0.0286 21 0.0309 6 0.028 22 0.0298 7 0.0305 23 0.0313 8 24 0.03 9 25 0.0289 10 0.0299 26 11 27 12 0.0295 28 0.0311 13 29 0.0293 14 0.0316 30 0.032 15 31 0.0278 16 0.0294 32 0.0319

Pruebas de hipótesis estadísticas Ejemplo 1 Para contestar la pregunta se llevará a cabo una prueba de hipótesis donde la conjetura a probar es si el grueso promedio de las tabletas que se están produciendo es 0.03 cm. Siguiendo los pasos antes discutidos comenzaremos por establecer la hipótesis nula, la alterna y el nivel  que estaremos usando. Cuando la hipótesis alterna lleva el signo de no es igual () se dice que la prueba es de dos colas. En este tipo de prueba el rango de aceptación estará dado por dos valores críticos o sus respectivos valores p. Como en este caso la distribución de los datos es normal y conocemos la desviación estándar de la población usaremos la estadística de prueba Z. H0:  = 0.03 H1:   0.03  = 0.05

Pruebas de hipótesis estadísticas Ejemplo 1 Luego de entrar los datos en Minitab y llevar a cabo los pasos apropiados para pruebas de hipótesis del promedio de una población obtendremos el siguiente análisis: Z-Test Test of mu = 0.030000 vs mu not = 0.030000 The assumed sigma = 0.00100 Variable N Mean StDev SE Mean Z P grosor 32 0.029553 0.001276 0.000177 -2.53 0.012

Pruebas de hipótesis estadísticas Ejemplo 1 Luego de verificar que el valor hipotetizado y la desviación estándar utilizada son los que entramos revisamos la estadística de prueba y su probabilidad. Como el valor p es menor que  = 0.05 rechazamos H0 y concluimos que el grueso promedio de las tabletas producidas no es igual a 0.03 cm.

Pruebas de hipótesis estadísticas Ejemplo 2 El proceso de llenado de frascos con medicina líquida fue recientemente ajustado. Se quiere saber si la cantidad dispensada en los frascos no es menor de las 12 onzas requeridas. Se sabe que las cantidades dispensadas siguen una distribución normal. El supervisor de la línea decide tomar una muestra de 10 frascos y conducir una prueba de hipótesis para determinar si la cantidad promedio dispensada no es menor de 12 onzas.

Pruebas de hipótesis estadísticas Ejemplo 2 Observación Cantidad Dispensada (oz) 1 11.52 6 12.54 2 12.3 7 12.01 3 11.1 8 10.47 4 10.8 9 11.02 5 11.64 10 12.41 A diferencia del ejemplo anterior en este caso no conocemos la desviación estándar de la población por lo tanto usaremos la estadística de prueba t. También es importante observar que lo que se quiere probar es si la cantidad promedio dispensada es menor de 12 onzas. Este tipo de prueba se conoce como de una cola donde la región de aceptación está marcada por un solo valor crítico. H0:  = 12 H1:  < 12  = 0.05

Pruebas de hipótesis estadísticas Ejemplo 2 Luego de entrar los datos en Minitab y llevar a cabo los pasos apropiados para pruebas de hipótesis del promedio de una población obtendremos el siguiente análisis: T-Test of the Mean Test of mu = 12.000 vs mu < 12.000 Variable N Mean StDev SE Mean T P onzas 10 11.581 0.723 0.229 -1.83 0.050 En este caso la prueba de hipótesis es de una cola. Como el valor p =  tenemos duda sobre qué concluir.

Pruebas de hipótesis estadísticas Ejemplo 3 En el proceso de sellado existen sospechas de que hay diferencias significativas entre las bolsas que se sellan en la máquina #1 y las que se sellan en la máquina #2. Ambas máquinas son idénticas y fueron puestas en operación al mismo tiempo. Determine si no existe diferencia significativa en el sellado de ambas máquinas.

Pruebas de hipótesis estadísticas Ejemplo 3 En este caso no sabemos las desviaciones estándar de las dos poblaciones pero asumimos que son iguales ya que las dos máquinas de sellado son idénticas y fueron puestas en producción al mismo tiempo. Como lo que nos interesa es si el trabajo producido por ambas máquinas es igual conduciremos una prueba de dos colas para promedios de dos poblaciones. H0: 1 - 2 = 0 H1: 1 - 2  0  = 0.05

Pruebas de hipótesis estadísticas Ejemplo 3 Luego de entrar los datos en Minitab y llevar a cabo los pasos apropiados para pruebas de hipótesis de promedios de dos poblaciones obtendremos el siguiente análisis: Two Sample T-Test and Confidence Interval Two sample T for esfuerzo maquina N Mean StDev SE Mean 1 11 5.482 0.529 0.16 2 13 5.508 0.587 0.16 95% CI for mu (1) - mu (2): ( -0.50, 0.45) T-Test mu (1) = mu (2) (vs not =): T = -0.11 P = 0.91 DF = 21

Pruebas de hipótesis estadísticas Ejemplo 3 Two Sample T-Test and Confidence Interval Two sample T for esfuerzo maquina N Mean StDev SE Mean 1 11 5.482 0.529 0.16 2 13 5.508 0.587 0.16 95% CI for mu (1) - mu (2): ( -0.50, 0.45) T-Test mu (1) = mu (2) (vs not =): T = -0.11 P = 0.91 DF = 22 Both use Pooled StDev = 0.561 Como el valor p es mayor que  concluimos que no existe suficiente evidencia para rechazar H0. Por lo tanto es razonable decir que no existe diferencia significativa en el sellado de ambas máquinas. Este análisis se pudo haber llevado a cabo mediante una ANOVA obteniendo los mismos resultados. Esta herramienta será discutida luego en detalle. Es interesante señalar que la estadística de prueba de la ANOVA (F-Ratio) es igual al cuadrado de la estadística de prueba t usada en la prueba de hipótesis.

Pruebas de hipótesis estadísticas Ejemplo 4 Se desea determinar si el utilizar azúcar marca B en el proceso de compactación de tabletas causará una dureza de tableta que en promedio exceda por 2 unidades la dureza obtenida cuando se utiliza azúcar marca A. La dureza de las tabletas sigue una distribución normal.

Pruebas de hipótesis estadísticas Ejemplo 4 Azúcar A Azúcar B 7.1 9.6 6.9 9.4 7.3 8.9 7.5 10.1 7.2 9.7 6.8 10.6 8.8 9.5 7.4 9.9 7.8 9.3 9.1 10.9 10.2

Pruebas de hipótesis estadísticas Ejemplo 4 Al igual que en el ejemplo anterior no sabemos las desviaciones estándar de las dos poblaciones. Pero a diferencia de ese caso asumimos que no son iguales ya que las dos marcas de azúcar son distintas. Para revisar si en realidad la diferencia en la dureza promedio es mayor de 2 conduciremos una prueba de una cola para promedios de dos poblaciones. H0: A - B = -2 H1: A - B > -2  = 0.05

Pruebas de hipótesis estadísticas Ejemplo 4 Luego de entrar los datos en Minitab y llevar a cabo los pasos apropiados para pruebas de hipótesis de promedios de dos poblaciones obtendremos el siguiente análisis: Two Sample T-Test and Confidence Interval Two sample T for Dureza azucar N Mean StDev SE Mean A 15 7.200 0.278 0.072 B 15 9.633 0.621 0.16 95% CI for mu (A) - mu (B): ( -2.801, -2.07) T-Test mu (A) = mu (B) (vs >): T = -13.86 P = 1.0 DF = 19 Como el valor p es mayor que  para una diferencia de promedios estimada de -2.43 no podemos rechazar H0.

Pruebas de hipótesis estadísticas Ejemplo 5 Se desea determinar si un programa de adiestramiento en seguridad ocupacional contribuyó a disminuir el número de accidentes reportados en 10 celdas de manufacturas.

Pruebas de hipótesis estadísticas Ejemplo 5 Dado que las dos muestras no son independientes si no que son medidas de lo mismo en dos tiempos distintos se debe llevar a cabo la "paired t-Test" para determinar si el adiestramiento ha sido efectivo en reducir la cantidad de accidentes. H0: D = 0 H1: D > 0  = 0.05

Pruebas de hipótesis estadísticas Ejemplo 5 Luego de entrar los datos en Minitab y llevar a cabo los pasos apropiados para la "paired t-Test" obtendremos el siguiente análisis: Paired T-Test and Confidence Interval Paired T for Antes - Despues N Mean StDev SE Mean Antes 10 53.8 32.1 10.1 Despues 10 48.6 31.0 9.8 Difference 10 5.20 4.08 1.29 95% CI for mean difference: (2.28, 8.12) T-Test of mean difference = 0 (vs > 0): T-Value = 4.03 P-Value = 0.001

Pruebas de hipótesis estadísticas Ejemplo 5 T-Test of the Mean Test of mu = 0.00 vs mu > 0.00 Variable N Mean StDev SE Mean T P Diferenc 10 5.20 4.08 1.29 4.03 0.0015 Dado que el valor p es menor que  se rechaza H0 y concluimos que el programa ha sido efectivo. La cantidad promedio de accidentes era mayor antes que después del adiestramiento.

Modelos según las variables analizadas Modelo de ANOVA para un factor: yij =  + i + eij Modelo de regresión de un factor: yij = bo + b1 X + eij

Ejemplo de ensamblajes Objetivo de la Prueba: ensamblar tres carritos similares, cuya diferencia estriba en el número de piezas que cada uno contiene. Los carritos son de 24, 28 y 32 piezas respectivamente. Tres personas son reclutadas para efectuar el ensamblaje y los nombraremos X, Y, Z . La variable respuesta a medirse es el tiempo de ensamblaje y lo que se quiere determinar es si existe diferencia en este tiempo como función del número de piezas del carrito.

Ejemplo de ensamblaje Algunas configuraciones posibles para efectuar la prueba : Efectos Fundidos (Configuración 1) X Y Z 24 28 32 24 28 32 En esta configuración no es posible separar el efecto del número de piezas del carrito de la persona que lo ensambla. En la jerga experimental diríamos que el efecto número de piezas se encuentra completamente fundido con la persona y no puede separarse.

Ejemplo de ensamblaje Completamente Aleatorio (Configuración 2) X Y Z 24 28 24 28 32 32 24 28 32 En esta configuración note que el efecto del número de piezas y la persona se encuentran parcialmente fundidos. Si el/la ensamblador/a Z fuese muy diestro/a entonces tal vez se beneficiaría el carrito con el mayor número de piezas.

Ejemplo de ensamblaje Restricción en aleatoriedad (Configuración 3) X Y Z 24 24 24 28 28 28 32 32 32 En esta configuración se rompe la relación entre el número de piezas y quien ensambla ya que todos los ensambladores trabajan con todos lo carritos. La preocupación en este esquema resulta de la posibilidad de que exista un efecto de fatiga o por el contrario de aprendizaje que perjudicaría o beneficiaría el carrito de 32 piezas según fuese el caso.

Ejemplo de ensamblaje Bloque Completamente Aleatorio (Bloqueado Sujeto) (Configuración 4) X Y Z 28 24 28 24 28 24 32 32 32 En esta configuración, establecida de asignar los tratamientos aleatoriamente a los ensambladores, asegurando que cada ensamblador ve cada carrito, entramos en el mismo conflicto que en la configuración II, en donde puede existir por causas fortuitas efectos parcialmente fundidos. Un posible ejemplo de esto se muestra en esta configuración IV. Lo mismo sucedería si estableciéramos que en vez de asignar aleatoriamente los carritos por ensamblador, los asignáramos aleatoriamente por orden de ensamblaje esto se presenta en la configuración V.

Ejemplo de ensamblaje Bloque Completamente Aleatorio (Bloqueado el orden) (Configuración 5) X Y Z 24 28 32 28 32 24 Note que en esta configuración los ensambladores podrían ver más de una vez uno de los carritos y no trabajar con alguno de ellos. Cuadrado Latino (Configuración 6) X Y Z 24 28 32 28 32 24 32 24 28 En esta configuración notamos como todos los ensambladores trabajan con todos los carritos y a la misma vez todos los carritos son ensamblados en distinto orden.

Análisis de varianza (ANOVA) Las pruebas de hipótesis estudiadas son métodos que comparan dos tratamientos. Sin embargo, muchos experimentos requieren comparaciones de más de dos tratamientos simultáneamente. Tome como ejemplo un factor con 5 niveles o tratamientos, si usted realiza pruebas por parejas, entonces tendrá 10 pruebas que realizar. Considere ahora que usted estableció .05 como su error Tipo I, entonces la probabilidad de aceptar su hipótesis nula correctamente en cada prueba individual es 1 - .05 = 0.95. Si decimos que las pruebas son independientes, la probabilidad de aceptar la hipótesis nula correctamente en las 10 pruebas será de (0.95)10 = 0.60. El procedimiento apropiado para probar la igualdad de varias medias o promedios se conoce como análisis de varianza o ANOVA.

Análisis de varianza (ANOVA) ANOVA - este nombre proviene del inglés ‘Analysis of Variance’ y el objetivo fundamental es el de descomponer la variabilidad total en sus distintos componentes. Considere la siguiente Tabla para un experimento de un solo factor con n repeticiones en cada uno de los a tratamientos :

Análisis de varianza (ANOVA)

Análisis de varianza (ANOVA) Al igual que la suma de cuadrados los grados de libertad se descomponen de forma aditiva como presenta la siguiente relación: glTOTAL = glTratamientos + glError an – 1 = (a – 1) + (an – a) N – 1 = (a – 1) + (N – a) De la descomposición presentada en la página anterior podemos construir lo que conocemos como la Tabla de Anova. Para esto debemos primero recordar que podemos estimar los componentes de la varianza usando la siguiente relación:

Analisis de varianza (ANOVA) SSTotal Total N-a SSError Error (dentro) a-1 SSTratamientos Tratamientos (entre) Estadística F Promedio de Cuadrados Grados de Libertad Suma de Cuadrados Fuente

Análisis de varianza (ANOVA) La prueba de hipótesis bajo estas condiciones puede formularse: Ho: 1 = 2 = 3 = …. = a = 0 H1: 1  0 para al menos una i i = 1, 2, 3, …, a Una forma alterna para formular la hipótesis sería: Ho : 1 = 2 = 3 = …. = a H1 : i  j para al menos una combinación (i, j) Dado que las presunciones de Anova se cumplen, Rechazamos Ho si FC > F .

Presunciones de ANOVA Para efectuar la prueba de hipótesis que acabamos de describir establecemos las siguientes presunciones: Los errores son variables aleatorias independientes y están normalmente distribuidos promedio cero y varianza constante 2. La varianza 2 se presume constante para todos los niveles del factor.

Métodos gráficos para cotejar la idoneidad del modelo Definimos el residual de la observación j dentro del tratamiento i : eij = yij - donde este último término corresponde al estimado del modelo para la observación correspondiente. Trazo de Probabilidad Normal (Normal Probability Plot) Cotejamos la normalidad de los residuales Trazo de Residuales en Secuencia de Tiempo – nos ayuda en detectar alguna correlación existente entre los residuales, por lo tanto, trabaja con la presunción de independencia de los residuales. En ocasiones, este gráfico podrá mostrarnos cuando una variable no considerada en el experimento intervino en el mismo.

Métodos gráficos para cotejar la idoneidad del modelo Trazo de Residuales vs. Factores – nos ayuda en detectar de forma clara en muchas ocasiones desviaciones a la presunción de varianza constante. Trazo de Residuales vs. Valores Estimados – este trazo no debe mostrar ninguna estructura para reconocer que tenemos un modelo adecuado y que las presunciones del mismo se cumplen. Ayuda a detectar valores influyentes (“outliers”).

Análisis de varianza (ANOVA) Ejemplo El efecto de la geometría de un transportador de tabletas (“sinker”) en el tiempo de disolución de las tabletas es estudiado. Las tabletas son sumergidas en un baño en un medio específico luego de ser colocadas en los “sinkers” y el tiempo de disolución es capturado. “Sinker Geometry” G1 G2 G3 G4 G5 98 95 91 101 94 99 84 100 89 88 96 83 103 75

Análisis de varianza (ANOVA) Ejemplo One-way ANOVA: % Diss versus Sinker Source DF SS MS F P Sinker 4 811.8 202.9 16.53 0.000 Error 20 245.6 12.3 Total 24 1057.4 S = 3.504 R-Sq = 76.77% R-Sq(adj) = 72.13%

Análisis de varianza (ANOVA) Ejemplo

Análisis de residuales Usando métodos gráficos para el análisis de residuales podemos cotejar la idoneidad del modelo. Trazo de Probabilidad Normal (Normal Probability Plot) Una inspección visual de este gráfico no revela ninguna desviación significativa de la presunción de normalidad para los residuales.

Análisis de residuales Trazo de Residuales vs. Orden de Experimentación Ningún patrón aparente se muestra en el mismo.

Pruebas después de ANOVA Diferencia Mínima Significativa (Least Significant Difference) Después que Anova rechaza la Hipótesis nula entonces queremos hacer pruebas con la siguiente formulación: Ho: i = j para toda i  j Esto puede realizarse empleando la estadística t

Pruebas después de ANOVA Si presumimos una prueba en dos direcciones (dos colas), declararemos que una pareja de promedios i, j será signifcativamente diferente si: A la expresión de la derecha es a lo que conocemos como la diferencia mínima significativa (LSD). En resumen decimos que una pareja de promedios i, j difieren si:

Pruebas después de ANOVA Fisher 95% Individual Confidence Intervals All Pairwise Comparisons among Levels of Sinker Simultaneous confidence level = 73.57% Sinker = G1 subtracted from: Sinker Lower Center Upper +---------+---------+---------+--------- G2 -9.223 -4.600 0.023 (---*----) G3 -18.623 -14.000 -9.377 (----*----) G4 -3.823 0.800 5.423 (----*---) G5 -3.623 1.000 5.623 (----*----) +---------+---------+---------+--------- -20 -10 0 10 Sinker = G2 subtracted from: Sinker Lower Center Upper +---------+---------+---------+--------- G3 -14.023 -9.400 -4.777 (----*---) G4 0.777 5.400 10.023 (---*----) G5 0.977 5.600 10.223 (----*---) Sinker = G3 subtracted from: Sinker Lower Center Upper +---------+---------+---------+--------- G4 10.177 14.800 19.423 (----*---) G5 10.377 15.000 19.623 (----*----) Sinker = G4 subtracted from: Sinker Lower Center Upper +---------+---------+---------+--------- G5 -4.423 0.200 4.823 (---*----)

Bloque completamente aleatorio En muchos problemas experimentales, es necesario diseñar de forma tal que la variabilidad causada por fuentes ajenas a nuestro interés pueden ser sistemáticamente controladas. Cuando existe una sola fuente extraña (ajena) a nuestro interés, decimos que esa fuente o ese factor debe ser “bloqueado” con el fin de alejar su variabilidad del error experimental y así poder reducir el mismo. Experimentos de este tipo se conocen como Bloque Completamente Aleatorio. yij =  + i + j + ij  = promedio general i = efecto del bloque j = efecto del tratamiento j ij = error o residual

Bloque completamente aleatorio Ejemplo Suponga que en el ejemplo de los “sinkers” existen cinco baños (“vessels”) en dende se sumerjen los mismos. Los datos obtenidos se presentan en la siguiente tabla: “Sinker Geometry” Vessel G1 G2 G3 G4 G5 1 98 95 91 101 94 2 99 84 100 3 89 88 4 96 83 103 5 75

Bloque completamente aleatorio Ejemplo Considerando tanto la “sinkers” como los baños en ANOVA, obtenemos la siguiente gráfica: Analysis of Variance for %DISSOLUTION, using Adjusted SS for Tests Source DF Seq SS Adj SS Adj MS F P Vessel 4 34.56 34.56 8.64 0.66 0.632 Sinker 4 811.76 811.76 202.94 15.39 0.000 Error 16 211.04 211.04 13.19 Total 24 1057.36 S = 3.63180 R-Sq = 80.04% R-Sq(adj) = 70.06%

Cuadrado Latino Diseño utilizado cuando existen dos fuentes de variación ajenas o extrañas a nuestro interés y se quiere controlar las mismas de forma sistemática para así poder disminuir el error experimental. Decimos entonces que si “bloqueamos” dos fuentes de variabilidad podemos tener un diseño cuadrado latino. Yijk =  + i + j + k + ijk  = promedio general i = efecto del bloque columna j = efecto del bloque fila k = efecto del tratamiento K ijk = error o residual

Cuadrado Latino - Ejemplo Un ingeniero investiga el efecto de cuatro métodos de ensamblaje (A, B, C, D) en el tiempo necesario para ensamblar un componente utilizado en televisores. Cuatro operadores son seleccionados para el estudio. Cada ensamblaje puede producir algo de fatiga por lo que el orden en que los operadores usen los distintos métodos puede afectar el tiempo. Los datos recopilados se presentan a continuación. Operador Orden 1 2 3 4 C = 10 D = 14 A = 7 B = 8 B = 7 C = 18 D = 11 A = 8 A = 5 B = 10 C = 11 D = 9 D = 10 A = 10 B = 12 C = 14

Cuadrado Latino - Ejemplo Considerando sólo el método como fuente de variación, obtenemos el siguiente resultado. One-way Analysis of Variance Analysis of Variance for Tiempo Source DF SS MS F P Metodo 3 72.50 24.17 3.60 0.046 Error 12 80.50 6.71 Total 15 153.00 Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -------+---------+---------+--------- A 4 7.500 2.082 (-------*-------) B 4 9.250 2.217 (-------*-------) C 4 13.250 3.594 (-------*-------) D 4 11.000 2.160 (-------*-------) -------+---------+---------+--------- Pooled StDev = 2.590 7.0 10.5 14.0

Cuadrado Latino - Ejemplo Considerando operador, orden y métodos como fuentes de variación, obtenemos el siguiente resultado. General Linear Model Factor Type Levels Values Metodo fixed 4 A B C D Operador fixed 4 1 2 3 4 Orden fixed 4 1 2 3 4 Analysis of Variance for Tiempo, using Adjusted SS for Tests Source DF Seq SS Adj SS Adj MS F P Metodo 3 72.500 72.500 24.167 13.81 0.004 Operador 3 51.500 51.500 17.167 9.81 0.010 Orden 3 18.500 18.500 6.167 3.52 0.089 Error 6 10.500 10.500 1.750 Total 15 153.000

Experimentos Factoriales Muchos experimentos envuelven el estudio de los efectos de dos o más factores. Puede demostrarse que, en general, los diseños factoriales son los más eficientes para este tipo de experimentos. Definimos un Experimento Factorial como uno en donde existen dos o más factores, en donde todas las condiciones experimentales son llevadas a cabo de forma completamente aleatoria.

Experimentos Factoriales Características de los experimentos factoriales: Dos o más factores son considerados. Todas las posibles combinaciones de los niveles de los factores son investigadas. Son más eficientes que variar un factor a la vez (lo veremos). Son necesarios cuando las interacciones están presentes (lo veremos). Las unidades son sometidas a los distintos tratamientos de forma completamente aleatoria. Nos permite estimar los efectos de un factor a través de distintos niveles de otros factores, logrando conclusiones válidas en un rango de condiciones experimentales.

Experimentos Factoriales 2 x 2 x 2 - 23 2 x 2 x 2 x 2- 24 2 x 2 x 2 x 2 x 2 - 25

Experimentos Factoriales No se observa Variando un factor a la vez 2 x 2 x 2 - 23 Factorial No se observan Variando un factor a la vez

Experimentos Factoriales Interacción – No Presente Interacción – Presente B- B- B+ Respuesta B+ A- A+ A- A+ A A

Conceptos fundamentales del modelo lineal de regresión y = 0 + 1 X1 + 2 X2 + 3 X1 X2 +  Vector Observaciones Matriz de Diseño Vector Coeficientes Vector Errores y = X +  Típicamente Matriz Diagonal Estimado de Coeficientes

Introducción a los experimentos factoriales - Ejemplo El efecto de un factor se define como el cambio promedio en la respuesta, cuando cambiamos los niveles del mismo. De forma similar definimos el contraste de un factor como el cambio total en la respuesta cuando los niveles de éste son cambiados.

Introducción a los experimentos factoriales – Ejemplo 1 Factorial Considere la siguiente tabla que muestra el experimento factorial más pequeño posible, dos factores cada uno a dos niveles. En el mismo, cuatro repeticiones fueron tomadas en cada condición experimental Factor B Factor A 1 2 145, 148, 147, 140 total = 580 135, 138, 141, 139 total = 553 158, 152, 155, 152 total = 617 150, 152, 146, 149 total = 597

Introducción a los experimentos factoriales - Ejemplo 1 Factorial Definimos los efectos y contrastes de la siguiente manera: EFECTOA = [(617 + 597) - (580 + 553)] / 8 = 10.125 CONTRASTEA = [(617 + 597) - (580 + 553)] = 81 EFECTOB = [(553 + 597) - (580 + 617)] / 8 = -5.875 CONTRASTEB = [(553 + 597) - (580 + 617)] = 47

Introducción a los experimentos factoriales – Ejemplo 1 Factorial En algunos experimentos existe la posibilidad de encontrar que la diferencia en la respuesta entre los niveles de un factor no es la misma a todos los niveles de los otros factores. Cuando esto ocurre decimos que la interacción entre los factores considerados está presente. EFECTOAB = [(597 + 580) - (617 + 653)] / 8 = .875 CONTRASTEAB = [(597 + 580) - (617 + 653)] = 7

Introducción a los experimentos factoriales – Ejemplo 1 Factorial El efecto de A es positivo esto implica que cambiar este factor de su nivel 1 al 2 aumenta la respuesta. El factor B en cambio, al ser negativo disminuye la respuesta cuando cambiamos de su nivel 1 al 2. El efecto de la interacción entre los dos factores podríamos decir que es despreciable cuando se comparan con los factores principales. Cuando K factores son considerados a dos niveles en un experimento factorial, a este tipo de experimento le llamamos experimentos factoriales 2K. Para estos experimentos podemos obtener la suma de cuadrados para cada una de las fuentes de variación usando la siguiente relación: donde n es el número de repeticiones en cada condición experimental y K es el número de factores considerados en el experimento.

Introducción a los experimentos factoriales – Ejemplo 1 Factorial A continuación se presenta la tabla de ANOVA para el experimento descrito provista por MINITAB. Note que la misma suma de cuadrados para el factor A se hubiese obtenido usando:

Introducción a los experimentos factoriales – Ejemplo 1 Factorial De la tabla ANOVA podemos concluir que la interacción en este caso no resulta relevante, el ‘valor p’ que se obtuvo para el término de la interacción es .556. Gráficamente esto se muestra en la siguiente Figura. Como puede observarse independientemente del nivel de A, la respuesta disminuye cuando el factor B es ajustado a su nivel 2. Mientras más paralelas estas líneas menos presente estará la interacción de los factores.

Introducción a los experimentos factoriales – Ejemplo 1 Factorial En la próxima Figura se muestra el comportamiento de los factores principales a través de sus pendientes. Note la pendiente positiva para el factor A, así como la pendiente negativa para el factor B. También se observa una pendiente más inclinada para el factor A que para el B como muy bien indicaban los efectos para estos factores (10.125, para A y -5.875 para B).

Introducción a los experimentos factoriales – Ejemplo 1 Factorial Resulta muy sencillo convertir los estimados de los efectos de un diseño factorial 2K en un modelo de regresión que puede ser utilizado para predecir la respuesta en cualquier punto del espacio contenido dentro de la región experimental. Como podemos notar en la figura anterior, la pendiente o coeficiente se obtendría de dividir efecto (y) / 2.

Conceptos fundamentales del modelo lineal de regresión Considere la siguiente figura para el próximo ejemplo , en esta situación observamos como el factor Temperatura tiene una influencia mayor sobre la variable respuesta (Dureza) si se compara con el otro factor del experimento, el factor Presión. Decimos esto por que la variable Temperatura tiene una pendiente mucho más inclinada que la presentada por el factor Presión. Nos resulta entonces relevante determinar las pendientes de los factores de interés en el experimento como un método para comparar su importancia a la hora de explicar la variable respuesta.

Conceptos fundamentales del modelo lineal de regresión Un método para determinar estas pendientes y establecer un modelo matemático es lo que conocemos como el modelo de regresión. Para la situación presentada, si se considera un modelo lineal, el modelo de regresión sería: y = 0 + 1 X1 2 X2 +  donde X1 y X2 representan los factores del experimento, las ´s representan los coeficientes del modelo de regresión y  representa el error o residuo del modelo.En formato de matrices el modelo de regresión puede ser representado así: y = X +  donde

Conceptos fundamentales del modelo lineal de regresión En general y es un vector (n x 1) de las observaciones del experimento, X es la matriz de diseño (n x p) de los niveles de las variables independientes o factores del experimento,  es un vector (p x 1) de los coeficientes del modelo de regresión y  es un vector (n x 1) de errores o residuales.

Conceptos fundamentales del modelo lineal de regresión Nuestro objetivo al construir un modelo de regresión lineal es el de estimar los coeficientes  basándonos en algún criterio. El criterio más utilizado es el de minimizar la suma del cuadrado de los errores. En otras palabras, queremos encontrar aquellos estimadores de los coeficientes que minimicen pero L puede ser expresada

Conceptos fundamentales del modelo lineal de regresión el término es un escalar así como su transpuesta, por esta razón podemos agrupar el segundo término de esta manera. La derivada de L con respecto a  resulta en: lo que simplifica a entonces los estimadores para los coeficientes que minimizan la suma del cuadrado de los errores se obtienen

Conceptos fundamentales del modelo lineal de regresión Las propiedades de la varianza de b se expresan mediante la matriz de varianza-covarianza. Esta es una matriz simétrica de tamaño (p x p) cuyos elemento jj de la diagonal es la varianza de bj y cuyo elemento (i, j) representa la covarianza entre los elementos bi y bj. La matriz de covarianza del vector b esta dada por

Conceptos fundamentales del modelo lineal de regresión Con regularidad será necesario estimar 2. Para desarrollar un estimador de este parámetro considere la suma de cuadrados del residual que está dada por

Conceptos fundamentales del modelo lineal de regresión Se puede demostrar que E(SSE) = 2 (n - p), por lo que un estimador no sesgado para = 2 está dado por

Conceptos fundamentales del modelo lineal de regresión Suponga que se realiza el siguiente experimento para el ejemplo donde se mide la dureza como función de temperatura y presión en un proceso. Note que se tomó una observación en cada una de cuatro condiciones experimentales (la respuesta obtenida se muestra en paréntesis).

Conceptos fundamentales del modelo lineal de regresión El siguiente es el modelo lineal de regresión obtenido de MINITAB al ejecutar los comandos <<Stat>> y <<Regresión>>: Dureza = 30.0 - 0.0900 Temperatura + 0.300 Presión cuando los datos fueron entrados en las siguientes tres columnas

Conceptos fundamentales del modelo lineal de regresión Resulta de interés responder las siguientes dos preguntas con respecto al modelo lineal presentado. ¿ Qué interpretación física le podemos dar a la constante (ó intercepto como comúnmente llamamos) en el modelo? De examinar el modelo, ¿podría usted concluir que factor tiene mayor impacto en la dureza, Temperatura o Presión?

Conceptos fundamentales del modelo lineal de regresión En el caso de la primera pregunta, la interpretación que comúnmente damos a un intercepto no es aplicable en este caso porque ninguno de los rangos de experimentación para los factores incluyen el cero que es lo usamos de referencia para interpretar el intercepto. Las escalas de los niveles de los factores no se espera que coincidan porque miden distintas características por lo que los coeficientes de los factores no son comparables. Este es el caso, en este modelo aunque el plano de la figura que inicia esta sección muestra que la Temperatura es más influyente que la Presión, eso no parece verse reflejado en el modelo cuando notamos que el coeficiente para Presión es .30 mientras que el coeficiente de Temperatura es -.09. Esto es una consecuencia de las escalas.

Conceptos fundamentales del modelo lineal de regresión Por las dos razones expuestas y por otras que iremos descubriendo más adelante en el curso en los modelos lineales preferimos usar variables codificadas. La relación entre las variables naturales (medidas en su escala original) y las variables codificadas está dada por : donde es la variable codificada, es la variable natural y es el promedio de los niveles de la variable a ser codificada. Cuando las variables naturales tienen sólo dos niveles cómo es el caso de los experimentos 2K, la codificación va a producir niveles + 1 para las variables codificadas. Para ilustrar este procedimiento en nuestro ejemplo, note que

Conceptos fundamentales del modelo lineal de regresión lo que resultaría en una nivel + 1 para el nivel alto de la variable codificada y un nivel -1 para el nivel bajo de la variable codificada. La siguiente tabla muestra las columnas entradas con las variable codificadas y la respuesta en MINITAB para el ejemplo de la dureza para las variable codificadas.

Conceptos fundamentales del modelo lineal de regresión Estas columnas corresponden al mismo diseño en la región de las variables codificadas como se presenta en la siguiente Figura. Usando las variables codificadas el siguiente es el modelo lineal de regresión obtenido de MINITAB al ejecutar los comandos <<Stat>> y <<Regresión>> : Dureza = 25.5 - 4.50 Temperatura + 3.00 Presion

Conceptos fundamentales del modelo lineal de regresión Los problemas que observamos con el modelo basado en las variables naturales han sido corregidos con el uso de variables codificadas. La constante 25.5, es ahora el valor de dureza esperado cuando ambas variables se encuentran en el valor nominal o el nivel medio de cada variable. Por otro lado ahora los coeficientes son comparables pues se encuentran en la misma escala. Note como el factor Temperatura tiene una pendiente negativa pero con magnitud mayor a la del factor Presión como lo confirma la gráfica original del plano del modelo lineal para este ejemplo.

Conceptos fundamentales del modelo lineal de regresión Suponga ahora que intentamos un modelo que no incluya la variable Presión por no considerarla significativa. La siguiente tabla muestra cuatro modelos, dos con variables naturales y dos con variables codificadas y en cada una de estas clasificaciones, modelos con el factor Temperatura solamente, con el factor Presión solamente y modelos con ambos factores: Temperatura y Presión.

Conceptos fundamentales del modelo lineal de regresión Otra de las ventajas de la codificación de los datos puede observarse de los modelos en la tabla. Note como los coeficientes del modelo codificado no cambian independientemente del modelo considerado. Lo mismo no puede decirse del modelo con las variables naturales, note como la constante cambia según cambiamos el modelo lineal de regresión. Frecuentemente nos interesa probar las hipótesis para distinguir qué coeficientes dentro del modelo de regresión son significativos. La hipótesis para probar la significación de cualquier coeficiente j, estaría dado por H0: j = 0 H1: j  0

Conceptos fundamentales del modelo lineal de regresión Si esta hipótesis no es rechazada, esto indicaría que la variable j, asociada con este coeficiente puede ser eliminada del modelo. La estadística de prueba para efectuar dicha prueba está dada por donde Cjj es el elemento de la diagonal de la matriz de varianza-covarianza (X’X)-1 correspondiente al coeficiente bj. La hipótesis nula H0: j = 0 se rechaza si |t0| > t/2, n- k -1.

Conceptos fundamentales del modelo lineal de regresión El siguiente es el producto de MINITAB para nuestro Ejemplo Factorial 1. Note a través de los valores p, que este resultado coincide con la ANOVA del Ejemplo Factorial 1. Existe esta correspondencia entre análisis por medio de regresión y el análisis por ANOVA.

Algunos conceptos relevantes en la experimentación CONCEPTO DE EFECTOS FUNDIDOS Considere la siguiente situación: Una prueba se conduce para determinar el efecto que pueda tener la Temperatura y la Presión en la dureza de un material, esta descripción es consistente con el segundo ejemplo factorial. Las respuestas para los tratamientos aparecen en paréntesis junto al círculo que indica la condición experimental efectuada. Suponga que el experimento consiste de los siguientes dos tratamientos.

Algunos conceptos relevantes en la experimentación

Algunos conceptos relevantes en la experimentación Pregunta : ¿ Porqué la dureza del material aumenta ? Respuesta : No sabemos, los efectos Presión y Temperatura están fundidos o lo que es igual, no pueden ser separados en este experimento. En la figura que sigue se muestra uno de todos los posibles planos que pueden describir las respuestas obtenidas. Matemáticamente esto puede notarse de la matriz de diseño X para este experimento. Primero estamos tratando de resolver 3 desconocidas, intercepto y dos coeficientes, con sólo dos ecuaciones y eso no es posible. Por otro lado, note que la columna 3 es cinco veces la columna 2, por lo que la matriz X’X no tendría inversa, el sistema no brindaría una solución única.

Algunos conceptos relevantes en la experimentación La matriz de diseño de las variables codificadas XC , muestra la dependencia lineal de forma más clara. Puede notarse como las columnas 2 y 3 son idénticas.

Algunos conceptos relevantes en la experimentación Para resolver el primero de los dos problemas mencionados suponga que añadimos un tercer punto a lo largo de la línea entrecortada como se muestra en la siguiente figura:

Algunos conceptos relevantes en la experimentación Este tercer punto no resolvería nada del segundo problema que estamos tratando, todavía muchos planos pasarían por estos tres puntos. Decimos pues, que aún ambos factores: Temperatura y Presión completamente fundidos. Al examinar la matriz X para este diseño nos percatamos que las columnas son linealmente dependientes. Esto es la columna 3 otra vez es cinco veces la columna 2 cuando consideramos las variables naturales mientras que la columna 2 y la 3 vuelven a ser idénticas cuando se trabaja con variables codificadas.

Algunos conceptos relevantes en la experimentación Como podemos notar esto sucede porque los tratamientos considerados en la experimentación están alineados. Una alternativa que podemos considerar es la de mover un punto fuera de la línea entrecortada. El diseño de la siguiente figura muestra el punto del medio movido fuera de la línea.

Algunos conceptos relevantes en la experimentación Este plano está definido de forma única, así que las pendientes o efectos de ambos factores podrán ser determinadas. No obstante, este plano no es muy estable y pequeñas variaciones en la variable respuesta harán que el plano potencialmente cambie de forma drástica. Se puede señalar que para esta situación los efectos están parcialmente fundidos pero no completamente fundidos como resultaban en el caso 1 y caso 2. Este concepto puede observarse de la matriz (X’X)-1 cuyos elementos en la diagonal representan el estimado de varianza para el coeficiente b correspondiente mientras que los elementos fuera de la diagonal en esta matriz representan las covarianzas entre los correspondientes coeficientes. Por lo tanto, una condición deseable para la matriz (X’X)-1 es que la misma sea una matriz diagonal. Más adelante los experimentos factoriales 2K balanceados cumplen con esta condición.

Algunos conceptos relevantes en la experimentación Regresando al caso 3 de la Figura 9, la siguiente es la matriz de diseño X. De esta matriz obtenemos la matriz (X’X)-1. Los elementos fueran de la diagonal muestran que existe una relación parcial entre los coeficientes.

Algunos conceptos relevantes en la experimentación Este concepto también pudo haber sido observado con las variables codificadas. Para este caso la matriz de diseño Xc sería Lo que resultaría en una matriz (XC’XC)-1. Donde nuevamente pueden observarse que los elementos de la diagonal no todos exhiben cero.

Algunos conceptos relevantes en la experimentación El impacto de que los coeficientes estén parcialmente fundidos puede observarse de tratar varios modelos incluyendo todas las variables y modelos que incluyen algunas de ellas. Cuando la relación entre las variables es alta notaremos como los coeficientes pueden cambiar drásticamente no sólo en magnitud si no también en dirección. Para el caso 3 los siguientes son tres modelos cuando consideramos las variables codificadas: La interpretación de estos modelos ahora es compleja, ¿cuál es el modelo razonable?, el factor Temperatura ¿tendrá realmente un efecto positivo o negativo sobre la respuesta?. Ante la dificultad de responder a estas preguntas señalamos que la estrategia que seguimos de separar un punto, como lo hicimos en el caso 3, no fue tan buena estrategia.

Algunos conceptos relevantes en la experimentación La figura que sigue muestra un nuevo diseño para la misma situación incluyendo cuatro puntos. Los puntos se han colocado en los extremos de la región experimental, obteniendo así un diseño muy estable. Este diseño corresponde a un experimento factorial 2k, como ya habíamos visto en la sección anterior.

Algunos conceptos relevantes en la experimentación En variables codificadas, la siguiente es la matriz de diseño XC, Lo que resultaría en una matriz (XC’XC)-1

Algunos conceptos relevantes en la experimentación Como puede observarse los coeficientes en este caso no tendrán influencia sobre los demás, resultando en el mismo estimado del coeficiente independiente del modelo lineal considerado. Así puede comprobarse de los siguientes modelos obtenidos de MINITAB para este diseño: Con este ejemplo hemos intentado cubrir algunos aspectos fundamentales de la experimentación, lo relevante de las variables codificadas, las características de la matriz (X’X)-1, los elementos positivos de los experimentos factoriales , y otras consideraciones.

Experimentos 2k con una sola réplica El número de tratamientos necesarios para conducir experimentos factoriales aún para experimentos con un número moderado de factores es bastante alto. Por ejemplo, cinco factores requerirían 32 tratamientos, seis necesitarían 64 tratamientos, etc. Debido a que los recursos son regularmente limitados muy pocas veces podemos tomar muchas repeticiones en cada condición experimental. Más aún, en algunas ocasiones todo lo que nos permite el presupuesto es realizar una sola observación en cada condición experimental. Cuando esto sucede no tenemos estimado del error.

Experimentos 2k con una sola réplica Para este problema, Daniels sugiere trazar los estimados de los efectos en un gráfico de probabilidad normal. Los efectos no significativos, según este autor, estarán normalmente distribuidos, con promedio cero (0) y varianza 2 y además van a tender a formar una línea recta en el gráfico. Aquellos factores que sean significativos, en cambio, tendrán promedios distintos de cero y se alejarán de la línea formada por los no significativos. Veamos el Ejemplo Factorial 3: Un experimento 24 con una sola observación por tratamiento se conduce para ver el impacto que tienen en la razón de filtración de un producto los factores: A (Temperatura), B (Presión), B (Concentración de Compuesto) y D (Velocidad de Agitado).

Experimentos 2k con una sola réplica La siguiente figura, muestra las 16 respuestas obtenidas del experimento que se ejecutó de forma completamente aleatoria

Experimentos 2k con una sola réplica Siguiendo el procedimiento recomendado por Daniels es necesario obtener el estimado de los efectos para todas las fuentes de variación. EL siguiente es el resultado de MINITAB para un experimento como el descrito.

Experimentos 2k con una sola réplica Como podemos notar simplemente observando la magnitud de estos efectos parecen distinguirse los efectos: A, C, D, AC y AD. El gráfico de probabilidad normal para estos efectos se muestra en la figura que se muestra a continuación.

Experimentos 2k con una sola réplica Usando este análisis los efectos que emergen del mismo como relevantes o significativos vuelven a ser los efectos principales A, C, D y las interacciones AC y AD. Note como los otros efectos se alinean alrededor del cero (0) indicando que no son significativos. Puede notar también que MINITAB solo nombra aquellos factores cuyo efecto parece distanciarse de la línea. La siguiente figura muestra los efectos principales y las interacciones de forma gráfica obtenidos de MINITAB.

Experimentos 2k con una sola réplica

Experimentos 2k con una sola réplica Note como una vez más se muestra que el factor B y sus interacciones parecen no tener un impacto significativo en la respuesta. Por lo que podríamos descartar este factor del experimento y proyectar el experimento original en un experimento 23 con dos repeticiones por tratamiento. Esta propiedad de proyección es otra ventaja del experimento factorial. Teóricamente ahora podríamos construir una tabla de ANOVA porque la proyección a creado una réplica (algunos estadísticos discrepan de esta metodología). MINITAB proporcionaría el siguiente ANOVA si proyectamos el experimento al número reducido de dimensiones. Las mismas cinco fuentes de variación son distinguidas como significativas.

Experimentos 2k con una sola réplica General Linear Model Analysis of Variance for filtraci Source DF Seq SS Adj SS Adj MS F P A 1 1870.56 1870.56 1870.56 83.37 0.000 C 1 390.06 390.06 390.06 17.38 0.003 D 1 855.56 855.56 855.56 38.13 0.000 A*C 1 1314.06 1314.06 1314.06 58.57 0.000 A*D 1 1105.56 1105.56 1105.56 49.27 0.000 C*D 1 5.06 5.06 5.06 0.23 0.647 A*C*D 1 10.56 10.56 10.56 0.47 0.512 Error 8 179.50 179.50 22.44

Experimentos 2k con una sola réplica El modelo lineal de regresión proyectado en los tres factores A, B y C confirmaría estos resultados. Fractional Factorial Fit Estimated Effects and Coefficients for filtraci Term Effect Coef StDev Coef T P Constant 70.062 1.184 59.16 0.000 A 21.625 10.813 1.184 9.13 0.000 C 9.875 4.938 1.184 4.17 0.003 D 14.625 7.312 1.184 6.18 0.000 A*C -18.125 -9.063 1.184 -7.65 0.000 A*D 16.625 8.312 1.184 7.02 0.000 C*D -1.125 -0.563 1.184 -0.48 0.647 A*C*D -1.625 -0.812 1.184 -0.69 0.512

Puntos centrales en los experimentos 2k Cuando efectuamos un experimento 2K lo hacemos bajo la suposición de que los efectos tienen un comportamiento lineal. Existe la posibilidad de efectuar observaciones en ciertos puntos de nuestra región experimental para detectar la presencia de curvatura en la misma, así como el de propiciar un estimado de error independiente. El método para lograr esto consiste en añadir repeticiones en el punto central del experimento 2K. Los nC puntos centrales se conducen en el experimento en el nivel codificado Xi = 0 (i =1, 2, …, K). Esto se hace bajo la suposición que los K factores son cuantitativos, veremos el impacto de que algunos de los factores sea cualitativo más adelante. Algo obvio que puede ser señalado en este instante es que factores de tipo cualitativo no tienen un nivel central.

Puntos centrales en los experimentos 2k Suponga que tiene un experimento factorial 22 con una observación en cada punto factorial (- , -), (- , +), (+ , -) y (+ , +) así como cinco (nC = 5) observaciones en el nivel (0 , 0). Gráficamente esto se muestra en la figura que sigue. 5 observaciones -1 1

Puntos centrales en los experimentos 2k Si definimos como el promedio de las observaciones en las cuatro corridas del experimento factorial y como el promedio de las nC observaciones en los puntos centrales, entonces podemos decir que si la diferencia entre estos promedios (-) es grande, la curvatura existe. Una suma de cuadrados para discriminar si la curvatura es o no significativa está dada por Esta suma de cuadrados, con 1 grado de libertad, se compara con la media del cuadrado del error para probar la existencia de curvatura.

Puntos centrales en los experimentos 2k Ejemplo Un ingeniero está estudiando el rendimiento de un proceso químico. Las dos variables de interés en este estudio resultan ser: Tiempo de Reacción y Temperatura de Reacción. Para cuidarse contra la posibilidad de la existencia de curvatura se decide efectuar un experimento factorial 22 con cinco puntos centrales. Las siguientes son las respuestas obtenidas del estudio: Data Display Row Tiempo Temperatura rendimiento 1 -1 -1 39.3 2 1 -1 40.9 3 -1 1 40.0 4 1 1 41.5 5 0 0 40.3 6 0 0 40.5 7 0 0 40.7 8 0 0 40.2 9 0 0 40.9

Puntos centrales en los experimentos 2k Ejemplo El ANOVA así como el modelo de regresión obtenido de MINITAB se presenta a continuación:

Puntos centrales en los experimentos 2k Ejemplo El mismo indica que ambos factores Tiempo y Temperatura muestran efectos principales significativos y que tanto la interacción como la curvatura no parecen ser significativas para explicar la interacción en la región experimental. Note en este análisis, que los puntos centrales se dividen en la tabla para el estimado de curvatura y para el estimado del error llamado error puro. Luego discutiremos, que haríamos para obtener un modelo de orden mayor si la curvatura hubiese resultado significativa.

Concepto de bloques en los experimentos factoriales 2k Existen muchas situaciones en las cuales no es posible efectuar todos los tratamientos del experimento factorial bajo condiciones homogéneas. Suponga que está construyendo aviones de papel, ¿cuántos aviones puede construir con un papel? En este caso probablemente usted quiera considerar el papel como una fuente a ser bloqueada. En otros ejemplos más industriales o prácticos podemos encontrar que el tiempo (días), lote de material, operadores, etc. son fuentes que necesitan ser bloqueadas en los correspondientes estudios. Discutiremos ahora como se asignan los tratamientos en experimentos factoriales 2K en donde algún efecto tenga que ser bloqueado.

Concepto de bloques en los experimentos factoriales 2k Suponga que un experimento factorial 2K puede ser repetido n veces. Una forma, si es posible, es correr cada réplica del experimento en un bloque distinto. Las corridas dentro de cada bloque se seguirían efectuando de forma completamente aleatoria. Para un experimento 22 en donde se ejecutan 4 bloques completos la siguiente tabla muestra las fuentes con sus correspondientes grados de libertad.

Concepto de bloques en los experimentos factoriales 2k En muchas otras situaciones, resulta imposible ejecutar todos los tratamientos de la repetición del experimento factorial en un solo bloque. La técnica de confusión es una técnica de diseño utilizada para asignar los tratamientos de un experimento factorial a los bloques. Cuando utilizamos esta técnica tendremos que sacrificar o hacer indistinguibles ciertas fuentes de variación del efecto de los bloques. Por ahora vamos a considerar experimentos 2K contenidos en 2p bloques, donde obviamente p < K. En esta estructura sólo será posible construir experimento con un número de bloques equivalentes a una potencia de 2, esto es, 2 , 8, 16 bloques ,etc.

Concepto de bloques en los experimentos factoriales 2k Suponga que va a ejecutar un experimento con dos factores cada uno a dos niveles. La siguiente tabla muestra dos distintas notaciones para identificar los tratamientos de este experimento. Suponga además que efectuar un tratamiento toma cierto número de horas lo que resulta en obtener solo dos observaciones cada día. La pregunta que tenemos que contestar ahora es la siguiente: ¿ cuáles tratamientos ejecuto cada día ?. La contestación a esta pregunta determinará la(s) fuente(s) de variación que se confunden con el efecto bloque. Por lo tanto, es una pregunta que debemos tomar con mucho cuidado.

Concepto de bloques en los experimentos factoriales 2k Suponga que los tratamientos son asignados de la siguiente manera: Observando la asignación de tratamientos nos percatamos que el total para el Bloque 1 corresponde al total del factor A cuando se encuentra en su nivel bajo, mientras que el total para el Bloque 2 corresponde al total del factor A cuando se encuentra en su nivel alto. Por lo tanto obtener una suma de cuadrados para bloques y/o para el factor A resulta en una misma cosa. Decimos entonces que las fuentes Bloques y el factor A se encuentran confundidas, por lo que esta asignación de tratamientos fue una selección muy pobre ya que sacrificó la información de un efecto principal.

Concepto de bloques en los experimentos factoriales 2k La práctica común que se sugiere a la hora de realizar estos experimentos es la de confundir los efectos de las interacciones de orden mayor con los bloques, en general, cuando es posible, interacciones de tres factores y mayores. Considere ahora un experimento 23 en 2 bloques. Tendríamos ahora que determinar cuales tratamientos corresponden a cada bloque.

Concepto de bloques en los experimentos factoriales 2k La tabla que se presenta a continuación, contiene los signos para las fuentes de variación cuando se consideran los 8 tratamientos de este experimento.

Concepto de bloques en los experimentos factoriales 2k Si seguimos el criterio de confundir con bloques la interacción de mayor orden, para este ejemplo sacrificaríamos el efecto de la interacción de tres factores ABC. Los bloques quedarían constituidos así Podemos concluir, que siempre que deseemos dividir los tratamientos de un diseño factorial 2K en 2 bloques seleccionaremos la interacción de orden mayor como el efecto a confundirse con el bloque. Note que en un caso como este, donde hay dos bloques, un (1) grado de libertad le corresponde a esta fuente de variación. Por esta razón es que solo sacrificamos un efecto (recuerde que en un exp. 2K todas las fuentes de variación, exceptuando al error, tienen un (1) grado de libertad).

Concepto de bloques en los experimentos factoriales 2k Trabajemos ahora con un ejemplo donde el experimento por necesidad tenga que ser dividido en cuatro (4) bloques incompletos. Suponga que tiene un experimento 25, si cada bloque puede contener 8 tratamientos, entonces necesitará 4 de estos. En circunstancias como la descrita será necesario seleccionar dos efectos para confundirlos con los bloques. Tiene que tener precaución porque el seleccionar las interacciones de orden mayor en esta ocasión no necesariamente produce el mejor esquema de experimentación. Este concepto será discutido en detalle más adelante.

Concepto de bloques en los experimentos factoriales 2k Digamos que usted selecciona, los efectos ADE y BCE. Para determinar la ubicación de los tratamientos en los bloques, deberá construir una tabla de signos que contenga por filas los 32 tratamientos y por columnas las 31 fuentes de variación. Si las columnas de los efectos ADE y BCE son consideradas habrá exactamente cuatro patrones de signos para las mismas. Estos patrones se muestran en la siguiente tabla

Concepto de bloques en los experimentos factoriales 2k El diseño se construye agrupando los tratamientos por patrones de signos. Aquellos correspondientes a (- , -) en un bloque, los correspondientes a (+ , -) en otro y así sucesivamente. Los bloques quedarían constituidos así:

Concepto de bloques en los experimentos factoriales 2k Una inspección cuidadosa de su tabla de signos lo hará notar que el efecto ABCD también está confundido con bloques. Cualquier pareja de estos tres efectos: ADE, BCD, ABCD hubiese generado los mismos cuatro (4) bloques. Esto se debe a que cuando tenemos cuatro bloques, estos tendrán tres (3) grados de libertad y la pareja seleccionada solo tendría dos. Por lo tanto, otra fuente adicional, no seleccionada en la pareja inicial, estará implícitamente confundida con los bloques. Este efecto puede ser determinado al obtener el producto de la pareja original ADE y BCE en el módulo 2. Este producto sería ADE(BCE) = ABCDE2 = ABCD módulo 2 (E2 = I). Ahora estamos en posición de discutir porque la selección de las interacciones de orden mayor no son necesariamente la mejor alternativa como lo eran cuando solo teníamos dos bloques. La selección en el ejemplo 25 de ABCDE y ABCD traería como consecuencia que E, un efecto principal, estuviese también confundido con bloques, lo que resulta obviamente en un experimento pobremente diseñado.

Concepto de bloques en los experimentos factoriales 2k Estos conceptos pueden extenderse a un número mayor de bloques. Para obtener 8 bloques necesitaríamos 3 efectos originales a fundirse con bloques, llamémoslos G1, G2 y G3. Los otro cuatro (4) grados de libertad para completar los siete (7) correspondientes a bloques se obtendrían de los siguientes efectos: 1 gl -> G1G2 1 gl -> G1G3 1 gl -> G2G3 1 gl -> G1G2G3 Dieciséis bloque requerirían 4 efectos iniciales y el producto de todas las combinaciones de estos generarían los once (11) efectos restantes que están confundidos con bloques. De igual forma podría seguirse con más bloques correspondientes a potencias de dos (32, 64, etc.)

Experimentos fraccionarios 2k A medida que el número de factores aumenta en un experimento factorial 2K, el número de tratamientos hace prohibitivo la posibilidad de realizar una repetición completa de todo el experimento. Tome por ejemplo un experimento con seis (6) factores cada uno de ellos a dos niveles, el realizar una réplica completa del mismo consistirá en 64 observaciones. En este diseño solo seis grados de libertad son necesarios para estimar los factores principales mientras que 15 grados de libertad se requieren para estimar las interacciones dos factores. Si como ya se planteó en pasadas secciones es posible presumir que las interacciones de muchos factores pueden ser consideradas insignificantes, entonces la información de los efectos principales y las interacciones de pocos factores puede obtenerse de correr solo una fracción de los tratamientos necesarios en el experimento factorial completo.

Experimentos fraccionarios 2k A estos experimentos le llamamos experimentos factoriales fraccionarios y son de los diseños más frecuentemente utilizados en la industria. Están basados en los siguientes preceptos que podríamos considerar como un dogma estadístico: Cuando existen múltiples variables en un sistema o un proceso, el sistema o proceso va a estar principalmente explicado por un puñado de efectos principales y de interacciones de orden bajo (principio de Pareto). Los diseños factoriales fraccionarios pueden ser proyectados a diseños con mayor capacidad de extraer información en el subespacio formado por las variables significativas. Es posible combinar las observaciones de dos o más experimentos fraccionarios para producir en secuencia un diseño que permita estimar los efectos deseados.

Experimentos fraccionarios 2k Al igual que en las pasadas secciones introduciremos los conceptos usando algunos ejemplos. Suponga que tiene un experimento 23 donde solo hay presupuesto para efectuar la mitad del total del experimento, es decir, 4 tratamientos. A este experimento le llamaríamos la mitad del factorial o usando otra notación se denotaría por un experimento 23-1. Considere la siguiente tabla de signos:

Experimentos fraccionarios 2k Dos conceptos de extrema importancia pueden ser observados de esta tabla. Para comentarlos primero presumamos que los cuatro tratamientos seleccionados para nuestro experimento corresponden a los cuatro en la parte superior de la tabla: a, b, c, abc. Lo primero que observamos es que los signos para ABC correspondientes a estos cuatro (4) tratamientos son +´s. Por consecuencia el efecto ABC se ha sacrificado completamente en este experimento porque solo fue observado en su ‘nivel alto’. Al efecto donde esto ocurre comúnmente se le da el nombre de generador, así que en este ejemplo la interacción de tres factores ABC resulta ser el generador de este experimento fraccionado.

Experimentos fraccionarios 2k La segunda observación que hacemos de esta tabla está asociada con las flechas dibujadas. Note que los signos para los tratamientos seleccionados cuando se consideran las columnas A y BC son idénticos. Lo mismo ocurre cuando observamos las parejas de columnas B, AC y C, AB. Lo que esto nos está informando es que como consecuencia de haber efectuado solo una fracción de la totalidad de los tratamientos algunos efectos han resultado estar confundidos. En esta situación no podemos distinguir los efectos A y BC, de B y AC ni los XC y AB. O sea que cuando estimamos A, B y C realmente estamos estimando A + BC, B + AC y C + AB respectivamente. Dos o más efectos que tienen esta propiedad se conocen como aliases.

Experimentos fraccionarios 2k Decimos pues que A y BC son aliases, que B y AC son aliases y que finalmente C y AB también son aliases. Esta estructura de aliases puede determinarse fácilmente sin necesidad de observar los signos de la tabla una vez se conoce cual(es) es(son) el(los) efecto(s) generador(es). La misma se obtiene multiplicando la columna o efecto de interés por el generador. De esta forma también pudimos haber obtenido los aliases: A(ABC) = A2BC = BC A = BC B(ABC) = AB2C = AC B = AC C(ABC) = ABC2 = AB C = AB que es la estructura que precisamente había sido observada de la tabla. La fracción que contiene el lado positivo es conocida como la fracción principal. No importa si hubiésemos seleccionado la otra fracción, es decir los otro cuatro tratamientos, la estructura sería la misma porque ambas fracciones pertenecen a la misma familia.

Resolución del diseño fraccionario Los diseños fraccionarios son clasificados de acuerdo a su resolución. La resolución del experimento nos brinda una idea del tipo de estructura de aliases que el diseño posee. Regularmente trabajamos con experimentos de resolución III, IV y V. Pasamos a definir cada una de ellas. Diseños de Resolución III. En estos diseños ningún factor principal está de alias con otro factor principal. Pero en cambio encontramos factores principales de aliases con interacciones de dos factores y también podemos encontrar interacciones de dos factores de aliases con otras interacciones de dos factores. El ejemplo que acabamos de discutir 23-1 es un experimento de resolución III y lo denominamos de la siguiente forma .

Resolución del diseño fraccionario Diseños de Resolución IV. En estos diseños ningún factor principal está de alias con otro factor principal ni con ninguna interacción de dos factores. Por otro lado, encontraremos interacciones de dos factores de aliases con interacciones de dos factores. Un diseño 24-1 con un generador I = ABCD resultará en un diseño . Diseños de Resolución V. En estos diseños no encontraremos ningún factor principal o ninguna interacción de dos factores de aliases con factores principales o con otras interacciones de dos factores. Un diseño 25-1 con un generador I = ABCDE resultará en un diseño .

Resolución del diseño fraccionario La resolución estará determinada por el número de letras del generador del diseño que posea el número mínimo de letras. Como veremos próximamente algunos diseños fraccionarios necesitarán más de un generador. Aspiraremos en nuestros diseños a tener la mayor resolución posible. Mientras mayor sea la resolución del experimento mayor información podemos extraer de nuestra experimentación, obviamente tomando en consideración las restricciones en el número de observaciones que el presupuesto impondrá.

Resolución del diseño fraccionario Ejemplo En un proceso de manufactura de circuitos integrados cinco factores son investigados con el objetivo de determinar como estos afectan la resistencia del producto. Los factores investigados fueron : A = Cantidad de Detergente, B = Temperatura, C = Tiempo, D = Espesor de Oxido y E = Posición. Cada factor fue considerado a dos niveles y el presupuesto en tiempo y materiales para conducir esta prueba provee la oportunidad de realizar un total de 16 tratamientos. Este experimento es la mitad de una repetición completa del experimento factorial. Los resultados obtenidos al realizar los tratamientos en forma completamente aleatoria se presentan a continuación en forma de tabla y luego en forma gráfica.

Resolución del diseño fraccionario Ejemplo Data Display Row A B C D E Resistencia 1 -1 -1 -1 -1 1 15.1 2 1 -1 -1 -1 -1 20.6 3 -1 1 -1 -1 -1 68.7 4 1 1 -1 -1 1 101.0 5 -1 -1 1 -1 -1 32.9 6 1 -1 1 -1 1 46.1 7 -1 1 1 -1 1 87.5 8 1 1 1 -1 -1 119.0 9 -1 -1 -1 1 -1 11.3 10 1 -1 -1 1 1 19.6 11 -1 1 -1 1 1 62.1 12 1 1 -1 1 -1 103.2 13 -1 -1 1 1 1 27.1 14 1 -1 1 1 -1 40.3 15 -1 1 1 1 -1 87.7 16 1 1 1 1 1 128.3

Resolución del diseño fraccionario Ejemplo

Resolución del diseño fraccionario Ejemplo La estructura de aliases para este experimento, MINITAB la produce en este caso para la fracción principal del modelo. La selección del ‘software’ resulta muy adecuada porque para realizar un experimento fraccionado que consta de la mitad de los tratamientos totales de un factorial completo el mejor generador lo constituye la interacción que contenga el número mayor de factores posible en este caso, la interacción ABCDE. Como consecuencia obtenemos un experimento de resolución V (ABCDE el único generador de este diseño consta de cinco letras). Esta selección del generador MINITAB la realiza de forma automática pero usted pudiera cambiarla si ese fuese su interés.

Resolución del diseño fraccionario Ejemplo

Resolución del diseño fraccionario Ejemplo Si la presunción de que interacciones de tres factores y mayores no se consideren es adecuada entonces este experimento brindará excelente información con respecto a los factores principales y las interacciones de dos factores. Como tenemos una observación por condición experimental debemos recurrir al Gráfico de probabilidad normal para los efectos sugerido por Daniels.

Resolución del diseño fraccionario Los efectos A, B, C, AB parecen tener una influencia grande en la respuesta. Estos mismos efectos se destacan cuando observamos la magnitud de sus coeficientes así como sus pendientes en un gráfico de efectos principales y el gráfico de las interacciones. Es posible comparar la magnitud de los coeficientes del modelos debido a que proviene de variables codificadas.

Resolución del diseño fraccionario

Resolución del diseño fraccionario

Resolución del diseño fraccionario

Resolución del diseño fraccionario El modelo que se usará par pronosticar la resistencia en la región sobre la cual se experimentó será: en donde las tres variables son codificadas dentro del rango -1, +1. Note que dos factores y ninguna de sus interacciones resultaron ser significativos, estos fueron los factores D y E. Los experimentos fraccionarios 2K tienen una propiedad que les permite proyectarse muy bien en el subespacio de aquellos factores que sí son relevantes. La siguiente gráfica muestra el experimento proyectado sólo a los factores significativos A, B y C.

Resolución del diseño fraccionario Esta gráfica muestra la respuesta en cada tratamiento ya que los 16 tratamientos del experimento original proyectan a dos repeticiones en cada uno de los 8 tratamientos del 23. Esta propiedad de proyección es muy particular a los experimentos factoriales y factoriales fraccionarios lo que los hace muy atractivos. De inspeccionar el cubo proyectado podemos concluir que la resistencia mayor ocurre cuando todos los factores A, B, C están en su nivel alto. Finalmente la próxima figura muestra el gráfico de probabilidad normal para los residuales y el gráfico de los residuales contra los valores pronosticados con el fin de cotejar la idoneidad del modelo. Ambos trazos parecen ser satisfactorios.

Resolución del diseño fraccionario

Resolución del diseño fraccionario Cuando el número de factores en un experimento aumenta tendremos que considerar fracciones menores al ½ considerado en el ejemplo pasado. Si se toma una cuarta (1/4) parte del total de los tratamientos en un experimento que tiene K factores, conocemos a este experimento como un 2K-2 fraccionario. Como ejemplo tome un experimento 26-2, para este caso es necesario seleccionar dos generadores (note lo análogo con los experimentos factoriales en bloques: 2 bloques una fuente sacrificada, ½ repetición un contraste generador; 4 bloques dos fuentes de variación sacrificadas inicialmente una implícita, 1/4 repetición en el fraccionario, dos generadores iniciales y uno implícito).

Resolución del diseño fraccionario Suponga que se seleccionan los efectos ABCE y BCDF. El producto de los seleccionados también es un generador en este caso sería: ABCE(BCDF) = ADEF Así que los generadores para este experimento serían I = ABCE = BCDF = ADEF. La estructura de aliases resultante sería como se presenta a continuación:

Resolución del diseño fraccionario

Resolución del diseño fraccionario El experimento resultaría uno de resolución IV, como puede notarse de la estructura de aliases y del número de letras de los generadores los cuales todos en este casos consisten cuatro letras. Note que el experimento puede consistir de cuatro distintos grupos de tratamientos, según los patrones que se generan en la tabla de signos. Estos patrones se muestran en la siguiente tabla: Usando la última de las combinaciones cuando ambos signos son negativos obtendríamos los siguientes tratamientos acompañados en la última columna de las respuestas. Los últimos cuatro (4) tratamientos representan cuatro puntos centrales añadidos para investigar la presencia de curvatura.

Resolución del diseño fraccionario

Resolución del diseño fraccionario Un gráfico de probabilidad normal para los efectos nos distingue los efectos de A, B y AB como los que mayor influencia tienen en la respuesta. El estimado del error puro en ANOVA se obtiene de las repeticiones efectuadas en el punto central y lo utilizamos para efectuar la prueba de curvatura. Como podemos notar la misma resultó en una razón F muy baja, indicando que el modelo lineal parece ser razonable en esta región.

Resolución del diseño fraccionario

Resolución del diseño fraccionario Nuestro modelo resultaría entonces ser: donde x1, x2 y x1x2 son variables codificadas. El gráfico de probabilidad normal para los residuales luce aceptable y se presenta en la siguiente figura.

Resolución del diseño fraccionario El modelo de regresión utilizado para producir los residuales fundamentalmente ha removido los efectos de localización de A, B Y AB de los datos originales. Los residuales retienen el resto de la variabilidad no explicada por el modelo. Mostraremos ahora porque es necesario estudiar estos residuales.

Resolución del diseño fraccionario La siguiente figura nos presenta el gráfico de los niveles de la variable C contra los residuales. Note como existe una mayor variabilidad en los residuales cuando el factor C se encuentra en su nivel alto. Esta información es relevante ya que si tomamos la información del modelo solamente no nos percataríamos de que mantener la variable C en su nivel alto resultaría en una mayor variabilidad del proceso. En muchos problemas entonces es mejor construir modelos tanto para el promedio como para la variabilidad en la respuesta. Esto lo discutiremos con mayor detenimiento cuando discutamos los experimentos robustos sugeridos por Genichi Taguchi.

Resolución del diseño fraccionario

Resolución del diseño fraccionario Por último, para este ejemplo, se muestra el diseño proyectado a las tres variables significativas A, B y C. Note que C se introduce en el cubo como consecuencia de su aportación a la variabilidad en el proceso. Para facilitar este entendimiento el rango de las respuestas de la proyección de los seis (6) factores en 3 dimensiones 23 acompaña a las respuestas promedio en cada tratamiento. Los rangos son mucho menores en el nivel bajo de C cuando se comparan con su nivel alto. 5 6 . 1 3 7 2 9 C B A - u b e P l o t M a n s f r R p i F c =

Uso de secuencia de fracciones para separar efectos confundidos Cuando analizamos experimentos fraccionarios de resoluciones bajas en muchas ocasiones encontramos que efectos confundidos resultan ser significativos y no podemos aislar las fuentes de variación que componen el alias. Esto puede lograrse mediante la combinación de experimentos fraccionarios. La estructura de aliases para cualquier fracción del experimento se consigue cambiando los signos de los factores concernidos en la estructura de aliases de la fracción original. A este procedimiento se le conoce como ‘fold-over’. En un ‘fold-over’ completo, añadimos una segunda fracción a la original cambiando los signos para todos los factores. La combinación de ambas fracciones nos permitirá estimar los efectos de los factores principales y las interacciones de dos sin estos estar confundidos cuando los experimentos son de resolución III. Así que técnicamente, un experimento ‘fold over’ completo que inicialmente era resolución III se convierte en un resolución IV. Lo mismo no puede decirse de un resolución IV, no hay garantía que con esta técnica se convertirá en uno de resoulión V.

Uso de secuencia de fracciones para separar efectos confundidos Otra variación de este tipo de experimento es el ‘fold-over’ para el factor sencillo. En esta modalidad se añade una segunda fracción del mismo tamaño, sólo que cambiamos los signos de uno de los factores solamente. Considerando ambas fracciones seremos capaces de estimar el efecto principal al cual se le cambiaron los signos así como las interacciones de dos factores que envuelvan al mismo.

Uso de secuencia de fracciones para separar efectos confundidos Un ejemplo de un ‘fold-over’ completo para un experimento original se presenta en la siguiente tabla: I = ABD = ACE = BCF = BCDE = ACDF = ABEF = DEF Primera Fracción Segunda Fracción def abcg afg bcde beg acdf abd cefg cdg abef ace bdfg bcf adeg abcdefg (1)

Uso de secuencia de fracciones para separar efectos confundidos Usando el mismo ejemplo para el ‘fold-over’ cambiando un sólo factor obtendríamos las siguientes fracciones:

Diseños Plackett-Burman Estos diseños corresponden a experimentos fraccionarios de dos niveles para estudiar hasta K = N - 1 en N observaciones, cuando N es un múltiplo de 4. Si N es una potencia de dos entonces estos experimentos resultarán en experimentos similares a los ya discutidos. Pero presentan una alternativa para cuando esto no se cumple, como en los casos N = 12, 20, 24, etc. MINITAB puede ayudarle a construir dichos experimentos.

Diseños Plackett-Burman Una nota de cautela con estos experimentos es que los mismos contienen una estrucutra de aliases bastante complicada. Como un ejemplo de esto, un experimento Plackett-Burman con 12 corridas resulta en una estructura que tiene a cada factor principal de alias con toda interacción de dos factores que no contenga al efecto principal. O sea que la interacción entre los factores A y B (AB) se encuentra de alias en este experimento con los 9 restantes factores principales. Las propiedades de proyección de estos experimentos tampoco resultan ser muy atractivas cuando son comparadas con los experimentos discutidos previamente. Por estas razones, estos experimentos Plackett-Burman que resultan ser atractivos por ser altamente fraccionados son vistos con escepticismo por muchos científicos y estadísticos.

Experimentos factoriales con factores aleatorios Hasta el momento hemos presumido que los factores en nuestros experimentos eran de naturaleza fija; esto es los niveles en que los factores fueron evaluados eran los niveles específicos de interés. En otras palabras, que nuestras inferencias estadísticas estaban limitadas a estos niveles específicamente. En algunas situaciones en la experimentación, el experimentador selecciona aleatoriamente los niveles de una población potencial de estos, con el fin de concluir sobre la población total de niveles sin limitarse a los niveles seleccionados para conducir el experimento. Cuando esto sucede, decimos que el factor es aleatorio.

Experimentos factoriales con factores aleatorios Si consideramos un experimento con dos factores A y B donde los a, b niveles correspondientes son seleccionados aleatoriamente de un número grande de posibilidades, en donde se toman n repeticiones en un arreglo factorial, obtendremos el siguiente modelo lineal: donde son variables aleatorias independientes que se presumen normales con promedio cero (0) y varianzas respectivamente. Por lo que la varianza de cualquier observación estará dada por : donde los estimados de varianza son conocidos como los componentes de varianza.

Experimentos factoriales con factores aleatorios En estos casos las hipótesis que resultan de interés son: Los estimados de las sumas de cuadrados para las distintas fuentes de variación se obtendrán de la misma forma en que los estimamos hasta el momento (presumiendo factores fijos). Al introducir el concepto de factores aleatorios, lo que puede cambiar es la forma de conducir la prueba F; con esto nos referimos al cociente que consideraremos para realizar la misma. Para hacer esto correctamente es necesario considerar las medias cuadradas esperadas.

Experimentos factoriales con factores aleatorios Puede probarse (más adelante veremos cómo desarrollarlas) que las medias cuadradas para el experimento con dos factores A, B y la interacción son: Entonces para probar usaríamos:

Experimentos factoriales con factores aleatorios porque bajo la hipótesis nula (H0) ambos términos tendrían valor esperado 2 y se rechazaría solo si hubiese evidencia de que E(MSAB) es mayor que E(MSE). En cambio para probar usaríamos el siguiente cociente: Note que este cociente es distinto al que hubiésemos utilizado considerando ambos factores fijos. En los capítulos pasados como consecuencia de suponer que todos los factores eran fijos todas estas fuentes de variación se probaban contra el MSE. Como acabamos de mostrar, esto no es cierto en todos los casos. Por lo tanto, usaremos las medias cuadradas esperadas de guía para establecer correctamente nuestra prueba F.

Experimentos factoriales con factores aleatorios Estimar los componentes de varianza resulta de mucho interés en estos experimentos que contienen factores aleatorios. Considerando los estimados de las medias cuadradas estos componentes se obtienen: Esta manera de estimar los componentes no garantiza la no negatividad de los mismos. Algunos autores presumen que la aportación de ese componente es cero (0) cuando sucede.

Diseños Jerárquicos o Anidados (Nested) Considere el siguiente ejemplo. Usted está realizando un estudio en una planta embotelladora. En la misma existen cinco máquinas de llenado cada una de ellas con cuatro boquillas lo que permite llenar hasta un máximo de cuatro botellas simultáneamente como se muestra en el siguiente dibujo. Máquina 1 Máquina 2 Máquina 3 Máquina 4 1 2 3 4 1 2 3 4 Máquina 5 1 2 3 4

Diseños Jerárquicos o Anidados (Nested) Resulta muy relevante entender que esta situación no se presta par realizar un experimento factorial con cinco niveles por máquina y cuatro niveles por boquilla. Esto es así porque las boquillas de cada máquina son distintas o pertenecen a cada máquina. En estos circunstancias llamamos al experimento, experimento jerárquico o anidado. Para realizar este experimento como uno factorial tendríamos que conducir el mismo de forma ilógica, cambiando las boquillas de máquinas para que éstas fuesen las mismas a través de todos los tratamientos. Como esto es prácticamente imposible, además conducir el experimento de esta manera nos brindaría información que no es muy útil para mejorar el proceso, la interacción entre máquinas y boquillas no existe en este tipo de experimento.

Diseños Jerárquicos o Anidados (Nested) La siguiente tabla muestra las respuestas obtenidas (diferencia en ml del valor deseado) de un experimento en donde cuatro observaciones se hicieron en cada boquilla de cada máquina. Debido a que las boquillas de cada máquina no son las mismas algunos autores prefieren darle distintos identificadores a las boquillas, bajo este argumento en nuestro caso tendríamos boquillas identificadas del 1 al 20. El modelo matemático que describe un experimento de esta naturaleza está dado por:

Diseños Jerárquicos o Anidados (Nested) El paréntesis del suscrito de las boquillas indica que éstas pertenecen a cada máquina cuyo suscrito es el i. El siguiente es el ANOVA de MINITAB cuando consideramos las máquinas como un factor fijo mientras que las boquillas dado que las montadas en determinada máquina se selecciona de una selección de un conjunto potencial de boquillas es considerado un factor aleatorio.

Diseños Jerárquicos o Anidados (Nested)

Diseños Jerárquicos o Anidados (Nested) Los grados de libertad para las boquillas son 15. La lógica que permite entender de donde provienen es la siguiente: existen 4 boquillas por máquina por lo tanto hay tres grados de libertad para las boquillas por máquina pero existen cinco de estas últimas para el total de 15 grados de libertad. MINITAB nos brinda las medias cuadradas esperadas indicando como se efectuarán las pruebas F. El cuadrado de las medias para las máquinas será comparado contra el cuadrado de las medias para boquillas mientras que éste último se comparará con el cuadrado de las medias del error. Este análisis nos brinda en forma global la contribución de las máquinas y las boquillas, sin embargo la información que realmente nos interesa es la de saber si hay diferencias entre las máquinas y si dentro de cada máquina hay diferencia en sus boquillas, porque esto sería lo que podemos mejorar en el proceso.

Diseños Jerárquicos o Anidados (Nested) La diferencia en máquinas puede concluirse del ANOVA presentado y considerando el valor p diríamos que no existe. De forma global las boquillas se encuentran en una zona de indecisión si consideramos un error Tipo I entre un 5 y un 10%, pero como señalamos lo relevante es distinguir diferencias en las boquillas dentro de las máquinas. Para lograr esto todo lo que necesitamos es realizar un ANOVA para un solo factor por máquina donde los tratamientos pasan a ser las boquillas. Mostraremos como la suma de cuadrados global para las boquillas corresponde a la suma de boquillas por máquina cuando consideramos las cinco máquinas. A continuación los cinco análisis descritos:

Diseños Jerárquicos o Anidados (Nested)

Diseños Jerárquicos o Anidados (Nested) Podemos observar que las sumas de cuadrados para las Boquillas por cada Máquinai (i = 1,…5) resultaron ser: 50.2, 126.19, 74.75, 6.5 y 25.25 respectivamente. La suma de todas éstas corresponde a la suma global para Boquillas del ANOVA original (282.88). Podemos entonces construir un ANOVA desglosado que nos brindaría una información de mayor utilidad. La misma se presenta a continuación: De este análisis podemos apreciar que las Boquillas en las Máquinas 2 y 3 son significativas al 10%. Conociendo esta información podemos concentrarnos en la solución del problema.

Experimentos de cuadrantes o parcelas partidas (Split-Plot) En muchos experimentos donde un arreglo factorial es deseable, es posible que no pueda conducirse el mismo de forma completamente aleatoria. Considere el siguiente ejemplo para aclarar este concepto. La temperatura T y el tiempo de horneado H son factores de interés al analizar el largo de vida Y, de componentes electrónicos. Suponga que el experimento evaluará cuatro niveles de temperatura ( 580, 600, 620 y 640 F) mientras que tres niveles de tiempo de horneado (5, 10 y 15 min.) serán considerados. Para conducir este experimento como uno factorial, tendríamos que seleccionar una combinación de las cuatro temperaturas y los tres tiempos de forma aleatoria, colocar un componente en el horno por el tiempo seleccionado y proseguir de esta manera hasta que todas las observaciones fuesen realizadas. Conducir el experimento de esta forma resulta no muy práctico y a la misma vez muy costoso. Existen experimentos que puede manejar tratamientos que ocurren de forma simultánea, como se desea en esta situación, aún con algunas restricciones en la aleatoriedad. A estos experimentos los llamamos parcelas o cuadrantes partidas/os.

Experimentos de cuadrantes o parcelas partidas (Split-Plot) Una forma lógica de conducir el experimento antes descrito sería seleccionar una de las cuatro temperaturas del horno de forma aleatoria y colocar tres componentes cuyos tiempos de horneado sería asignados aleatoriamente pero que estarían siendo tratados de forma concurrente. En otras palabras, a una temperatura dada los tres componentes son puestos en el horno por tres períodos de tiempo distintos. En este caso la temperatura actúa como cuadrante o parcela mientras que el tiempo es el que parte la parcela. Luego la temperatura se ajusta a otro nivel y se repite este procedimiento hasta que las cuatro temperaturas sean consideradas, a esto le llamamos una réplica del experimento. El experimento se completa efectuando algunas de estas repeticiones.

Experimentos de cuadrantes o parcelas partidas (Split-Plot) La siguiente tabla muestra el esquema de un experimento como el que acabamos de describir.

Experimentos de cuadrantes o parcelas partidas (Split-Plot) El modelo que describe este experimento está dado por: donde Ri, Tj y TIk son los efectos de las réplicas, las temperaturas y los tiempos de horneado respectivamente. Se pudiera pensar que el efecto de tiempo en este experimento se encuentra anidado dentro de las temperaturas, pero esto no es así ya que los mismos niveles de tiempo se efectúan en todas las temperaturas.

Experimentos de cuadrantes o parcelas partidas (Split-Plot) La siguiente tabla muestra los resultados obtenidos de un experimento conducido en la forma descrita.

Experimentos de cuadrantes o parcelas partidas (Split-Plot) El resultado de efectuar el procedimiento de <<Balanced Anova >> en MINITAB produce el siguiente resultado.

Experimentos de cuadrantes o parcelas partidas (Split-Plot) Donde las medias cuadradas esperadas se presentan a continuación y explican la forma de conducir las distintas pruebas F para los efectos en el experimento. Note que el error no es estimable en este experimento. El efecto de temperatura se prueba contra la interacción de (réplica x temperatura), mientras que el efecto del tiempo se prueba contra la interacción de (réplica x tiempo). Finalmente la interacción de los dos factores de interés: (temperatura x tiempo) se prueba contra la interacción de los tres efectos (réplica x temperatura x tiempo) según muestran las flechas en la tabla. En algunos casos no es posible realizar una prueba F exacta, pero esto no es de mucha pero esto no debe ser de mucha preocupación dado que el efecto de las réplicas no es de primordial interés, más bien su efecto es como de bloque, se introduce con la idea fundamental de reducir el error experimental.

Modelos de Segundo Orden Saturday, April 15, 2017 Modelos de Segundo Orden En las pasadas secciones nos limitamos a diseños que generan modelos de primer orden o contienen términos para la interacciones. Discutimos además el concepto de puntos centrales en los experimentos 2k para detectar curvatura en el modelo. Estimar los términos de segundo orden, de ser necesarios, requiere el efectuar tratamientos adicionales.

Modelos de Segundo Orden Saturday, April 15, 2017 Modelos de Segundo Orden Un modelo de segundo orden típico, proveniente de la expansión de Taylor sería: CCD consiste de: Puntos Factoriales Puntos Axiales Puntos Centrales CCD - Central Composite Design

Ejemplo - CCD Se desea construir un modelo de segundo orden para el esfuerzo de remoción de etiqueta de botellas de empaque como función de energía y velocidad de la correa. CCD

Ejemplo CCD Estimated Regression Coefficients for Esfuerzo Term Coef SE Coef T P Constant 90.7900 1.0224 88.797 0.000 A -0.9719 0.6261 -1.552 0.181 B -1.1669 0.6261 -1.864 0.121 A*A -2.7806 0.7452 -3.731 0.014 B*B -2.5231 0.7452 -3.386 0.020 A*B -0.7750 0.8855 -0.875 0.421 S = 1.771 R-Sq = 84.0% R-Sq(adj) = 68.1%

CCD – “Face Centered” CCD centrado en la cara consiste de: Puntos Factoriales Puntos Axiales Puntos Centrales Matriz de Diseño Factoriales Axiales Centrales

Metodología de Superficie de Respuestas En las pasadas secciones nos hemos concentrado en diseñar experimentos para construir modelos que nos permitan entender el comportamiento de la variable observada en el espacio de inferencia de los factores alterados en el experimento. Estos modelos nos han provisto de información referente a las propiedades del sistema bajo estudio, los signos y las magnitudes de los coeficientes así como la presencia o ausencia de las interacciones en los procesos bajo estudio. En muchas ocasiones eso es todo lo que queremos obtener de estos modelos. En ocasiones estos modelos se utilizan para optimizar o mejorar los procesos. Las técnicas que utilizamos para alcanzar estos objetivos las denominamos como métodos de superficie de respuesta. En estas ocasiones utilizamos esta colección de técnicas matemáticas para modelar y analizar problemas donde la respuesta de interés es influenciada por múltiples variables y cuyo objetivo es optimizar la respuesta.

Metodología de Superficie de Respuestas El diseño experimental, el método para construir modelos y la secuencia de experimentación a utilizarse en búsqueda de una región de mejoramiento para el proceso o sistema se conoce como el método de máxima pendiente en ascenso (‘steepest ascent method’). El tipo de diseño utilizado son los discutidos en las secciones anteriores, factoriales y fraccionarios 2K con y sin puntos centrales etc. La estrategia envuelve una búsqueda de regiones mejoradas por lo que se espera que sea necesario una secuencia de experimentos. Se comienza por presumir que en la región de operación actual un modelo de primer orden es una aproximación razonable del sistema cuando consideramos x1, x2, ……, xK variables.

Metodología de Superficie de Respuestas El método de la máxima pendiente ascendente consiste de los siguientes pasos: Ajuste un modelo de primer orden. Los experimentos factoriales con dos niveles y puntos centrales son muy recomendados para lograr esto. Determine el paso de máxima pendiente en ascenso si se quiere optimizar la respuesta. Conduzca corridas experimentales a lo largo del paso determinado hasta un punto en donde el mejoramiento desaparece. Esto ocurrirá en regiones donde el modelo obtenido ya no tenga mucho carácter predictivo. En alguna localización, en donde una aproximación de la respuesta máxima/mínima se localiza existe base para un modelo de segundo orden. Este procedimiento constituye solo una guía veremos como en ocasiones tendremos que tomar algunas determinaciones de tipo estadístico y otras de tipo ingenieril.

Metodología de Superficie de Respuestas Ejemplo: Se quiere encontrar el ajuste de tiempo y temperatura que producen el máximo rendimiento de un proceso químico. Las condiciones actuales del proceso presentan un tiempo de 75 minutos y una temperatura de 130C. Los ingenieros están dispuestos a experimentar en la siguiente región: 70 < Tiempo < 80 y 127.5 < Temperatura < 132.5. Se decide usar un diseño factorial 22 con tres puntos centrales. La siguiente tabla muestra las variables naturales, las variables codificadas y la respuesta obtenida de un experimento como el descrito.

Metodología de Superficie de Respuestas El resultado del análisis proporcionado por MINITAB para el Ejemplo se presenta de inmediato.

Metodología de Superficie de Respuestas Del mismo se desprende que un modelo lineal parece razonable ya que solo los efectos lineales para ambos factores A y B son significativos (los gráficos que se presentan a continuación comprueban estos hallazgos analíticos). Tanto la interacción como el efecto de curvatura resultan no significativos en este modelo. Así que es posible establecer el paso de máxima pendiente ascendente.

Metodología de Superficie de Respuestas

Metodología de Superficie de Respuestas De nuestro análisis se desprende que el modelo matemático que describe nuestra respuesta en esta región está dado por: Por lo tanto, a partir de este modelo queremos movernos más rápidamente en X2 que en la variable X1 porque con la evidencia presente, este movimiento deberá aumentar nuestra respuesta que es el objetivo de este ejercicio. Este movimiento debe ser cercano al perímetro de experimentación original que es donde nuestro modelo es válido. Por esta razón se recomienda dar un paso de 1 en términos de la variable codificada para el factor de mayor impacto en la respuesta y un paso de una fracción para las variables restantes. Esta fracción comúnmente se determina usando y =62.01 + 2.35 X1 + 4.50 X2

Metodología de Superficie de Respuestas donde es el coeficiente de la variable i y es el coeficiente mayor del modelo. Para el ejemplo entonces se realiza un paso de 1 en la variable X1 por cada 2.35/4.50 = 0.52 en X2. Entonces decimos que X1 = 0.52 y X2 = 1. En variables naturales esto corresponde a:

Metodología de Superficie de Respuestas El paso en ambas variables se toma en la dirección positiva ya que sus correspondientes coeficientes eran positivos y queremos aumentar la respuesta. Si el objetivo hubiese sido disminuir se tomaría el paso de mejoramiento en la dirección contraria. Gráficamente la dirección de pendiente máxima ascendente se muestra a continuación. -1 (70) +1 (80) (75) X1 -1 (127.5) +1 (132.5) X2 0 (130.0) (77.6, 132.5)

Metodología de Superficie de Respuestas Establecido el paso, podemos ejecutar observaciones en esa dirección hasta que no exista más evidencia de mejoramiento. Regularmente esto se comprueba cuando la respuesta consecutiva de dos experimentos no presenta mejoría. La siguiente tabla muestra resultados de realizar estos tratamientos. La tabla de forma esquemática muestra que hasta 82.8 y 137.5 para tiempo y temperatura respectivamente la respuesta fue aumentando y en los últimos dos pasos las misma disminuyó. Así que el tratamiento referido se convierte en nuestro nuevo punto central para el siguiente experimento de primer orden., que consistirá en un nuevo experimento 22 con puntos centrales y el análisis comenzará de nuevo. De acuerdo al procedimiento de la pendiente máxima en ascenso seguiremos en esta secuencia hasta que un modelo de primer orden no sea razonable para explicar el comportamiento de la variable respuesta en la región experimental.

Metodología de Superficie de Respuestas El procedimiento de Superficie de Respuesta exige construir un nuevo experimento con punto central igual al tratamiento hasta donde la respuesta fue mejorada en este caso Tiempo = 83 y Temperatura = 137.5. El nuevo experimento con sus correspondientes respuestas se presenta en la siguiente tabla.

Metodología de Superficie de Respuestas Los resultados del análisis usando MINITAB son los siguientes:

Metodología de Superficie de Respuestas De este análisis podemos observar que la curvatura es significativa, indicando con esto que un modelo de primer orden en esta región no es muy aconsejable. Esto también podría notarse del análisis de residuales para los factores. Aquí mostramos el mismo para el factor A.

Metodología de Superficie de Respuestas Note que los residuales para los puntos centrales están al lado superior de esta gráfica indicando que el modelo no aproxima muy bien este comportamiento. Añadimos los puntos axiales para construir el modelo de segundo orden. En variables codificadas estos corresponden a los siguientes tratamientos: El análisis correspondiente a las 12 observaciones (22 + 4 puntos centrales + 4 puntos axiales) se presenta a continuación.

Metodología de Superficie de Respuestas

Metodología de Superficie de Respuestas Se puede apreciar del análisis que en esta región experimental los componentes cuadráticos de ambos factores son significativos, así como la interacción, por lo que obviamente un modelo lineal no sería capaz de describir adecuadamente lo que sucede con el rendimiento en esta vecindad. Regularmente se utilizan dos gráficos para estudiar los efectos en la región, a uno le llamamos el gráfico de superficie y al otro el gráfico de contornos. Ambos se presentan de forma consecutiva.

Metodología de Superficie de Respuestas La respuesta aumenta según A (Tiempo) se acerca a sus niveles bajos mientras que la Temperatura la interesamos en valores altos. Una nueva suma de cuadrados para la carencia de ajuste (‘lack of fit’) aparece en nuestro análisis. Esta de ser significativa indicaría que un modelo de orden mayor es necesario. En este caso no lo es dado la magnitud de su valor p. Si las pruebas de idoneidad del modelo cumplen con las presunciones de Anova sabemos que tenemos un modelo que explica muy bien la respuesta en esta región y que debemos estar cerca de un óptimo aunque sea local.

Diseños Robustos El diseño robusto es esencialmente un principio que hace énfasis en seleccionar adecuadamente los niveles de los factores controlables en el proceso para la manufactura de productos. El principio de la selección de los niveles está basado principalmente en la variación alrededor de un valor nominal (deseado) preestablecido para el proceso bajo estudio. Se presume que la mayoría de la variabilidad alrededor del valor nominal se debe a la presencia de un segundo conjunto de factores llamado factores de ruido.

Diseños Robustos Estos experimentos se le atribuyen al profesor Genichi Taguchi quien recomendó hacer uso de estos factores de ruido durante las etapas de desarrollo y experimentación para buscar los niveles de los factores controlables que hacen el proceso insensible a los factores de ruido de forma tal que se pueda disminuir la variabilidad que estos últimos causan en el proceso. El profesor Taguchi se refiere a este problema como el problema de diseño de parámetros (‘Parameter Design’), el incluye las siguientes cuatro ideas como fundamentales a la hora de atacar el mismo: Además de entender el efecto en el promedio (localización), la varianza es importante. Debido a lo anterior es importante entonces modelar la varianza. Existen dos tipos de variables: variables de control y factores de ruido. Es importante 8incluir los factores de ruido en el experimento.

Diseños Robustos La metodología de Taguchi para los diseños robustos envuelve el uso de diseños ortogonales donde se cruza un diseño ortogonal que contiene los factores controlables con un arreglo ortogonal constituido por los factores de ruido. Por ejemplo en un 22 X 22, el experimento 22 para los factores controlables es llamado el arreglo interno (‘inner array’) y el 22 para los factores de ruido se le conoce como arreglo externo (‘outer array’). Esto resulta en un diseño de 16 tratamientos conocido como arreglo cruzado (‘crossed array’). La figura que sigue muestra este tipo de arreglo.

Diseños Robustos Los círculos sin sombrear representan el arreglo interno para los factores controlables. Los puntos sombreados representan las localizaciones de las observaciones.

Diseños Robustos El arreglo cruzado comienza con dos diseños experimentales, uno para las variables de ruido y el otro para las variables controlables. Cada diseño individual es regularmente eficiente porque cuando el número de factores aumenta se puede considerar uno fraccionario. El producto de ambos (diseño cruzado) muchas veces no produce un diseño muy económico. Como veremos existen diseños, ya conocidos por nosotros que resultan en experimentos más eficientes que los cruzados en número de tratamientos y en información obtenida. La dificultad con los arreglos cruzados puede explicarse por medio de los grados de libertad.

Diseños Robustos Considere el experimento donde un arreglo interno 23-1 para los factores A, B, C se cruza con otro 23-1 para los factores D, E y F en el arreglo externo. Esto resulta en 16 tratamientos con el siguiente desglose de grados de libertad:

Diseños Robustos Note que todos los grados de libertad son para los efectos principales y para las interacciones de los factores controlables x factores de ruido. Ningún grado de libertad permite estimar las interacciones dentro de los factores controlables y/o dentro de los factores de ruido. Esto representa una desventaja de los diseños cruzados. Las interacciones que son estimables son importantes pero estos diseños descartan muchas otras que resultan de interés y podrían llevarnos a conclusiones incorrectas. Por las razones expuestas muchos autores han sugerido el incorporar factores controlables y factores de ruido dentro de un mismo experimento fraccionario. El siguiente ejemplo muestra este concepto junto con el análisis de las variables que explican la localización y las variables que afectan la dispersión.

Diseños Robustos Ejemplo: En una planta de manufactura se producen piezas plásticas usando el proceso de moldeo por inyección. En la producción regular se ha encontrado que las piezas sufren un encogimiento excesivo. El personal de la planta identificó siete variables del proceso para ser utilizadas en el estudio. Las cuatro variables controlables son: temperatura de moldeo (A), velocidad (B), tiempo (C) y tolerancia del pasante (‘Gate Size’) (D). Las variables que no se controlan en la manufactura rutinaria son: tiempo de ciclo (E), contenido de humedad (F) y presión de aguante (‘Holding Pressure). Se decide por un experimento fraccionario 27-3 con cuatro puntos centrales en vez del diseño cruzado propuesto por Taguchi. Usando E=ABC, F=BCD y G=ACD obtenemos los siguientes tratamientos que se presentan a continuación con sus respectivas respuestas.

Diseños Robustos

Diseños Robustos Debido a que se efectuó una observación por tratamiento es posible usar el gráfico sugerido por Daniels para detectar los efectos significativos. El mismo se presenta en la figura que sigue.

Diseños Robustos Notamos que los efectos A, B y AB afectan el promedio o localización del proceso. La normalidad de los residuales parece ser adecuada como muestra la siguiente gráfica de probabilidad normal.

Diseños Robustos El gráfico de los residuales contra los niveles del factor C nos indica que parece existir una diferencia en la varianza, esto lo observamos del siguiente gráfico.

Diseños Robustos Una nueva estadística se sugiere para determinar que factores afectan significativamente la varianza. La misma está dada por: donde representa el estimado de varianza del efecto en el nivel superior basado en el residual de las observaciones y tendría el mismo significado solo que en el nivel inferior de cada efecto. Note que sencillamente esta estadística compara los estimados de varianza para cada nivel de cada efecto, en ANOVA esto se presumía como constante.

Diseños Robustos Usando los residuales como los datos para esta nueva estadística obtenemos los siguientes Fi* para cada efecto:

Diseños Robustos Donde sobresale el factor C. Los autores sugieren hacer un nuevo gráfico de probabilidad normal para la estadística Fi*. , que indicaría C como el único factor afectando la varianza. Así que el modelo de dos etapas determina que A, B y AB afectan el promedio mientras que C afecta la variabilidad. Para hacer el proceso insensible debemos colocar el factor C en su nivel bajo lo que redunda en una menor dispersión como muestra la siguiente representación gráfica: