Maracaibo, 5 de Noviembre de 2007 Universidad del Zulia Facultad de Ingeniería Instituto de Cálculo Aplicado Universidad del Zulia Facultad de Ingeniería.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS
Advertisements

Técnicas para la elaboración de un instrumento
Modelos de Variable Dependiente Binaria -Logit y Probit-
Bivariadas y Multivariadas
MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I HETEROSCEDASTICIDAD
KRIGING.
Tema 3 Revisión de diversos métodos robustos aplicados en algunos problemas fotogramétricos.
Covarianza muestral Sean x1, x2, ..., xn e y1, y2, ..., yn dos muestras aleatorias independientes de observaciones de X e Y respectivamente. La covarianza.
Modelado y simulación en Ingeniería Química. Manuel Rodríguez
MODELO DE REGRESIÓN MÚLTIPLE
MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I MULTICOLINEALIDAD
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Universidad del Cauca1 CAPITULO 3. INTERPOLACION En este capítulo se tratan 2 problemas:
Capitulo 10: La metodología Box-Jenkins
Estimación por Intervalos de confianza
Regresión y correlación
Análisis Estadístico de Datos Climáticos Facultad de Ciencias – Facultad de Ingeniería 2009 M. Barreiro – M. Bidegain – A. Díaz Análisis de correlación.
Curso de Estadística Básica
9 Regresión Lineal Simple
División de Estudios Políticos, CIDE
Tema 2: Métodos de ajuste
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Facultad: Turismo Y Hotelería
Juan José Cortés Orozco. Antonio Muñoz Torres.
FUNCIONES DE DENSIDAD DE PROBABILIDAD
Representación de Señales y Ruido por medio de Series Ortogonales
GRUPO DE INVESTIGACION EN CONTROL INDUSTRIAL
VARIABLE ALEATORIA Y DISTRIBUCION DE PROBABILIDAD
Distribuciones derivadas del muestreo
ESTADÍSTICA BÁSICA EN ECOLOGÍA EVOLUTIVA Juan J. Soler Cruz Estación Experimental de Zonas Áridas Almería.
DISTRIBUCIONES DE MUESTREO
Métodos de calibración: regresión y correlación
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
ESTADISTICA I CSH M. en C. Gal Vargas Neri.
Validez y Confiabilidad de Instrumentos
Titular: Agustín Salvia
Econometría Clase 10 Caso práctico. El Gerente General de la compañía Aceros del Pacífico considera que los ingresos podrían aumentar un 3,5% durante.
Inferencia Estadística
Análisis de correspondencia canónica (CCA)
Repaso de clase anterior
UCLA – DAC M. Sc. Jorge E. Hernández H.
El MPH se usa para estimar valores económicos de ecosistemas o servicios ambientales que afectan directamente precios del mercado Se usa para estimar beneficios.
Definición del Modelo de Regresión Simple Estimaciones por MCO Método de MCO Valores Esperados y Varianzas por MCO.
Métodos Cuantitativos
(Validez de un estudio)
1 Introducción al tratamiento de datos © José Luís Contreras.
Estimación y contraste de hipótesis
Maracaibo, 26 de Mayo de 2006 Universidad del Zulia Facultad de Ingeniería División de Postgrado Maestría en Computación Aplicada Universidad del Zulia.
Taller 2 Reflexiones sobre Metodología Cuantitativa: Potencial de la comparación de muestras Germán Fromm R.
Regresión Lineal Simple
Aplicaciones Estadísticas a las Finanzas Clase 1
El efecto de las actividades extracurriculares en el optimismo de estudiantes en Nuevo León. En esta investigación nos enfocaremos en uno de sus factores.
INTERVALO DE CONFIANZA
Unidad 4 Análisis de los Datos.
Clase N°11 Métodos de reducción de varianza
INFERENCIA ESTADÍSTICA
OPTIMIZACION DEL DESEMPEÑO DE ERROR
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE CIENCIAS ECONOMICAS INFERENCIA ESTADISTICA TEMA: ESTIMACION PUNTUAL, PROPIEDADES DE LAS ESTIMACIONES;
Aplicaciones Estadísticas a las Finanzas Clase 1
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Teoría de la Generalizabilidad
Free and Quick translation of Prof. Anderson's slides1 Analisis de Regresion Multiple y =  0 +  1 x 1 +  2 x  k x k + u 1. Estimacion.
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
INTERVALO DE CONFIANZA
Evaluando los promedios de grupos distintos UNIDAD 7 1.
Transcripción de la presentación:

Maracaibo, 5 de Noviembre de 2007 Universidad del Zulia Facultad de Ingeniería Instituto de Cálculo Aplicado Universidad del Zulia Facultad de Ingeniería Instituto de Cálculo Aplicado Prof. Daniel Ernesto Finol González Optimización Global Usando Ensamblaje de Modelos

Justificación del Estudio En distintas industrias es frecuente la necesidad de optimizar funciones de las cuales sólo se conoce (o puede conocerse) una cantidad limitada de evaluaciones. El proceso de optimización requiere muchas evaluaciones. En distintas industrias es frecuente la necesidad de optimizar funciones de las cuales sólo se conoce (o puede conocerse) una cantidad limitada de evaluaciones. El proceso de optimización requiere muchas evaluaciones.

Justificación del Estudio Se debe construir un modelo que aproxime la función a partir de unas pocas evaluaciones. Crear el modelo es un problema inverso: Existen muchos modelos que se ajustan bien a los datos sin parecerse a la función original. Se debe construir un modelo que aproxime la función a partir de unas pocas evaluaciones. Crear el modelo es un problema inverso: Existen muchos modelos que se ajustan bien a los datos sin parecerse a la función original.

ObjetivoObjetivo Objetivo Evaluar el desempeño relativo de una metodología de optimización global de funciones costosas basada en el uso de múltiples modelos sustitutos.

Casos de Estudio Se seleccionaron seis casos de estudio. Éstos se distinguen por tres características: –Alta o baja no–linealidad. –Alta o baja dimensionalidad. –Ruido aleatorio presente o no.

Caso de Estudio 1 (P1) Dimens:10 No–Lin:Alta Dimens:10 No–Lin:Alta

Caso de Estudio 2 (P5) Dimens:16 No–Lin:Baja Dimens:16 No–Lin:Baja

Caso de Estudio 3 (P6) Dimens:2 No–Lin:Alta Dimens:2 No–Lin:Alta

Caso de Estudio 4 (P7) Dimens:2 No–Lin:Alta Dimens:2 No–Lin:Alta

Caso de Estudio 5 (P12) Dimens:2 No–Lin:Baja Dimens:2 No–Lin:Baja

Caso de Estudio 6 (P13) Dimens:2 No–Lin:Baja Con Ruido Dimens:2 No–Lin:Baja Con Ruido

1. Diseño del Experimento y Muestreo (Hipercubo latino) ==> Conjunto de datos iniciales. 2. Ajuste RBF; PRE y KRI ==> 3 Modelos Base. 3. Obtener medidas de incertidumbre para cada modelo ==> Medidas de Incertidumbre. 4. Realizar “Ensamblaje de modelos” (Suma Ponderada) ==> Cuarto Modelo. 5. Optimizar c/u de los 4 modelos (Direct) ==> 4 soluciones. 6. Comparar y analizar resultados. 1. Diseño del Experimento y Muestreo (Hipercubo latino) ==> Conjunto de datos iniciales. 2. Ajuste RBF; PRE y KRI ==> 3 Modelos Base. 3. Obtener medidas de incertidumbre para cada modelo ==> Medidas de Incertidumbre. 4. Realizar “Ensamblaje de modelos” (Suma Ponderada) ==> Cuarto Modelo. 5. Optimizar c/u de los 4 modelos (Direct) ==> 4 soluciones. 6. Comparar y analizar resultados. MetodologíaMetodología

Modelos Sustitutos Los modelos usados fueron: Kriging (KRI). Regresión Polinómica (PRE). Funciones de Base Radial (RBF). Cada uno de ellos es un caso especial de: Los modelos usados fueron: Kriging (KRI). Regresión Polinómica (PRE). Funciones de Base Radial (RBF). Cada uno de ellos es un caso especial de:

Kriging En nuestra versión de Kriging p = 1 y f(x) = 1. Lo cual hace β = μ. Y el modelo queda: μ + ε(x) con donde ; Y es el valor de la función en cada punto de la muestra. R es la matriz de correlación entre los puntos de la muestra y r(x) es el vector de correlación entre cada punto de la muestra y x.

Kriging R y r(x) se estiman mediante modelos de la forma: Donde cada C j es una función parametrizada decreciente de la distancia entre los puntos. Los C j usados fueron: exponencial generalizada, gaussiana, spline y esférica.

Regresión Polinómica Este es una caso especial de la regresión lineal. ε(x) se asume que es cero. Cada f i (x) es una de las siguientes: La constante 1. La función identidad de una de las variables. El producto de dos variables. El cuadrado de alguna variable. Este es una caso especial de la regresión lineal. ε(x) se asume que es cero. Cada f i (x) es una de las siguientes: La constante 1. La función identidad de una de las variables. El producto de dos variables. El cuadrado de alguna variable.

Funciones de Base Radial En este caso también se asume ε(x) como cero. Las f i (x) son funciones gausianas o multicuádricas con centro en algún punto de la muestra. Además una f i (x) puede ser constante. Potencialmente a todo punto de la muestre le puede corresponder una función; pero se seleccionan con el método de forward selection. El radio de cada función se escoge entre distintas opciones según una medida de error. En este caso también se asume ε(x) como cero. Las f i (x) son funciones gausianas o multicuádricas con centro en algún punto de la muestra. Además una f i (x) puede ser constante. Potencialmente a todo punto de la muestre le puede corresponder una función; pero se seleccionan con el método de forward selection. El radio de cada función se escoge entre distintas opciones según una medida de error.

Medidas de Incertidumbre Kriging: PRE y RBF: RBF:

Modelo Suma Ponderada

Resumen de Resultados R–Cuadrado

Resumen de Resultados Razón VEP / SSEP

Resumen de Resultados Optimización

Conclusiones La primera conclusión es que sí es eficaz usar más de un modelo para aproximar una función a partir de una muestra. Esta conclusión está basada en cuatro razones:

Conclusiones 1ra: No hubo ningún modelo que fuera siembre, o la mayoría de las veces, el mejor. De hecho cada modelo fue el mejor en por lo menos dos casos.

Conclusiones 2da: El modelo Suma Ponderada obtuvo el mejor R 2 promedio con la muestra “Pequeña”, y el segundo mejor promedio con la muestra “Escasa”, siendo la diferencia con el mejor promedio, en este último caso, muy pequeña.

Conclusiones 3ra: Cuando el modelo Suma Ponderada no tiene el mejor R 2 tiene el segundo mejor, con una excepción (P13, “Escasa”).

Conclusiones 4ta: También se observó que el modelo Suma Ponderada, tiene la varianza de R 2 más baja o segunda más baja. Esto indica que la calidad de sus resultados es consistente.

Conclusiones Sin embargo la pregunta más importante que esta investigación trata de contestar es si vale la pena calcular más de un modelo desde el punto de vista de la optimización.

Conclusiones Aunque en algunos problemas la diferencia entre los óptimos encontrados con los distintos modelos no es muy grande, sí es frecuente que haya uno mucho peor que los demás; y, aunque suele ser el modelo de “Regresión Polinómica” quien presenta ese problema, no es poco frecuente que sea algún otro el peor.

Conclusiones De modo que sigue siendo válido el primero de los argumentos esgrimidos con respecto al modelado: como no hay un modelo que obtenga el mejor óptimo en todos los casos, y ni siquiera uno que sea siempre uno de los dos mejores (aparte del modelo Suma Ponderada), es necesario construir más de un modelo para obtener un óptimo confiable.

Conclusiones Otras observaciones y conclusiones son: El estimador estándar de la varianza del error de RBF, usando el método de Forward Selection, está significativamente sesgado hacia abajo. El estimador de la de Kriging en teoría es sesgado hacia abajo; pero esto no se notó.

Conclusiones Otras observaciones y conclusiones son: Los modelos RBF tuvieron, en promedio, más parámetros que la mitad del tamaño de la muestra (> 57%). Los coeficientes del modelo Suma Ponderada asumen que no hay correlación entre las predicciones de los modelos. Esto no es cierto.

Conclusiones Otras observaciones y conclusiones son: La estimación de la varianza del modelo Suma Ponderada estuvo significativamente sesgada hacia abajo.

Recomendaciones Mejorar el modelo Suma Ponderada con información acerca de la correlación de las predicciones de los modelos. Implementar EGO sustituyendo Suma Ponderada por Kriging (o RBF); pero hay que tener en cuenta el sesgo en la estimación de la varianza de Suma Ponderada.

Recomendaciones Encontrar un buen estimador de la varianza de RBF que no sea tan ad– hoc. Los modelos RBF y PRE podrían integrarse como la parte determinística de un modelo de Kriging. (En vez de usar Suma Ponderada).