Maracaibo, 26 de Mayo de 2006 Universidad del Zulia Facultad de Ingeniería División de Postgrado Maestría en Computación Aplicada Universidad del Zulia.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

ANALISIS PARAMÉTRICOS
CONTENIDOS Teoría del muestreo ¿Cómo seleccionar una muestra?
Técnicas para la elaboración de un instrumento
Modelos de Variable Dependiente Binaria -Logit y Probit-
Bivariadas y Multivariadas
MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I HETEROSCEDASTICIDAD
KRIGING.
GEOESTADISTICA MULTIVARIADA
Covarianza muestral Sean x1, x2, ..., xn e y1, y2, ..., yn dos muestras aleatorias independientes de observaciones de X e Y respectivamente. La covarianza.
Pruebas de Especificación en el Modelo de Regresión Múltiple
MODELO DE REGRESIÓN MÚLTIPLE
MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I MULTICOLINEALIDAD
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Universidad del Cauca1 CAPITULO 3. INTERPOLACION En este capítulo se tratan 2 problemas:
Capitulo 10: La metodología Box-Jenkins
Estimación por Intervalos de confianza
Regresión y correlación
UNIVERSIDAD CATÓLICA DEL MAULE FACULTAD DE CIENCIAS DE LA INGENIERÍA ESCUELA DE INGENIERÍA CIVIL INFORMÁTICA PROFESOR GUÍA: HUGO ARAYA CARRASCO. ALUMNO.
Análisis Estadístico de Datos Climáticos Facultad de Ciencias – Facultad de Ingeniería 2009 M. Barreiro – M. Bidegain – A. Díaz Análisis de correlación.
Curso de Estadística Básica
9 Regresión Lineal Simple
División de Estudios Políticos, CIDE
Tema 2: Métodos de ajuste
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Maracaibo, 5 de Noviembre de 2007 Universidad del Zulia Facultad de Ingeniería Instituto de Cálculo Aplicado Universidad del Zulia Facultad de Ingeniería.
Representación de Señales y Ruido por medio de Series Ortogonales
GRUPO DE INVESTIGACION EN CONTROL INDUSTRIAL
VARIABLE ALEATORIA Y DISTRIBUCION DE PROBABILIDAD
DEFINICIONES Sea (P) el siguiente problema de programación lineal:
INTERVALO DE CONFIANZA
Elementos Básicos de Probabilidad y Estadística Javier Aparicio División de Estudios Políticos, CIDE Julio 2009
ESTADÍSTICA BÁSICA EN ECOLOGÍA EVOLUTIVA Juan J. Soler Cruz Estación Experimental de Zonas Áridas Almería.
ESTIMACIÓN DE COEFICIENTES DE MÁXIMA VEROSIMILITUD
Métodos de calibración: regresión y correlación
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
ESTADISTICA I CSH M. en C. Gal Vargas Neri.
Validez y Confiabilidad de Instrumentos
Titular: Agustín Salvia
Inferencia Estadística
Estimador de Efectos Fijos
Capítulo 1. Conceptos básicos de la Estadística
Definición del Modelo de Regresión Simple Estimaciones por MCO Método de MCO Valores Esperados y Varianzas por MCO.
Elementos Básicos de Probabilidad y Estadística
Métodos Cuantitativos
Estimación y contraste de hipótesis
Taller 2 Reflexiones sobre Metodología Cuantitativa: Potencial de la comparación de muestras Germán Fromm R.
Regresión Lineal Simple
Aplicaciones Estadísticas a las Finanzas Clase 1
INTERVALO DE CONFIANZA
Regresión lineal simple Nazira Calleja
DIMENSIONALIDAD del instrumento Y ANÁLISIS FACTORIAL
Clase N°11 Métodos de reducción de varianza
INFERENCIA ESTADÍSTICA
OPTIMIZACION DEL DESEMPEÑO DE ERROR
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
DISEÑO Y ANALISIS DE EXPERIMENTOS DISEÑOS 2 A LA K CON PUNTOS CENTRALES.
Aplicaciones Estadísticas a las Finanzas Clase 1
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
ANÁLISIS DE COVARIANZA En algunas circunstancias, un experimento está afectado por la intervención de un factor muchas veces imprevisible y que no puede.
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Teoría de la Generalizabilidad
Estimación estadística
METODOS DE REMUESTREO: JACKKNIFE Y BOOTSTRAP
TAMAÑO DE LA MUESTRA Alvaro Alfredo Bravo Dpto. de Matemáticas y Estadística Universidad de Nariño - Colombia.
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
Evaluando los promedios de grupos distintos UNIDAD 7 1.
Transcripción de la presentación:

Maracaibo, 26 de Mayo de 2006 Universidad del Zulia Facultad de Ingeniería División de Postgrado Maestría en Computación Aplicada Universidad del Zulia Facultad de Ingeniería División de Postgrado Maestría en Computación Aplicada presentado ante la Ilustre Universidad del Zulia para optar al Grado Académico de MAGISTER SCIENTIARUM EN COMPUTACIÓN APLICADA Lic. Daniel Ernesto Finol González C.I.: presentado ante la Ilustre Universidad del Zulia para optar al Grado Académico de MAGISTER SCIENTIARUM EN COMPUTACIÓN APLICADA Lic. Daniel Ernesto Finol González C.I.: Trabajo de Grado Optimización de Funciones utilizando Múltiples Modelos Sustitutos

Justificación del Estudio En distintas industrias frecuentemente se hace necesario optimizar funciones desconocidas. Esto se realiza mediante la evaluación de la función objetivo en distintos puntos. Para realizar esta optimización se requieren muchas evaluaciones. Pero las funciones son usualmente costosas de evaluar. Por lo que se debe construir un modelo que aproxime la función y realizar la optimización sobre él. En distintas industrias frecuentemente se hace necesario optimizar funciones desconocidas. Esto se realiza mediante la evaluación de la función objetivo en distintos puntos. Para realizar esta optimización se requieren muchas evaluaciones. Pero las funciones son usualmente costosas de evaluar. Por lo que se debe construir un modelo que aproxime la función y realizar la optimización sobre él.

Hipótesis de la Investigación La hipótesis de la presente investigación es que para tales problemas usar más de un modelo sustituto es un método eficaz de optimización global.

ObjetivosObjetivos Objetivo General Evaluar el desempeño relativo de una metodología de optimización global de funciones costosas basada en el uso de múltiples modelos sustitutos.

ObjetivosObjetivos Objetivos específicos  Probar los algoritmos para la construcción de los modelos sustitutos considerados.  Construir los modelos sustitutos correspondientes a los casos de estudio  Optimizar / analizar la varianza de los estimadores asociados con cada uno de los modelos sustitutos considerados.  Analizar y discutir los resultados.  Probar los algoritmos para la construcción de los modelos sustitutos considerados.  Construir los modelos sustitutos correspondientes a los casos de estudio  Optimizar / analizar la varianza de los estimadores asociados con cada uno de los modelos sustitutos considerados.  Analizar y discutir los resultados.

Casos de Estudio Se seleccionaron seis casos de estudio. Éstos se distinguen por tres características: –Alta o baja no–linealidad. –Alta o baja dimensionalidad. –Ruido aleatorio presente o no.

Caso de Estudio 1 (P1) Dimens:10 No–Lin:Alta Dimens:10 No–Lin:Alta

Caso de Estudio 2 (P5) Dimens:16 No–Lin:Baja Dimens:16 No–Lin:Baja

Caso de Estudio 3 (P6) Dimens:2 No–Lin:Alta Dimens:2 No–Lin:Alta

Caso de Estudio 4 (P7) Dimens:2 No–Lin:Alta Dimens:2 No–Lin:Alta

Caso de Estudio 5 (P12) Dimens:2 No–Lin:Baja Dimens:2 No–Lin:Baja

Caso de Estudio 6 (P13) Dimens:2 No–Lin:Baja Con Ruido Dimens:2 No–Lin:Baja Con Ruido

1. Diseño del Experimento y Muestreo ==> Conjunto de datos iniciales. 2. Ajuste RBF; PRE y KRI ==> 3 Modelos. 3. Obtener medida de incertidumbre para c/u ==> Medidas de Incertidumbre. 4. Realizar “Model Averaging” ==> 4to Modelo (suma ponderada). 5. Optimizar c/u de los 4 modelos ==> 4 soluciones (Direct). 6. Comparar y analizar. 1. Diseño del Experimento y Muestreo ==> Conjunto de datos iniciales. 2. Ajuste RBF; PRE y KRI ==> 3 Modelos. 3. Obtener medida de incertidumbre para c/u ==> Medidas de Incertidumbre. 4. Realizar “Model Averaging” ==> 4to Modelo (suma ponderada). 5. Optimizar c/u de los 4 modelos ==> 4 soluciones (Direct). 6. Comparar y analizar. MetodologíaMetodología

En el primer paso se obtiene el conjunto de puntos iniciales o muestra (para cada problema y tamaño de muestra) mediante el método del hipercubo latino. Diseño del Experimento y Muestreo

Modelos Sustitutos Los modelos construidos a partir de la muestra fueron: Kriging (KRI). Regresión Polinómica (PRE). Funciones de Base Radial (RBF). Cada uno de ellos es un caso especial de: Los modelos construidos a partir de la muestra fueron: Kriging (KRI). Regresión Polinómica (PRE). Funciones de Base Radial (RBF). Cada uno de ellos es un caso especial de:

Kriging En nuestra versión de Kriging p = 1 y f(x) = 1. Lo cual hace β = μ. Y el modelo queda: μ + ε(x) con donde ; Y es el valor de la función en cada punto de la muestra. R es la matriz de correlación entre los puntos de la muestra y r(x) es el vector de correlación entre cada punto de la muestra y x.

Kriging R y r(x) se estiman mediante modelos de la forma: Donde cada C j es una función parametrizada decreciente de la distancia entre los puntos. Los C j usados fueron: exponencial generalizada, gaussiana, spline y esférica.

Regresión Polinómica Este es una caso especial de la regresión lineal. ε(x) se asume que es cero. Cada f i (x) es una de las siguientes: La constante 1. La función identidad de una de las variables. El producto de dos variables. El cuadrado de alguna variable. Este es una caso especial de la regresión lineal. ε(x) se asume que es cero. Cada f i (x) es una de las siguientes: La constante 1. La función identidad de una de las variables. El producto de dos variables. El cuadrado de alguna variable.

Funciones de Base Radial En este caso también se asume ε(x) como cero. Las f i (x) son funciones gausianas o multicuádricas con centro en algún punto de la muestra. Además una f i (x) puede ser constante. Potencialmente a todo punto de la muestre le puede corresponder una función; pero se seleccionan con el método de forward selection. El radio de cada función se escoge entre distintas opciones según una medida de error. En este caso también se asume ε(x) como cero. Las f i (x) son funciones gausianas o multicuádricas con centro en algún punto de la muestra. Además una f i (x) puede ser constante. Potencialmente a todo punto de la muestre le puede corresponder una función; pero se seleccionan con el método de forward selection. El radio de cada función se escoge entre distintas opciones según una medida de error.

Medidas de Incertidumbre Kriging: PRE y RBF: RBF:

Modelo Suma Ponderada

Resumen de Resultados R–Cuadrado

Resumen de Resultados Razón VEP / SSEP

Resumen de Resultados Optimización

Conclusiones La primera conclusión es que sí es eficaz usar más de un modelo para aproximar una función a partir de una muestra. Esta conclusión está basada en cuatro razones:

Conclusiones 1–. No hubo ningún modelo que fuera siembre, o la mayoría de las veces, el mejor. De hecho cada modelo fue el mejor en por lo menos dos casos.

Conclusiones 2–. El modelo Suma Ponderada obtuvo el mejor R 2 promedio con la muestra “Pequeña”, y el segundo mejor promedio con la muestra “Escasa”, siendo la diferencia con el mejor promedio, en este último caso, muy pequeña.

Conclusiones 3–. Cuando el modelo Suma Ponderada no tiene el mejor R 2 tiene el segundo mejor, con una excepción (P13, “Escasa”).

Conclusiones 4–. También se observó que el modelo Suma Ponderada, tiene la varianza de R 2 más baja o segunda más baja. Esto indica que la calidad de sus resultados es consistente.

Conclusiones Sin embargo la pregunta más importante que esta investigación trata de contestar es si vale la pena calcular más de un modelo desde el punto de vista de la optimización.

Conclusiones Aunque en algunos problemas la diferencia entre los óptimos encontrados con los distintos modelos no es muy grande, sí es frecuente que haya uno mucho peor que los demás; y, aunque suele ser el modelo de “Regresión Polinómica” quien presenta ese problema, no es poco frecuente que sea algún otro el peor.

Conclusiones De modo que sigue siendo válido el primero de los argumentos esgrimidos con respecto al modelado, como no hay un modelo que obtenga el mejor óptimo en todos los casos, y ni siquiera uno que sea siempre uno de los dos mejores (aparte del modelo Suma Ponderada), es necesario construir más de un modelo para obtener un óptimo confiable.

Conclusiones Otras observaciones y conclusiones son: El estimador estándar de la varianza del error de RBF, usando el método de Forward Selection, está significativamente sesgado hacia abajo. El estimador de la de Kriging en teoría es sesgado hacia abajo; pero esto no se notó.

Conclusiones Otras observaciones y conclusiones son: Los modelos RBF tuvieron, en promedio, más parámetros que la mitad del tamaño de la muestra (> 57%). Los coeficientes del modelo Suma Ponderada asumen que no hay correlación entre las predicciones de los modelos. Esto no es cierto.

Conclusiones Otras observaciones y conclusiones son: La estimación de la varianza del modelo Suma Ponderada estubo significativamente sesgada hacia abajo.

Recomendaciones Mejorar el modelo Suma Ponderada con información acerca de la correlación de las predicciones de los modelos. Implementar EGO sustituyendo Suma Ponderada por Kriging (o RBF); pero hay que tener en cuenta el sesgo en la estimación de la varianza de Suma Ponderada.

Recomendaciones Encontrar un buen estimador de la varianza de RBF que no sea tan ad– hoc. Los modelos RBF y PRE podrían integrarse como la parte determinística de un modelo de Kriging. (En vez de usar Suma Ponderada).