Clase N°11 Métodos de reducción de varianza

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

Objetivo Disponemos de estimaciones de la probabilidad de un suceso en dos muestras independientes. Queremos calcular qué tamaño muestral deberíamos utilizar.
DISEÑO DE EXPERIMENTOS
CONTENIDOS Teoría del muestreo ¿Cómo seleccionar una muestra?
Pronósticos, Series de Tiempo y Regresión
} LISSET BÁRCENAS MONTERROZA
KRIGING.
REGRESION Y CORRELACION LINEALES. REGRESION LINEAL SIMPLE Finalidad Estimar los valores de y (variable dependiente) a partir de los valores de x (variable.
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Covarianza muestral Sean x1, x2, ..., xn e y1, y2, ..., yn dos muestras aleatorias independientes de observaciones de X e Y respectivamente. La covarianza.
PROPIEDADES ESTADÍSTICAS DE LOS ESTIMADORES
MODELO DE REGRESIÓN MÚLTIPLE
Econometria 2. Modelo de Regresión Lineal Simple
Estadística 2010 Clase 5 Maestría en Finanzas Universidad del CEMA
Estimación por Intervalos de confianza
Regresión y correlación
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Análisis Estadístico de Datos Climáticos Facultad de Ciencias – Facultad de Ingeniería 2009 M. Barreiro – M. Bidegain – A. Díaz Análisis de correlación.
9 Regresión Lineal Simple
División de Estudios Políticos, CIDE
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
MEDIDAS DE CORRELACIÓN
Unidad VI: PRUEBAS DE HIPOTESIS
Clases 4 Pruebas de Hipótesis
Curso Práctico de Bioestadística Con Herramientas De Excel Fabrizio Marcillo Morla MBA (593-9)
Población y Muestra.
TIPOS DE MODELOS DE REGRESIÓN Y SUPUESTOS PARA EL MODELO A
Unidad V: Estimación de
Curso de Bioestadística. ANOVA
Elementos Básicos de Probabilidad y Estadística Javier Aparicio División de Estudios Políticos, CIDE Julio 2009
Investigación Experimental
Modelo de regresión con dos variables: Estimación
Unidad V: Estimación de
Estimación Sea una característica, un parámetro poblacional cuyo valor se desea conocer a partir de una muestra. Sea un estadístico ( función.
Métodos de calibración: regresión y correlación
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Capítulo 7 Estimación de Parámetros Estadística Computacional
Introducción a la Inferencia Estadística
Unidad II: Variables Aleatorias Concepto Discreta y Continua Fun. de densidad Fun. de probabilidad F. de distribución Esperanza y Varianza Propiedades.
Unidad V: Estimación de
Repaso de clase anterior
Variables estadísticas bidimensionales
P Y E 2012 Clase 11Gonzalo Perera1 Repaso de clase anterior Fórmula del bloqueo de Erlang. LFGN y el problema de la Robustez.
Distribuciones de probabilidad bidimensionales o conjuntas
Pruebas de hipótesis.
Elementos Básicos de Probabilidad y Estadística
Estimación Diferencia de dos medias
CASO II: Tamaño muestral grande (n > 30) cuando es desconocido Se sabe que para n>30 la distribución t de Student se aproxima a la distribución N(0;1)*.
Aplicaciones Estadísticas a las Finanzas Clase 1
ESTIMACIÓN DE PARÁMETROS
Variables estadísticas bidimensionales
MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO (“mas”)
Correlación Decimos que dos variables, X e Y, están correlacionadas cuando hay una relación cuantitativa entre ellas. X suele ser la variable independiente.
P y E 2012 Clase 15Gonzalo Perera1 Repaso de la clase anterior. Métodos de estimación.
Modelos de regresión lineal
Clase N°13 Comparación de configuraciones alternativas de un sistema
Clase N°1 Modelos de simulación discreta
Clase N°9 Análisis de output en el largo plazo (Parte II) ICS3723 Simulación Profesor Pedro Gazmuri.
Clase N°5 Generación de instancias de una v.a. (Parte II)
Clase N°4 Generación de instancias de una v.a. (Parte I) ICS3723 Simulación Profesor Pedro Gazmuri.
INFERENCIA ESTADÍSTICA
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
Intervalos de Confianza
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Estimación estadística
METODOS DE REMUESTREO: JACKKNIFE Y BOOTSTRAP
Free and Quick translation of Prof. Anderson's slides1 Analisis de Regresion Multiple y =  0 +  1 x 1 +  2 x  k x k + u 1. Estimacion.
LOGO Muestreo Pedro Godoy G.. LOGO Inferencia estadística La Inferencia Estadística es aquella rama de la Estadística mediante la cual se trata de sacar.
INTERVALO DE CONFIANZA
Transcripción de la presentación:

Clase N°11 Métodos de reducción de varianza ICS3723 Simulación Profesor Pedro Gazmuri

Métodos de reducción de varianza Variables de control Números aleatorios comunes Variables antitéticas

1. Variables de control X: variable aleatoria de output. Y: otra variable con valor esperado conocido. Construimos una combinación lineal de ellas: Dos alternativas: Variables internas de control: una v.a. de input del sistema. Variables externas: simular otro sistema similar pero analíticamente tratable, de modo de conocer E(Y) (también necesitaríamos la correlación entre X e Y).

1. Variables de control El método puede generalizarse a varias variables de control: Lo que importa es que las variables de control estén fuertemente correlacionadas (positiva o negativamente) con X. Consideremos el caso simple:

1. Variables de control Se tiene: Luego: Podemos identificar el valor a más conveniente: Corrección: definición de a* como argumento de un mínimo y no un mínimo en sí.

1. Variables de control Si reemplazamos a* en la expresión de Var(XC) obtenemos:

1. Variables de control En la expresión anterior ρX,Y es el coeficiente de correlación entre X e Y Problema: para calcular a* no conocemos cov(X, Y) ni Var(Y) Podemos estimarlas de la muestra de n réplicas:

1. Variables de control Pero â*(n) no es un estimador insesgado. El estimador final de la medida de desempeño que usaremos es Este estimador tampoco es insesgado, ya que â*(n) e son en general dependientes.

1. Variables de control Ejemplo: sistema M/M/1 Medida de desempeño: espera promedio en la cola de los 100 primeros clientes. Xj : demora promedio en la réplica j. Variable de control: Yj : promedio de los tiempos entre llegadas de los primeros 100 clientes. Estimamos , usando .

1. Variables de control Resultados: Valores teóricos: Corrección: el valor teórico es para E(Y), no para Y

1. Variables de control Resultados: Recordemos: Corrección: orden de resultados y definiciones

1. Variables de control Nuestro estimador será: Estimemos la reducción de varianza:

1. Variables de control Se tiene , comparado con Recordemos que es un estimador sesgado. Una alternativa para evitar el sesgo es volver a repetir el experimento tomando a fijo e igual a –17.6. No se estima a en el nuevo experimento.

1. Variables de Control Tomemos ahora 2 variables de control: Y₁= Promedio de los tiempos entre llegadas primeros 100 clientes. Y₂= Promedio de los tiempos de servicio de primeros 100 clientes.

De aquí se deduce que: En ambos casos las covarianzas se estiman a partir de las réplicas.

Se hicieron 50 réplicas y se obtuvieron los siguientes resultados: Estimador Valor Muestral Valor Teorico 0.9893 1 0.9082 0.9 0.0106 0.01 0.0099 0.01235 11.844

Luego:

Se hicieron 50 réplicas adicionales usando los valores estimados para a₁ y a₂. Se obtuvo: Debemos comparar este valor con Veamos los intervalos:

Sin variables de Control: Si hubiéramos hecho 100 réplicas: Con variables de Control:

Los intervalos de confianza son:

2. Números aleatorios comunes Se usa para la comparación de dos diseños alternativos. Diseño 1: Medida de desempeño: X1 Diseño 2: Medida de desempeño: X2 Queremos estimar E(X1) – E(X2) La idea es someter ambos sistemas a las mismas condiciones experimentales. Se utiliza la misma secuencia de números U(0,1) en ambos modelos. Se trata de introducir una correlación positiva entre ambos resultados.

2. Números aleatorios comunes Sean: X1j , j = 1,…,n: output de n réplicas del sistema 1 X2j , j = 1,…,n: output de n réplicas del sistema 2 Queremos estimar: Sean: Estimador:

2. Números aleatorios comunes Si las corridas fueran independientes: Para estimar en el caso correlacionado usamos su estimador muestral .

2. Números aleatorios comunes Este estimador se obtiene calculando: Puesto que estamos usando estimadores de las varianzas, no podemos saber qué tanto vamos a reducir la varianza.

2. Números aleatorios comunes Principio a utilizar: tener el convencimiento de que ambos modelos responderán en forma similar a valores grandes o pequeños de las variables aleatorias de input del modelo. Procedimiento: sincronizar los números aleatorios de modo que uno utilizado para un cierto propósito en el primer sistema sea utilizado para el mismo propósito en el segundo.

2. Números aleatorios comunes Ejemplo: λ,μ; ρ = λ/μ λ,μ/2; ρ = λ/μ Ambos tienen la misma intensidad de tráfico.

2. Números aleatorios comunes Interesa: tiempo promedio de espera en la cola de los primeros 100 clientes. Queremos escoger el sistema con menor valor. Teóricamente, se sabe que el segundo es mejor. Cuando hay 2 o más personas en el sistema, ambas son iguales para efectos de la espera. Pero cuando hay una, un individuo que llega al segundo sistema no espera nada; en el primero sí.

2. Números aleatorios comunes Experimento: ρ = 0.9 Se hicieron 100 réplicas independientes para 4 casos: Números aleatorios independientes para cada modelo: I Coordinación tiempos entre llegadas, servicios independientes: LL Coordinación tiempos de servicios: S Coordinación de ambos: LL + S

2. Números aleatorios comunes X1j : valor promedio demora 100 clientes en sistema 1, en a réplica j. X2j : valor promedio demora 100 clientes en sistema 2, en a réplica j. Para cada caso se estimó y se analizó si se obtenía la respuesta correcta (i.e. X2j < X1j). Se calculó la proporción de error en las 100 réplicas. Corrección: “En esta corrida” por “En cada corrida”

2. Números aleatorios comunes Obsérvese que al reducir estamos mejorando la precisión del intervalo de confianza para I LL S S+LL 25.5 11.6 10.5 0.1 Proporción Error 0.44 0.37 0.4 0.05

3. Variables antitéticas Se usa para el caso de un solo sistema. Idea: hacer pares de corridas, compensando un valor pequeño de la variable de interés con un valor grande. Se usa el promedio de ambas observaciones como un valor del output. Procedimiento: usar números aleatorios U(0,1) complementarios. Si U ~ U(0,1), entonces 1 – U ~ U(0,1).

3. Variables antitéticas Si uk ~ U(0,1) es usado con un propósito específico en un la primera corrida, se usa 1 – uk para el mismo propósito en la segunda corrida. Nota: Y(1) = F-1(uk) Si Y(1) es grande, Y(2) = F-1(1 – uk) es pequeño, ya que F es creciente.

3. Variables antitéticas Se hacen n pares de corridas (cada par independiente de los otros): Definimos

3. Variables antitéticas Queremos estimar: Queremos inducir una correlación negativa entre y .

3. Variables antitéticas Principio general: la variable de output del sistema tiene que ser monótona (creciente o decreciente) en la variable de input. Y : input, X : output Y grande  X grande, Y chico  X chico (o al revés) No existe garantía que el método funcione, podría pasar que Y grande ó Y chico  X grande.

3. Variables antitéticas Ejemplo: Sistema M/M/1, ρ = 0.9 : promedio de la demora en cola de los primeros 100 clientes. Variables antitéticas: Servicios Tiempo entre llegadas

3. Variables antitéticas Se hacen 100 réplicas: Independencia, es decir, . Sincronización (v. antitéticas, servicios y llegadas) Resultados: Independencia V. Antitéticas s2(100) 4.84 1.94 ½ Intervalo al 90% 0.36 0.23 -0.07 - 0.52