Uso de modelos Mixed Logit en modelación de elecciones discretas

Slides:



Advertisements
Presentaciones similares
ANALISIS PARAMÉTRICOS
Advertisements

1.1 Contraste de Bondad de Ajuste para Datos Categóricos
TEMA 6: CONTRASTES NO PARAMÉTRICOS
REGRESION LINEAL SIMPLE
CONTENIDOS Teoría del muestreo ¿Cómo seleccionar una muestra?
Modelos de Variable Dependiente Binaria -Logit y Probit-
KRIGING CON TENDENCIA.
Bivariadas y Multivariadas
Selección del modelo adecuado
KRIGING.
GEOESTADISTICA MULTIVARIADA
Modelado y simulación en Ingeniería Química. Manuel Rodríguez
INFERENCIA ESTADISTICA
Pruebas de Especificación en el Modelo de Regresión Múltiple
PROPIEDADES ESTADÍSTICAS DE LOS ESTIMADORES
MODELO DE REGRESIÓN MÚLTIPLE
PRUEBAS DE HIPOTESIS HIPOTESIS
Modelos de Variable Dependiente Binaria -Logit y Probit-
Diseño de Experimentos
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Econometria 2. Modelo de Regresión Lineal Simple
TEMA III.
Capitulo 10: La metodología Box-Jenkins
Regresión y correlación
Tema 1- Regresión lineal simple.
División de Estudios Políticos, CIDE
El supuesto 3 establece que el valor de la media de u, que depende de la X, dadas, es cero. Geométricamente, este supuesto se representa mediante.
NUMEROS PSEUDO ALEATORIOS
Características básicas de los datos económicos de series temporales
FUNCIONES DE DENSIDAD DE PROBABILIDAD
3er Encuentro de Usuarios de Stata en México
Sesión 2: Métodos Probabilísticos Básicos
Inferencia Estadística
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
TIPOS DE MODELOS DE REGRESIÓN Y SUPUESTOS PARA EL MODELO A
Seminario sobre evaluación económica de proyectos de transporte Madrid, 15 y 16 de noviembre LA PREDICCIÓN DE LA DEMANDA EN EVALUACIÓN DE PROYECTOS.
Principios del diseño experimental Maestría Ingeniería Industrial
Este procedimiento mide la relación entre la intensidad de un estímulo y la proporción de casos que presentan una cierta respuesta a dicho estímulo. Es.
Pronósticos, Series de Tiempo y Regresión
3. Funciones discriminantes para la f.d.p normal.
UNIVERSIDAD NACIONAL INTERCULTURAL DE LA AMAZONIA
Unidad V: Estimación de
ANALISIS DE FRECUENCIA EN HIDROLOGIA (3)
Reconocimiento de Formas en Data Mining Prof: Héctor Allende Capítulo 2 Aproximación Paramétrica.
Capítulo 7 Estimación de Parámetros Estadística Computacional
Titular: Agustín Salvia
Inferencia Estadística
Análisis y diseño de experimentos
Estimador de Efectos Fijos
Repaso de clase anterior
Eva Medina Moral Profesora Economía Aplicada (UAM) Febrero 2007
USO DEL “ANÁLISIS DE VARIANZA UNA-VÍA”, PARA:
Maestría en Transporte Regresamos... (el problema de la regresión lineal) Clase 5.
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I MODELO DE REGRESIÓN GENERAL 1 Profesor: Barland A. Huamán Bravo 2011 UNIVERSIDAD NACIONAL AGRARIA DE LA.
MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables.
P y E 2012 Clase 15Gonzalo Perera1 Repaso de la clase anterior. Métodos de estimación.
CONTRASTE DE HIPÓTESIS Dimensiones Largo275mm. 169 mm 2 Ancho175mm.49 mm 2 Alto175mm.49 mm 2 Peso16 Kg.1 Kg 2. SITUACIÓN PROBLEMA.
Clase N°11 Métodos de reducción de varianza
Ayudantía 1 - Taller 2 Modelos Agregados de Distribución
INFERENCIA ESTADÍSTICA
Pruebas paramétricas y no paramétricas
REGRESIÓN LINEAL SIMPLE
TEORIA CLASICA y TEORIA DE RESPUESTA AL ITEM ( TRI )
Licenciatura en Psicopedagogía: Métodos, Diseños y Técnicas de Investigación Psicológica Tema 9 Fiabilidad de las puntuaciones.
ESTIMACION DEL TAMAÑO DE LA MUESTRA. La primera pregunta que un estadístico debe contestar al planear una investigación de muestreo es, casi siempre, el.
DIFERENCIAS DE LAS TEORIAS DE LOS TEST TCT Y TRI
Auxiliar 11 IN4402-1: Aplicaciones de Probabilidades y Estadística en Gestión Profesora: Paola Bordón T. Auxiliar: Andrés E. Fernández V, 28 de Julio,
CI 43A Análisis de Sistemas de Transporte
CI 43A Análisis de Sistemas de Transporte
Transcripción de la presentación:

Uso de modelos Mixed Logit en modelación de elecciones discretas Marcela A. Munizaga Ricardo Alvarez-Daziano Universidad de Chile Santiago, 11 April, 2017

Contenido de la Presentación Correlación del término de error Análisis de Simulación logverosimilitud y parámetros iteraciones y tiempo de convergencia diferencias en modalidad predictiva Análisis con datos reales equivalencia entre modelos capacidad de recuperar efectos de correlación

Elección Discreta y Utilidad Aleatoria Teoría de la Utilidad Aleatoria Individuo maximiza su Utilidad, función de atributos de la alternativa y características de los individuos (Domencich y McFadden, 1975) Modelador no posee información completa del sistema  Hay componentes y atributos que se desconocen o no se pueden medir; aleatoriedad inherente a la naturaleza humana

Elección Discreta (cont.) No se puede asegurar con certeza qué alternativa será escogida  Supuestos sobre distribución de e  Modelo de elección específico (Ortúzar y Willumsen, 1994) Logit Multinomial MNL (McFadden, 1974) Supone errores iid Gumbel Expresión cerrada de la probabilidad de elección:

¿Por qué usar algo distinto del MNL? Correlación: Dependencia Heteroscedasticidad: Distinta varianza Dependencia  probabilidades y parámetros inconsistentes, predicciones poco confiables Propiedad de independencia de alternativas irrelevantes (patrones de sustitución constantes) Avances en computación y métodos numéricos permiten considerar modelos más generales

Correlación del término de error Motivación: el estudio de correlación Fuentes de correlación: alternativas similares, alternativas con componente común, variaciones en los gustos, agregación Modelos adecuados: Logit Jerárquico, Probit, Mixed Logit

Logit Jerárquico Agrupa las alternativas similares en nidos Ui=Vi+ei+nj alt i  nido j Matriz de covarianza: correlación, homoscedasticidad

Probit Ui=Vi+ei ei ~ Normal Matriz de covarianza general, sujeto a restricciones de identificabilidad Permite modelar correlación y heteroscedasticidad

Modelo Mixed Logit Se deriva de suponer e iid Gumbel, h término aleatorio adicional que distribuye f(h/q*) (Ben Akiva y Bolduc, 1996; McFadden y Train, 1997) Si e es iid Gumbel  probabilidad condicional en h Por lo tanto, la probabilidad total es:

Modelo Mixed Logit (cont.) Caso Particular (Modelo lineal de error compuesto): zin atributos relacionados con alternativa i e individuo n Propiedades ML aproxima cualquier modelo de utilidad aleatoria (McFadden y Train, 1997): ML con parámetros distribuidos normal, aproxima a un Probit. Razón de probabilidades depende de todo el conjunto de alternativas disponibles.

Modelo Mixed Logit (cont.) Estimación Condicional en q*, se obtiene un valor h  Pin(h) tiene forma Logit. Proceso se repite R veces: Probabilidad Simulada de escoger la alternativa Se maximiza la log verosimilitud simulada

Modelos de elección (cont.) Nested Mixed Logit Brownstone and Train (1999). Ui=Vi+ei+j ei ~ iid Gumbel j ~ Normal Matriz de covarianza: correlación, heteroscedasticidad

Análisis de Simulación Objetivo: estudiar los modelos en un caso en que se cumplen todos los supuestos Metodología: atributos según base de datos real se asume ciertos parámetros de gusto se genera las componentes determinística y aleatoria de la función de utilidad se calcula la elección de acuerdo a máx U se calibra los modelos con la base generada estímulo de políticas

Análisis de Simulación Uso del simulador en modalidad predictiva Predicciones con los modelos calibrados ¿En qué nos podemos fijar? Diferencias entre parámetros conocidos y calibrados Diferencias entre predicciones del simulador (realidad virtual) y predicciones modeladas

Influencia del Nº Repeticiones 4000 Observaciones 4 alternativas Correlación: 0,5 (Nido con dos alternativas) Dimensión: 3 Probit (Nº de alternativas - 1) ML (Estructura homsc. anidada: 1 componente común + 2 términos independientes)

Influencia del Nº Repeticiones Parámetro de Correlación : Probit

Influencia del Nº Repeticiones Parámetro de Correlación : MLR

Influencia del Nº Repeticiones Parámetro de Correlación : MLH

Influencia del Nº Repeticiones log verosimilitud

Influencia del Nº Repeticiones Diferencias en modalidad predictiva

Influencia del Nº Repeticiones Iteraciones and tiempo de convergencia

Caso: alternativas correlacionadas Síntesis 8000 Observaciones / r = 0,5 / He & Ho Mejor verosimilitud para ML ML: recupera adecuadamente todos los parámetros Probit: importante subestimación de la correlación LJ: efectos de escala, al usar datos heteroscedásticos NL – Probit – ML: buen nivel de respuesta MNL: pobre nivel de respuesta en comparación con ML y LJ

Datos reales Contexto: Corredor Las Condes - Centro, RP 9 alternativas, se incluye combinaciones auto chofer, auto acompañante, taxi colectivo, metro, bus, auto chofer-metro, auto acompañante -metro, taxi colectivo-metro, bus-metro 697 observaciones

Datos reales Estructura anidada 1 Transporte Público Bus Taxi Metro Bus Metro Auto Chofer Auto Acomp ACh Metro AAc Metro

Datos reales: Estructura 1

Datos reales Estructura anidada 2 Transporte Público Bus Taxi Metro Bus Metro Auto Chofer Auto Acomp AChMetro AAcMetro Auto

Datos reales: estructura 2

Síntesis y Discusión ML es un modelo útil, flexible y aplicable La estructura de covarianza se deduce de la especificación y debe ser debidamente justificada Nested Mixed Logit no es equivalente al LJ Probit aparece como un modelo costoso y muestra dificultades para recoger correlación