Uso de modelos Mixed Logit en modelación de elecciones discretas

Slides:

Advertisements

Presentaciones similares

ANALISIS PARAMÉTRICOS

Advertisements

1.1 Contraste de Bondad de Ajuste para Datos Categóricos

TEMA 6: CONTRASTES NO PARAMÉTRICOS

REGRESION LINEAL SIMPLE

CONTENIDOS Teoría del muestreo ¿Cómo seleccionar una muestra?

Modelos de Variable Dependiente Binaria -Logit y Probit-

KRIGING CON TENDENCIA.

Bivariadas y Multivariadas

Selección del modelo adecuado

GEOESTADISTICA MULTIVARIADA

Modelado y simulación en Ingeniería Química. Manuel Rodríguez

INFERENCIA ESTADISTICA

Pruebas de Especificación en el Modelo de Regresión Múltiple

PROPIEDADES ESTADÍSTICAS DE LOS ESTIMADORES

MODELO DE REGRESIÓN MÚLTIPLE

PRUEBAS DE HIPOTESIS HIPOTESIS

Modelos de Variable Dependiente Binaria -Logit y Probit-

Diseño de Experimentos

ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL

Econometria 2. Modelo de Regresión Lineal Simple

Capitulo 10: La metodología Box-Jenkins

Regresión y correlación

Tema 1- Regresión lineal simple.

División de Estudios Políticos, CIDE

El supuesto 3 establece que el valor de la media de u, que depende de la X, dadas, es cero. Geométricamente, este supuesto se representa mediante.

NUMEROS PSEUDO ALEATORIOS

Características básicas de los datos económicos de series temporales

FUNCIONES DE DENSIDAD DE PROBABILIDAD

3er Encuentro de Usuarios de Stata en México

Sesión 2: Métodos Probabilísticos Básicos

Inferencia Estadística

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT

TIPOS DE MODELOS DE REGRESIÓN Y SUPUESTOS PARA EL MODELO A

Seminario sobre evaluación económica de proyectos de transporte Madrid, 15 y 16 de noviembre LA PREDICCIÓN DE LA DEMANDA EN EVALUACIÓN DE PROYECTOS.

Principios del diseño experimental Maestría Ingeniería Industrial

Este procedimiento mide la relación entre la intensidad de un estímulo y la proporción de casos que presentan una cierta respuesta a dicho estímulo. Es.

Pronósticos, Series de Tiempo y Regresión

3. Funciones discriminantes para la f.d.p normal.

UNIVERSIDAD NACIONAL INTERCULTURAL DE LA AMAZONIA

Unidad V: Estimación de

ANALISIS DE FRECUENCIA EN HIDROLOGIA (3)

Reconocimiento de Formas en Data Mining Prof: Héctor Allende Capítulo 2 Aproximación Paramétrica.

Capítulo 7 Estimación de Parámetros Estadística Computacional

Titular: Agustín Salvia

Inferencia Estadística

Análisis y diseño de experimentos

Estimador de Efectos Fijos

Repaso de clase anterior

Eva Medina Moral Profesora Economía Aplicada (UAM) Febrero 2007

USO DEL “ANÁLISIS DE VARIANZA UNA-VÍA”, PARA:

Maestría en Transporte Regresamos... (el problema de la regresión lineal) Clase 5.

BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL

MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I MODELO DE REGRESIÓN GENERAL 1 Profesor: Barland A. Huamán Bravo 2011 UNIVERSIDAD NACIONAL AGRARIA DE LA.

MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables.

P y E 2012 Clase 15Gonzalo Perera1 Repaso de la clase anterior. Métodos de estimación.

CONTRASTE DE HIPÓTESIS Dimensiones Largo275mm. 169 mm 2 Ancho175mm.49 mm 2 Alto175mm.49 mm 2 Peso16 Kg.1 Kg 2. SITUACIÓN PROBLEMA.

Clase N°11 Métodos de reducción de varianza

Ayudantía 1 - Taller 2 Modelos Agregados de Distribución

INFERENCIA ESTADÍSTICA

Pruebas paramétricas y no paramétricas

REGRESIÓN LINEAL SIMPLE

TEORIA CLASICA y TEORIA DE RESPUESTA AL ITEM ( TRI )

Licenciatura en Psicopedagogía: Métodos, Diseños y Técnicas de Investigación Psicológica Tema 9 Fiabilidad de las puntuaciones.

ESTIMACION DEL TAMAÑO DE LA MUESTRA. La primera pregunta que un estadístico debe contestar al planear una investigación de muestreo es, casi siempre, el.

DIFERENCIAS DE LAS TEORIAS DE LOS TEST TCT Y TRI

Auxiliar 11 IN4402-1: Aplicaciones de Probabilidades y Estadística en Gestión Profesora: Paola Bordón T. Auxiliar: Andrés E. Fernández V, 28 de Julio,

CI 43A Análisis de Sistemas de Transporte

CI 43A Análisis de Sistemas de Transporte

Transcripción de la presentación:

Uso de modelos Mixed Logit en modelación de elecciones discretas Marcela A. Munizaga Ricardo Alvarez-Daziano Universidad de Chile Santiago, 11 April, 2017

Contenido de la Presentación Correlación del término de error Análisis de Simulación logverosimilitud y parámetros iteraciones y tiempo de convergencia diferencias en modalidad predictiva Análisis con datos reales equivalencia entre modelos capacidad de recuperar efectos de correlación

Elección Discreta y Utilidad Aleatoria Teoría de la Utilidad Aleatoria Individuo maximiza su Utilidad, función de atributos de la alternativa y características de los individuos (Domencich y McFadden, 1975) Modelador no posee información completa del sistema  Hay componentes y atributos que se desconocen o no se pueden medir; aleatoriedad inherente a la naturaleza humana

Elección Discreta (cont.) No se puede asegurar con certeza qué alternativa será escogida  Supuestos sobre distribución de e  Modelo de elección específico (Ortúzar y Willumsen, 1994) Logit Multinomial MNL (McFadden, 1974) Supone errores iid Gumbel Expresión cerrada de la probabilidad de elección:

¿Por qué usar algo distinto del MNL? Correlación: Dependencia Heteroscedasticidad: Distinta varianza Dependencia  probabilidades y parámetros inconsistentes, predicciones poco confiables Propiedad de independencia de alternativas irrelevantes (patrones de sustitución constantes) Avances en computación y métodos numéricos permiten considerar modelos más generales

Correlación del término de error Motivación: el estudio de correlación Fuentes de correlación: alternativas similares, alternativas con componente común, variaciones en los gustos, agregación Modelos adecuados: Logit Jerárquico, Probit, Mixed Logit

Logit Jerárquico Agrupa las alternativas similares en nidos Ui=Vi+ei+nj alt i  nido j Matriz de covarianza: correlación, homoscedasticidad

Probit Ui=Vi+ei ei ~ Normal Matriz de covarianza general, sujeto a restricciones de identificabilidad Permite modelar correlación y heteroscedasticidad

Modelo Mixed Logit Se deriva de suponer e iid Gumbel, h término aleatorio adicional que distribuye f(h/q*) (Ben Akiva y Bolduc, 1996; McFadden y Train, 1997) Si e es iid Gumbel  probabilidad condicional en h Por lo tanto, la probabilidad total es:

Modelo Mixed Logit (cont.) Caso Particular (Modelo lineal de error compuesto): zin atributos relacionados con alternativa i e individuo n Propiedades ML aproxima cualquier modelo de utilidad aleatoria (McFadden y Train, 1997): ML con parámetros distribuidos normal, aproxima a un Probit. Razón de probabilidades depende de todo el conjunto de alternativas disponibles.

Modelo Mixed Logit (cont.) Estimación Condicional en q*, se obtiene un valor h  Pin(h) tiene forma Logit. Proceso se repite R veces: Probabilidad Simulada de escoger la alternativa Se maximiza la log verosimilitud simulada

Modelos de elección (cont.) Nested Mixed Logit Brownstone and Train (1999). Ui=Vi+ei+j ei ~ iid Gumbel j ~ Normal Matriz de covarianza: correlación, heteroscedasticidad

Análisis de Simulación Objetivo: estudiar los modelos en un caso en que se cumplen todos los supuestos Metodología: atributos según base de datos real se asume ciertos parámetros de gusto se genera las componentes determinística y aleatoria de la función de utilidad se calcula la elección de acuerdo a máx U se calibra los modelos con la base generada estímulo de políticas

Análisis de Simulación Uso del simulador en modalidad predictiva Predicciones con los modelos calibrados ¿En qué nos podemos fijar? Diferencias entre parámetros conocidos y calibrados Diferencias entre predicciones del simulador (realidad virtual) y predicciones modeladas

Influencia del Nº Repeticiones 4000 Observaciones 4 alternativas Correlación: 0,5 (Nido con dos alternativas) Dimensión: 3 Probit (Nº de alternativas - 1) ML (Estructura homsc. anidada: 1 componente común + 2 términos independientes)

Influencia del Nº Repeticiones Parámetro de Correlación : Probit

Influencia del Nº Repeticiones Parámetro de Correlación : MLR

Influencia del Nº Repeticiones Parámetro de Correlación : MLH

Influencia del Nº Repeticiones log verosimilitud

Influencia del Nº Repeticiones Diferencias en modalidad predictiva

Influencia del Nº Repeticiones Iteraciones and tiempo de convergencia

Caso: alternativas correlacionadas Síntesis 8000 Observaciones / r = 0,5 / He & Ho Mejor verosimilitud para ML ML: recupera adecuadamente todos los parámetros Probit: importante subestimación de la correlación LJ: efectos de escala, al usar datos heteroscedásticos NL – Probit – ML: buen nivel de respuesta MNL: pobre nivel de respuesta en comparación con ML y LJ

Datos reales Contexto: Corredor Las Condes - Centro, RP 9 alternativas, se incluye combinaciones auto chofer, auto acompañante, taxi colectivo, metro, bus, auto chofer-metro, auto acompañante -metro, taxi colectivo-metro, bus-metro 697 observaciones

Datos reales Estructura anidada 1 Transporte Público Bus Taxi Metro Bus Metro Auto Chofer Auto Acomp ACh Metro AAc Metro

Datos reales: Estructura 1

Datos reales Estructura anidada 2 Transporte Público Bus Taxi Metro Bus Metro Auto Chofer Auto Acomp AChMetro AAcMetro Auto

Datos reales: estructura 2

Síntesis y Discusión ML es un modelo útil, flexible y aplicable La estructura de covarianza se deduce de la especificación y debe ser debidamente justificada Nested Mixed Logit no es equivalente al LJ Probit aparece como un modelo costoso y muestra dificultades para recoger correlación