Descargar la presentación
La descarga está en progreso. Por favor, espere
1
Más allá de la regresión lineal de medias
Abril 2016
2
Regresión múltiple, resumida (I)
Permite mantener de manera efectiva otros factores constantes mientras se examina el efecto de una determinada variable independiente sobre la variable dependiente. El método de mínimos cuadrados ordinarios es fácil de emplear para estimar el modelo de regresión múltiple. Cada estimación de pendiente mide el efecto parcial de la variable independiente correspondiente sobre la variable dependiente, manteniendo constantes todas las demás variables independientes.
3
Regresión múltiple, resumida (II)
R2 es la proporción de la variación muestral en la variable dependiente explicada por las variables independientes y se usa como una medida de la bondad de ajuste. Al evaluar modelos econométricos es importante no darle demasiada importancia a R2. Por outro lado, la omisión de una variable relevante ocasiona que los estimadores de MCO sean sesgados. Agregar una variable irrelevante a una ecuación por lo general hace que aumente la varianza del resto de los estimadores de MCO debido a la multicolinealidad.
4
Deficiencias de la regresión lineal
Se centra en el modelado de la media condicional de una respuesta variables sin tener en cuenta las propiedades de distribución condicional completa de la variable de respuesta. Solución: QRM (quantile-regression model).
5
Regresiones por quantil
Una opción para reducir el sesgo y la ineficiencia inherentes ante la falta de distribución normal y la presencia de heterocedasticidad en el modelo de regresión de la media tradicional por mínimos cuadrados. El cuantil de regresión es útil en que la no linealidad sus estimadores con respecto a la variable de respuesta que hace que estos estimadores son más robustas en presencia de outliers.
6
Regresiones por quantil, ejemplo...
El modelo de Regresión Lineal del logaritmo de la renta familiar mensual está dado por la siguiente ecuación: 𝑌= 𝛽 0 + 𝛽 1 𝑒𝑑𝑢𝑐+ 𝛽 2 𝑢𝑟𝑏𝑎𝑛𝑜+ 𝛽 3 𝑚𝑒𝑚𝑏𝑟𝑜𝑠 + 𝜀 𝑖 El modelo de Regresión Simultánea por Quantil correspondiente al modelo de regresión lineal tiene la siguiente especificación: 𝑌= 𝛽 0 𝑝 + 𝛽 1 𝑝 𝑒𝑑𝑢𝑐+ 𝛽 2 𝑝 𝑢𝑟𝑏𝑎𝑛𝑜+ 𝛽 3 𝑝 𝑚𝑒𝑚𝑏𝑟𝑜𝑠+ 𝜀 𝑖 𝑝 Donde 0 < 𝑝 < 1 indica la proporción de la población por debajo del quantil 𝑝.
7
Regresiones por quantil, ejemplo...
8
Modelos binarios (probit/logit)
Resultado binario: Si/No Éxito/Fracaso Dentro/Fuera (INSS) Variable latente: Podemos pensar en y* como la propensión subyacente latente de que y = 1 Ejemplo 1: Para la variable binaria “ataque al corazón/no ataque al corazón”, y * es la propensión de un ataque al corazón.
9
Modelos binarios (probit/logit) Métodos
Y* no es observado, no conocemos la distribución de sus errores. Se usa máxima verosimilitud (extensión de método de los momentos). Hacemos supuestos en relación com la distribución de los errores (probit versus logit)
10
Por qué MCO no es útil acá?
X = años de experiencia en el mercado de trabajo Y = 1 [si la persona pertenece a un sindicato] = 0 [si la persona no pertenece] X Y 1 Datos observados con la regresión MCO
11
Modelo de probabilidad lineal
La línea de regresión MCO en la lámina anterior es llamada “modelo de probabilidad lineal” Predice la probabilidad de que un individuo se unirá a un sindicato en función de sus años de experiencia en el mercado laboral Usando el modelo de probabilidad lineal, se estima la ecuación: usando podemos predecir la probabilidad
12
Modelo de probabilidad lineal( II)
Problemas con el modelo de probabilidad lineal 1) Probabilidades pronosticadas no necesariamente se encuentran dentro del rango de 0 a 1 2) Tenemos una forma muy específica de heterocedasticidad: errores para este modelo son Nota: los valores de se ubican a lo largo de la línea de MCO, pero los valores de Yi saltan entre 0 y 1. Esto crea gran variación en los errores 3) Los errores no son estándar Podemos utilizar el modelo de probabilidad lineal como una primera aproximación puede ser utilizado para valores de inicio en un problema de máxima verosimilitud
13
Contribución de McFadden
Sugerencia: curva que se extiende estrictamente entre 0 y 1 y colea en los límites, así: Y 1
14
Contribución de McFadden
Recordemos la función de distribución de probabilidad y la función de distribución acumulada de una distribución normal estándar: 1 PDF CDF
15
Probit vs Logit El probit utiliza la CDF normal estándar, mientras el logit utiliza una distribución “logística”. 1 Standard normal F(Z) Logistica G(Z)
16
Probit, estimación Ojo: Interpretación es de “mayor o menor” probabilidad log. Pero aún no obtenemos los efectos marginales (odds ratios por ejemplo)
17
Probit, interpretación
18
Violación de los supuestos (I)
Fuente: Ovielt Baltodano (2015)
19
Violación de los supuestos (II)
Fuente: Ovielt Baltodano (2015)
20
Seguimos luego....
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.