Análisis de Regresión Lineal Curso de Verano ENCUP: Introducción al análisis cuantitativo en ciencias sociales Javier Aparicio División de Estudios Políticos, CIDE Julio 2009
Análisis de regresión lineal 1.Ajustar una regresión lineal: 2.Estimar los parámetros: 3.Interpretación del intercepto a y la pendiente b 4.Bondad de ajuste 5.Pruebas de hipótesis
Scatterplot
Modelo lineal E(Y|X)
Modelo de probabilidad conjunta
¿PIB Mercosur PIB Uruguay ?
1. Ajustando una regresión lineal Modelo probabilístico Modelo poblacional: Modelo muestral: Modelo estimado: La diferencia ente es el error estimado: La línea de mejor ajuste minimiza la SSE: queremos que el modelo explique la mayor proporción de la varianza de Y.
2. Estimación por Mínimos Cuadrados Ordinarios (OLS) – min(SSE) Estimando el intercepto a:
Estimando la pendiente b: 2. Estimación por Mínimos Cuadrados Ordinarios (OLS) – min(SSE)
Supongamos que queremos verificar la predicción de Mundell-Fleming sobre el efecto del PIB del resto del mundo en una economía pequeña como Uruguay. 2. Estimación de a y b: ejemplo
Supongamos que queremos verificar la predicción de Mundell-Fleming sobre el efecto del PIB del resto del mundo en una economía pequeña como Uruguay. 2. Estimación de a y b:
3. Interpretando los coeficientes : es el intercepto : es la pendiente Interpretación: : nivel esperado del GDP de Uruguay independientemente del GDP de Mercosur, en logarítmo (no muy importante aquí) : efecto marginal de una unidad adicional de GDP en Mercosur en el GDP de Uruguay Relación positiva, como lo predice la teoría de Mundell-Fleming.
4. Bondad de ajuste Mientras mayor es la proporción de la varianza de Y explicada por el modelo, mayor será la bondad de ajuste del modelo (R 2 )
4. Bondad de ajuste: ejemplo Interpretación: 82.8% de la variación del GDP en Uruguay se puede “explicar” por la variación en el GDP de Mercosur (excluyendo Uruguay)
5. Pruebas de hipótesis / significancia de los coeficientes ¿Cómo hacer inferencias sobre la relación “poblacional” entre X y Y? Pruebas de hipótesis. Estadístico t de Student: Si t > t* (valor estímado > valor crítico), rechazamos la H 0 y concluimos que es signficativamente diferente de cero. Para calcular t, necesitamos el error estándar de
5. Significancia estadística: ejemplo Dado que t>t*, rechazamos la hipótesis nula y concluimos que es significativamente distinta de 0: el GDP en Mercosur afecta el GDP en Uruguay.