RELACIÓN GRÁFICA EN UN MODELO DE REGRESIÓN MULTIPLE. reg EARNINGS S EXP Source | SS df MS Number of obs = F( 2, 537) = Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval] S | EXP | _cons | La tabla de arriba muestra el resultado de una regresión de INGRESO, ingreso por hora en dólares, explicado por S, años de educación, y EXP, años de experiencia laboral. 1
2 Suponemos que nos interesa en particular la relación entre INGRESO y S, y deseamos representarla graficamente utilizando la muestra de datos.
3 Una línea simple sería engañosa.
4 Los años de educación están correlacioandos negativamente con la experiencia laboral. La línea no toma en cuenta esta relación, por lo que la línea de regresión subestima el impacto de los años de educación en el ingreso.. cor S EXP (obs=540) | S ASVABC S| EXP|
5. cor S EXP (obs=540) | S ASVABC S| EXP| Investigaremos gráficamente la distorsión de una regresión cuando se omiten variables relevantes (omitted variable bias).
6. cor S EXP (obs=540) | S ASVABC S| EXP| Para eliminar la distorsión, tenemos que descontar el componentes de INGRESOS y EDUCACION (S) que están relacionados con EXP, y después hacemos un diagrama de dispersión usando las variables “depuradas”.
. reg EARNINGS EXP Source | SS df MS Number of obs = F( 1, 538) = 2.98 Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval] EXP | _cons | predict EEARN, resid 7 Comenzamos haciendo una regresión de INGRESO sobre EXP, como se muestra arriba. Los residuales son la parte del INGRESO que no está relacionada con EXP. El comando ‘predict’ en Stata es el comando para guardar los residuales de la regresión más reciente— los cuales llamamos EEARN.
. reg S EXP Source | SS df MS Number of obs = F( 1, 538) = Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = S | Coef. Std. Err. t P>|t| [95% Conf. Interval] EXP | _cons | predict ES, resid 8 Realizamos lo mismo con S. Estimamos una regresión de S sobre EXP y guardamos los residuales en ES. ES contiene la información de educación que no está relacionada con o explicada por EXP.
9 Al graficar el diagrama de dispersión de EEARN contra ES tenemos una representación más fidedigna de la relación entre ambas variables. Esto, tanto en términos de la pendiente de la línea de tendencia “correcta” (en color negro), como en términos de la variación en torno a esa línea.
10 Como esperábamos, la línea de tendencia es más inclinada que aquella en la que no controlamos por EXP (mostrada en rojo).
. reg EEARN ES Source | SS df MS Number of obs = F( 1, 538) = Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = EEARN | Coef. Std. Err. t P>|t| [95% Conf. Interval] ES | _cons | 8.10e From multiple regression:. reg EARNINGS S EXP EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval] S | EXP | _cons | Esta es la regresión de EEARN con ES.
. reg EEARN ES Source | SS df MS Number of obs = F( 1, 538) = Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = EEARN | Coef. Std. Err. t P>|t| [95% Conf. Interval] ES | _cons | 8.10e De la regresión múltiple:. reg EARNINGS S EXP EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval] S | EXP | _cons | Una comprobación matemática de que la técnica funciona requiere algebra matricial. Nos limitaremos a verificar que el coeficiente estimado arriba es igual al de una regresión multiple.
. reg EEARN ES Source | SS df MS Number of obs = F( 1, 538) = Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = EEARN | Coef. Std. Err. t P>|t| [95% Conf. Interval] ES | _cons | 8.10e De la regresión múltiple:. reg EARNINGS S EXP EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval] S | EXP | _cons | Finalmente, un pequeño detalle técnico. Talvez notaron que el error estándar y el estadístico t no concuerdan. La razón de esto es que los residuales de la regresión están sobreestimados en un grado de libertad.
. reg EEARN ES Source | SS df MS Number of obs = F( 1, 538) = Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = EEARN | Coef. Std. Err. t P>|t| [95% Conf. Interval] ES | _cons | 8.10e De la regresión múltiple:. reg EARNINGS S EXP EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval] S | EXP | _cons | Esa regresión no ha tomado en cuenta el hecho de que hemos usado 1 grado de libertad al eliminar EXP del modelo de arriba.
Copyright Christopher Dougherty 1999–2006. This slideshow may be freely copied for personal use