Extensiones del modelo de regresión lineal con dos variables Algunos aspectos del análisis de regresión lineal se insertan bien en el marco del modelo de regresión lineal con dos variables que hemos analizado hasta ahora. Primero consideraremos la regresión a través del origen, es decir, una situación en la cual el término del intercepto, β1, está ausente del modelo. Luego veremos el tema de las unidades de medición, o la forma como se midieron X y Y, y cómo un cambio en las unidades de medición afecta los resultados de la regresión. Por último, abordaremos el tema de la forma funcional del modelo de regresión lineal. Hasta el momento, consideramos modelos lineales en los parámetros y en las variables. Sin embargo, recuerde que la teoría de regresión de los capítulos anteriores sólo exige linealidad en los parámetros; las variables pueden o no entrar linealmente en el modelo. Al considerar mo- delos que son lineales en los parámetros pero no necesariamente en las variables, en este capítulo mostraremos la forma como el modelo de dos variables resuelve algunos problemas prácticos de interés. Una vez entendidas las ideas de este capítulo, su extensión a los modelos de regresión múltiple es muy sencilla, como comprobaremos en los capítulos 7 y 8. 1 Regresión a través del origen Hay ocasiones en las cuales la función de regresión poblacional (FRP) de dos variables adquiere la siguiente forma: Yi = β2 Xi + u i (1.1) En este modelo, el término del intercepto está ausente o es cero, lo cual explica el nombre: re- gresión a través del origen. A manera de ilustración consideremos el modelo de asignación de precios de activos de capi- tal (CAPM, del inglés capital asset pricing model) de la teoría moderna de portafolios, la cual, en su versión de prima por riesgo, se expresa como1 (ER i − r f ) = βi (ERm − r f ) (1.2)
FIGURA 1 donde ERi = tasa esperada de rendimiento del título i. Modelos de regresión uniecuacionales donde ERi = tasa esperada de rendimiento del título i. ERm = tasa esperada de rendimiento del portafolios del mercado como la representa, por ejemplo, el índice compuesto de acciones S&P 500. rf = tasa de rendimiento libre de riesgo, por ejemplo, el rendimiento de los bonos del Tesoro estadounidense a 90 días. βi = el coeficiente Beta, una medida de riesgo sistemático, es decir, el riesgo que no se ha eliminado con la diversificación. Asimismo, es una medida del grado en el cual la i-ésima tasa de rendimiento del título se mueve con el mercado. Un βi > 1 implica un título volátil o riesgoso, mientras que βi < 1 es un título seguro. (Nota: No con- funda esta βi con el coeficiente de la pendiente de la regresión con dos variables, β2.) Si los mercados de capitales funcionan de manera eficiente, el CAPM postula que la prima esperada por el riesgo del título (= ERi − rf) es igual a ese coeficiente β del título multiplicado por la prima esperada del riesgo del mercado (= ERm − rf). Si el CAPM se mantiene se da la situación de la figura 6.1. La línea que aparece en la figura se conoce como línea del mercado de valores (LMV). Para fines empíricos, (6.1.2) suele expresarse así: R i − r f = βi ( R m − r f ) + u i (1.3) o R i − r f = αi + βi ( R m − r f ) + u i (1.4) Este último modelo se conoce como el Modelo del Mercado.2 Si el CAPM es válido, se espera que αi sea cero. (Véase la figura 6.2.) Observe que en (6.1.4) la variable dependiente, Y, es (Ri − rf), y la variable explicativa, X, es βi, el coeficiente de volatilidad, y no (Rm − rf). Por consiguiente, para realizar la regresión (6.1.4), se debe estimar primero βi, el cual se obtiene por lo general de la línea característica, como describimos en el ejercicio 5.5. (Para mayores detalles véase el ejercicio 8.28.) Como muestra este ejemplo, algunas veces la teoría que sirve de base requiere que el término del intercepto esté ausente del modelo. La hipótesis del ingreso permanente de Milton Friedman, que afirma que el consumo permanente es proporcional al ingreso permanente, es otro caso en el que el modelo de intercepto cero puede ser apropiado, como también en la teoría del análisis FIGURA 1 Riesgo sistemático. ER i – rf Línea del mercado de valores ER i – rf 1 βi
Xi Yi X 2 o 2 X 2 u2 xi yi x2 o 2 x2 u2 FIGURA 2 Extensiones del modelo de regresión lineal con dos variables FIGURA 2 El Modelo del Mercado de la teoría de portafolios (con el supuesto de que αi = 0). Ri – rf Prima por riesgo del título βi Riesgo sistemático de costos, que postula que la variable costo de producción es proporcional a la producción; y algunas versiones de la teoría monetarista que afirman que la tasa de cambio de los precios (es decir, la tasa de inflación) es proporcional a la tasa de cambio de la oferta monetaria. ¿Cómo se estiman modelos como (6.1.1) y qué problemas presentan? Para responder, primero escribimos la FRM de (6.1.1), a saber: Yi = βˆ2 Xi + uˆi (1.5) Ahora aplicamos el método MCO a (6.1.5) y se obtienen las siguientes fórmulas para βˆ2 y su varianza (las pruebas se presentan en el apéndice 6A, sección 6A.1): βˆ2 = Xi Yi X 2 (1.6) i o 2 var (βˆ2) = X 2 (1.7) i donde σ 2 se estima con u2 ˆi σˆ 2 = (1.8) n − 1 Es interesante comparar estas fórmulas con las obtenidas cuando se incluye el término del inter- cepto en el modelo: βˆ2 = xi yi x2 (1.6) i o 2 var (βˆ2) = x2 (3.1) i u2 ˆi σˆ 2 = (3.5) n − 2
X 2 r 2 para el modelo de regresión a través del origen EJEMPLO 6.1 Modelos de regresión uniecuacionales Deben ser obvias las diferencias entre estos dos conjuntos de fórmulas: en el modelo sin término de intercepto se utilizan sumas de cuadrados simples y productos cruzados, pero en el modelo con intercepto, se utilizan sumas de cuadrados ajustadas (de la media) y productos cru- zados. Segundo, los gl para calcular σˆ 2 son (n − 1) en el primer caso y (n − 2) en el segundo. (¿Por qué?) Aunque el modelo sin intercepto o con intercepto cero puede ser apropiado en algunas oca- siones, deben observarse algunas características de este modelo. Primero, uˆi, que es siempre cero en el modelo con intercepto (el modelo convencional), no necesita serlo cuando ese término está ausente. En resumen, uˆi no necesita ser cero en la regresión a través del origen. Segundo, r 2, el coeficiente de determinación presentado en el capítulo 3, que siempre es no negativo en el modelo convencional, en ocasiones puede volverse negativo en el modelo sin intercepto. Este resultado anómalo surge porque el r 2 que presentamos en el capítulo 3 supone explícitamente que el intercepto está incluido en el modelo. Por consiguiente, el r 2 calculado convencional- mente puede no ser apropiado en los modelos de regresión a través del origen.3 r 2 para el modelo de regresión a través del origen Como recién mencionamos y más adelante analizaremos en mayor detalle en el apéndice 6A, sección 6A.1, el r 2 convencional del capítulo 3 no es apropiado en regresiones que no incluyan o no consideren el intercepto. Pero se puede calcular para tales modelos, lo que se conoce como el r 2 simple, el cual se define como 2 Xi Yi r 2 simple = X 2 (1.9) i Yi 2 Nota: Se trata de sumas de cuadrados simples (es decir, no corregidas por la media) y de produc- tos cruzados. A pesar de que este r 2 simple satisface la relación 0 < r2 < 1, no es directamente comparable con el valor r 2 convencional. Por esta razón, algunos autores no presentan el valor r 2 en los mo- delos de regresión con intercepto cero. Debido a las características especiales de este modelo, se debe tener mucho cuidado al utili- zar el modelo de regresión con intercepto cero. A menos que haya una expectativa a priori muy sólida, es aconsejable apegarse al modelo convencional con presencia de intercepto. Esto tiene una doble ventaja. Primero, si se incluye en el modelo el término del intercepto pero es estadís- ticamente no significativo (es decir, estadísticamente igual a cero), para todos los fines prácticos se tiene una regresión a través del origen.4 Segundo y más importante, si el modelo sí tiene un intercepto pero insistimos en ajustar una regresión a través del origen, cometeríamos un error de especificación. Veremos esto en detalle en el capítulo 7. EJEMPLO 6.1 La tabla 6.1 presenta datos mensuales sobre los rendimientos excedentes Yt(%) de un índice de 104 acciones del sector de bienes de consumo cíclico y los rendimientos excedentes Xt(%) del índice de todo el mercado de valores en el Reino Unido, correspondientes al periodo 1980- 1999, para un total de 240 observaciones.5 Por rendimientos excedentes se entiende el rendi- miento superior al que ofrece un activo sin riesgo (véase el modelo CAPM).
Extensiones del modelo de regresión lineal con dos variables TABLA 1 OBS 1980:01 Y 6.08022852 X 7.263448404 1984:12 3.52786616 3.191554763 1980:02 —0.924185461 6.339895504 1985:01 4.554587707 3.907838688 1980:03 —3.286174252 —9.285216834 1985:02 5.365478677 —1.708567484 1980:04 5.211976571 0.793290771 1985:03 4.525231564 0.435218492 1980:05 —16.16421111 —2.902420985 1985:04 2.944654344 0.958067845 1980:06 —1.054703649 8.613150875 1985:05 —0.268599528 1.095477375 1980:07 11.17237699 3.982062848 1985:06 —3.661040481 —6.816108909 1980:08 —11.06327551 —1.150170907 1985:07 —4.540505062 2.785054354 1980:09 —16.77699609 3.486125868 1985:08 9.195292816 3.900209023 1980:10 —7.021834032 4.329850278 1985:09 —1.894817019 —4.203004414 1980:11 —9.71684668 0.936875279 1985:10 12.00661274 5.60179802 1980:12 5.215705717 —5.202455846 1985:11 1.233987382 1.570093976 1981:01 —6.612000956 —2.082757509 1985:12 —1.446329607 —1.084427121 1981:02 4.264498443 2.728522893 1986:01 6.023618851 0.778669473 1981:03 4.916710821 0.653397106 1986:02 10.51235756 6.470651262 1981:04 22.20495946 6.436071962 1986:03 13.40071024 8.953781192 1981:05 —11.29868524 —4.259197932 1986:04 —7.796262998 —2.387761685 1981:06 —5.770507783 0.543909707 1986:05 0.211540446 —2.873838588 1981:07 —5.217764717 —0.486845933 1986:06 6.471111064 3.440269098 1981:08 16.19620175 2.843999508 1986:07 —9.037475168 —5.891053375 1981:09 —17.16995395 —16.4572142 1986:08 —5.47838091 6.375582004 1981:10 1.105334728 4.468938171 1986:09 —6.756881852 —5.734839396 1981:11 11.6853367 5.885519658 1986:10 —2.564960223 3.63088408 1981:12 —2.301451728 —0.390698164 1986:11 2.456599468 —1.31606687 1982:01 8.643728679 2.499567896 1986:12 1.476421303 3.521601216 1982:02 —11.12907503 —4.033607075 1987:01 17.0694004 8.673412896 1982:03 1.724627956 3.042525777 1987:02 7.565726727 6.914361923 1982:04 0.157879967 0.734564665 1987:03 —3.239325817 —0.460660854 1982:05 —1.875202616 2.779732288 1987:04 3.662578335 4.295976077 1982:06 —10.62481767 —5.900116576 1987:05 7.157455113 7.719692529 1982:07 —5.761135416 3.005344385 1987:06 4.774901623 3.039887622 1982:08 5.481432596 3.954990619 1987:07 4.23770166 2.510223804 1982:09 —17.02207459 2.547127067 1987:08 —0.881352219 —3.039443563 1982:10 7.625420708 4.329008106 1987:09 11.49688416 3.787092018 1982:11 —6.575721646 0.191940594 1987:10 —35.56617624 —27.86969311 1982:12 —2.372829861 —0.92167555 1987:11 —14.59137369 —9.956367094 1983:01 17.52374936 3.394682577 1987:12 14.87271664 7.975865948 1983:02 1.354655809 0.758714353 1988:01 1.748599294 3.936938398 1983:03 16.26861049 1.862073664 1988:02 —0.606016446 —0.32797064 1983:04 —6.074547158 6.797751341 1988:03 —6.078095523 —2.161544202 1983:05 —0.826650702 —1.699253628 1988:04 3.976153828 2.721787842 1983:06 3.807881996 4.092592402 1988:05 —1.050910058 —0.514825422 1983:07 0.57570091 —2.926299262 1988:06 3.317856956 3.128796482 1983:08 3.755563441 1.773424306 1988:07 0.407100105 0.181502075 1983:09 —5.365927271 —2.800815667 1988:08 —11.87932524 —7.892363786 1983:10 —3.750302815 —1.505394995 1988:09 —8.801026046 3.347081899 1983:11 4.898751703 4.18696284 1988:10 6.784211277 3.158592144 1983:12 4.379256151 1.201416981 1988:11 —10.20578119 —4.816470363 1984:01 16.56016188 6.769320788 1988:12 —6.73805381 —0.008549997 1984:02 1.523127464 —1.686027417 1989:01 12.83903643 13.46098219 1984:03 1.0206078 5.245806105 1989:02 3.302860922 —0.764474692 1984:04 —3.899307684 1.728710264 1989:03 —0.155918301 2.298491097 1984:05 —14.32501615 —7.279075595 1989:04 3.623090767 0.762074588 1984:06 3.056627177 —0.77947067 1989:05 —1.167680873 —0.495796117 1984:07 —0.02153592 —2.439634487 1989:06 —1.221603303 1.206636013 1984:08 3.355102212 8.445977813 1989:07 5.262902744 4.637026116 1984:09 0.100006778 1.221080129 1989:08 4.845013219 2.680874116 1984:10 1.691250318 2.733386772 1989:09 —5.069564838 —5.303858035 1984:11 8.20075301 5.12753329 1989:10 —13.57963526 —7.210655599 (continúa)
TABLA 1 (continuación) OBS 1989:11 Y 1.100607603 X 5.350185944 1994:1 2 —4.225370964 0.26428025 9 1989:12 4.925083189 4.106245855 1995:01 —6.302392617 —2.420388431 1990:01 —2.532068851 —3.629547374 1995:02 1.27867637 0.138795213 1990:02 —6.601872876 —5.205804299 1995:03 10.90890516 3.231656585 1990:03 —1.023768943 —2.183244863 1995:04 2.497849434 2.215804682 1990:04 —7.097917266 —5.408563794 1995:05 2.891526594 3.856813589 1990:05 6.376626925 10.57599169 1995:06 —3.773000069 —0.952204306 1990:06 1.861974711 —0.338612099 1995:07 8.776288715 4.020036363 1990:07 —5.591527585 —2.21316202 1995:08 2.88256097 1.423600345 1990:08 —15.31758975 —8.476177427 1995:09 2.14691333 —0.037912571 1990:09 —10.17227358 —7.45941471 1995:10 —4.590104662 —1.17655329 1990:10 —2.217396045 —0.085887763 1995:11 —1.293255187 3.760277356 1990:11 5.974205798 5.034770534 1995:12 —4.244101531 0.434626357 1990:12 —0.857289036 —1.767714908 1996:01 6.647088904 1.906345103 1991:01 —3.780184589 0.189108456 1996:02 1.635900742 0.301898961 1991:02 20.64721437 10.38741504 1996:03 7.8581899 —0.314132324 1991:03 10.94068018 2.921913827 1996:04 0.789544896 3.034331741 1991:04 —3.145639589 0.971720188 1996:05 —0.907725397 —1.497346299 1991:05 —3.142887645 —0.4317819 1996:06 —0.392246948 —0.894676854 1991:06 —1.960866141 —3.342924986 1996:07 —1.035896351 —0.532816274 1991:07 7.330964031 5.242811509 1996:08 2.556816005 3.863737088 1991:08 7.854387926 2.880654691 1996:09 3.131830038 2.118254897 1991:09 2.539177843 —1.121472224 1996:10 —0.020947358 —0.853553262 1991:10 —1.233244642 —3.969577956 1996:11 —5.312287782 1.770340939 1991:11 —11.7460404 —5.707995062 1996:12 —5.196176326 1.702551635 1991:12 1.078226286 1.502567049 1997:01 —0.753247124 3.465753348 1992:01 5.937904622 2.599565094 1997:02 —2.474343938 1.115253221 1992:02 4.113184542 0.135881087 1997:03 2.47647802 —2.057818461 1992:03 —0.655199392 —6.146138064 1997:04 —1.119104196 3.57089955 1992:04 15.28430278 10.45736831 1997:05 3.352076269 1.953480438 1992:05 3.994517585 1.415987046 1997:06 —1.910172239 2.458700404 1992:06 —11.94450998 —8.261109424 1997:07 0.142814607 2.992341297 1992:07 —2.530701327 —3.778812167 1997:08 10.50199263 —0.457968038 1992:08 —9.842366221 —5.386818488 1997:09 12.98501943 8.111278967 1992:09 18.11573724 11.19436372 1997:10 —4.134761655 —6.967124504 1992:10 0.200950206 3.999870038 1997:11 —4.148579856 —0.155924791 1992:11 1.125853097 3.620674752 1997:12 —1.752478236 3.853283433 1992:12 7.639180786 2.887222251 1998:01 —3.349121498 7.379466014 1993:01 2.919569408 1.336746091 1998:02 14.07471304 4.299097886 1993:02 —1.062404105 1.240273846 1998:03 7.791650968 3.410780517 1993:03 1.292641409 0.407144312 1998:04 5.154679109 —0.081494993 1993:04 0.420241384 —1.734930047 1998:05 3.293686179 —1.613131159 1993:05 —2.514080553 1.111533687 1998:06 —13.25461802 —0.397288954 1993:06 0.419362276 1.354127742 1998:07 —7.714205916 —2.237365283 1993:07 4.374024535 1.943061568 1998:08 —15.26340483 —12.4631993 1993:08 1.733528075 4.961979827 1998:09 —15.22865141 —5.170734985 1993:09 —3.659808969 —1.618729936 1998:10 15.96218038 11.70544788 1993:10 5.85690764 4.215408608 1998:11 —8.684089113 —0.380200223 1993:11 —1.365550294 1.880360165 1998:12 17.13842369 4.986705187 1993:12 —1.346979017 5.826352413 1999:01 —1.468448611 2.493727994 1994:01 12.89578758 2.973540693 1999:02 8.5036 0.937105259 1994:02 —5.346700561 —5.479858563 1999:03 10.8943073 4.280082506 1994:03 —7.614726564 —5.784547088 1999:04 13.03497394 3.960824402 1994:04 10.22042923 1.157083438 1999:05 —5.654671597 —4.499198079 1994:05 —6.928422261 —6.356199493 1999:06 8.321969316 3.656745699 1994:06 —5.065919037 —0.843583888 1999:07 0.507652273 —2.503971473 1994:07 7.483498556 5.779953224 1999:08 —5.022980561 —0.121901923 1994:08 1.828762662 3.298130184 1999:09 —2.305448839 —5.388032432 1994:09 —5.69293279 —7.110010085 1999:10 —1.876879466 4.010989716 1994:10 —2.426962489 2.968005597 1999:11 1.348824769 6.265312975 1994:11 2.125100668 —1.531245158 1999:12 —2.64164938 4.045658427 152
EJEMPLO 6.1 (continuación) Extensiones del modelo de regresión lineal con dos variables EJEMPLO 6.1 (continuación) En primer lugar ajustamos el modelo (6.1.3) a estos datos. Con EViews6 obtuvimos los siguientes resultados de regresión, que se presentan en el formato estándar de EViews. Variable dependiente: Y Método: mínimos cuadrados Muestra: 1980M01 1999M12 Observaciones incluidas: 240 Coeficiente Error estándar Estadístico t Probabilidad X 1.155512 0.074396 15.53200 0.0000 R cuadrada 0.500309 Media de la variable dependiente 0.499826 R cuadrada ajustada† Desviación estándar de la variable 7.849594 dependiente 1.972853 *Estudiaremos este estadístico en el capítulo 12. † Véase el capítulo 7. Como muestran estos resultados, el coeficiente de la pendiente (el coeficiente Beta) es muy significativo, pues su valor p es muy pequeño. La interpretación en este caso es que si la tasa excedente del mercado aumenta un punto porcentual, el rendimiento excedente del índice del sector de bienes de consumo aumenta alrededor de 1.15 puntos porcentuales. El coeficiente de la pendiente no es sólo estadísticamente significativo, sino que es significativamente mayor que 1 (¿puede verificar esto?). Si un coeficiente Beta es mayor que 1, se dice que ese título (en este caso, un portafolios de 104 acciones) es volátil; se mueve más que proporcionalmente con el índice general del mercado de valores. Sin embargo, este resultado no debe sorprender, por- que en este ejemplo se consideran acciones del sector de bienes de consumo cíclico, como los bienes duraderos de uso doméstico, automóviles, textiles y equipo deportivo. Si ajustamos el modelo (6.1.4), obtenemos los siguientes resultados: Variable dependiente: Y Método: mínimos cuadrados Muestra: 1980M01 1999M12 Observaciones incluidas: 240 Error estándar de regresión 5.548786 Estadístico de Durbin-Watson* Suma de cuadrados de residuos 7 358.578 Coeficiente Error estándar Estadístico t Probabilidad C –0.447481 0.362943 –1.232924 0.2188 X 1.171128 0.075386 15.53500 0.0000 R cuadrada 0.503480 Media de la variable dependiente 0.499826 R cuadrada ajustada 0.501394 Desviación estándar de la variable dependiente 7.849594 Error estándar de regresión 5.542759 Estadístico de Durbin-Watson 1.984746 Suma de cuadrados de residuos 7 311.877 Probabilidad (estadístico F) 0.000000 Estadístico F 241.3363 En estos resultados observamos que el intercepto no es estadísticamente diferente de cero, aunque el coeficiente de la pendiente (el coeficiente Beta) es muy significativo estadísticamente. Esto indica que el modelo de regresión a través del origen se ajusta bien a los datos. Además, en términos estadísticos, no hay diferencia entre los valores del coeficiente de la pendiente en los dos modelos. Observe que el error estándar del coeficiente de la pendiente en el modelo de regresión a través del origen es un poco menor que el del modelo con el intercepto presente, lo cual apoya el argumento de Theil de la nota 4. Aun en este caso, el coeficiente de la pendiente es estadísticamente mayor que 1, lo que una vez más confirma que los rendimientos de las ac- ciones del sector de bienes de consumo cíclico son volátiles. A propósito, observe que el valor de r 2 para el modelo de regresión a través del origen debe tomarse con ciertas reservas, pues la fórmula tradicional de r 2 no es aplicable en tales modelos. Sin embargo, EViews presenta de manera habitual el valor estándar de r 2, incluso para estos modelos.
2 Escalas y unidades de medición Modelos de regresión uniecuacionales 2 Escalas y unidades de medición Para entender las ideas de esta sección, considere la información de la tabla 6.2, referente a la inversión doméstica privada bruta (IDPB) de Estados Unidos y al producto interno bruto (PIB) en miles de millones y en millones de dólares de 2000 ajustados por la inflación. Suponga que en la regresión de la IDPB sobre el PIB, un investigador utiliza información medida en miles de millones de dólares y otro expresa estos datos en millones de dólares. ¿Serán iguales los resultados de la regresión en ambos casos? De no ser así, ¿qué resultados deben usarse? En resumen, ¿las unidades con que se mide la variable regresada y la(s) variable(s) regresora(s) influyen de algún modo en los resultados de la regresión? De ser así, ¿qué curso razonable debe seguirse en la selección de las unidades de medición para el análisis de regresión? Para responder estas preguntas, procedamos sistemáticamente. Sea Yi = βˆ1 + βˆ2 Xi + uˆ i (2.1) donde Y = IDPB y X = PIB. Defina Y ∗ i = w1Yi (2.2) (2.3) X ∗ i = w2 Xi donde w1 y w2 son constantes, denominadas factores de escala; w1 puede ser igual o diferente a w2. De (6.2.2) y (6.2.3) es claro que Y ∗ y X ∗ son Yi y Xi reescaladas. Por tanto, si Yi y Xi se miden i i en miles de millones de dólares y se desea expresarlas en millones de dólares, se tendrá Y ∗ = 1 000 Yi y Xi = 1 000 Xi; aquí w1 = w2 = 1 000. ∗ i Ahora considere la regresión con las variables i y Xi : Y ∗ ∗ Y ∗ ∗ ∗ ∗ ∗ i = βˆ1 + βˆ2 Xi + uˆi (2.4) donde Y ∗ = w1Yi , X ∗ = w2 Xi y uˆ∗ = w1uˆi . (¿Por qué?) i i i TABLA 2 Inversión nacional pri- vada bruta y PIB, Esta- dos Unidos, 1990-2005 (miles de millones de dólares [de 2000] ajus- tados por la inflación, salvo donde se indica lo contrario; datos trimes- trales con tasas anuales ajustadas por estaciona- lidad) Año 1990 IDPBmm 886.6 IDPBm 886 600.0 PIBmm 7 112.5 PIBm 7 112 500.0 1991 829.1 829 100.0 7 100.5 7 100 500.0 1992 878.3 878 300.0 7 336.6 7 336 600.0 1993 953.5 953 500.0 7 532.7 7 532 700.0 1994 1 042.3 1 042 300.0 7 835.5 7 835 500.0 1 109 600.0 8 031.7 8 031 700.0 1 209 200.0 8 328.9 8 328 900.0 1 320 600.0 8 703.5 8 703 500.0 1 455 000.0 9 066.9 9 066 900.0 1 576 300.0 9 470.3 9 470 300.0 1 679 000.0 9 817.0 9 817 000.0 1995 1 109.6 1996 1 209.2 1997 1 320.6 1998 1 455.0 1999 1 576.3 2000 1 679.0 Fuente: Economic Report of the President, 2007, tabla B-2, p. 328. 2001 2002 2003 2004 2005 1 629.4 1 544.6 1 596.9 1 713.9 1 842.0 1 629 400.0 1 544 600.0 1 596 900.0 1 713 900.0 1 842 000.0 9 890.7 10 048.8 10 301.0 10 703.5 11 048.6 9 890 700.0 10 048 800.0 10 301 000.0 10 703 500.0 11 048 600.0 Nota: IDPBmm = inversión doméstica privada bruta (miles de millones de dólares de 2000). IDPBm = inversiones nacionales privadas brutas (millones de dólares de 2000). PIBmm = producto interno bruto (miles de millones de dólares de 2000). PIBm = producto interno bruto (millones de dólares de 2000).
xi yi x2 X 2 x2 o 2 x2 u2 βˆ∗ ∗ ∗ ∗ x∗ ∗ βˆ∗ x∗2 X ∗2 x∗2 o ∗2 u∗2 βˆ∗ Extensiones del modelo de regresión lineal con dos variables Deseamos encontrar las relaciones entre los siguientes pares: 1. βˆ1 y βˆ∗ 1 2. βˆ2 y βˆ∗ 2 3. var (βˆ1) y var(βˆ∗) 1 4. var (βˆ2) y var(βˆ∗) 2 5. σˆ 2 y σˆ ∗2 6. r 2 y r 2 xy x∗ y∗ De la teoría de mínimos cuadrados, sabemos (véase el capítulo 3) que βˆ1 = Y¯ − βˆ2 X¯ (2.5) βˆ2 = xi yi x2 (2.6) i X 2 var (βˆ1) = i σ 2 (2.7) n x2 i o 2 var (βˆ2) = x2 (2.8) i ˆi u2 σˆ 2 = (2.9) n − 2 Del mismo modo, al aplicar el método MCO a (6.2.4), obtenemos βˆ∗ ∗ ∗ ∗ 1 = Y¯ − βˆ2 X¯ (2.10) x∗ ∗ βˆ∗ 2 = i yi x∗2 (2.11) i X ∗2 var (βˆ∗) = 1 n x∗2 i ∗2 σ (2.12) i o ∗2 var (βˆ∗) = 2 (2.13) x i ∗2 u∗2 ˆi σˆ ∗2 = (2.14) (n − 2) Con estos resultados es fácil establecer relaciones entre estos dos conjuntos de parámetros esti mados. Todo lo que se debe hacer es recordar las siguientes relaciones: Y ∗ = w1Yi (o y∗ = w1 yi ); Xi = w2 Xi (o xi = w2 xi ); uˆi = w1uˆi ; Y¯ = w1Y¯ ; y X¯ = w2 X¯ . Con estas definiciones, el lec- ∗ ∗ ∗ ∗ ∗ i i tor puede verificar fácilmente que βˆ∗ 2 = w1 β2 ˆ (2.15) w2 βˆ∗ 1 = w1βˆ1 (2.16) (2.17) (2.18) σˆ ∗2 = w2σˆ 2 1 var (βˆ∗) = w2 var (βˆ1) 1 1
w1 2 r 2 2 EJEMPLO 2 Relación entre la IDPB y el PIB, Modelos de regresión uniecuacionales w1 2 w var (βˆ∗) = 2 var (βˆ2) (2.19) 2 r 2 2 xy = rx∗ y∗ (2.20) De los resultados anteriores debe quedar claro que, con los resultados de regresión basados en una escala de medición, se pueden obtener los resultados basados en otra, una vez que se co- nozcan los factores de escala, w. En la práctica, sin embargo, se deben escoger las unidades de medición en forma razonable; no tiene objeto manejar todos esos ceros al expresar números en millones o en miles de millones de dólares. De los resultados de (6.2.15) hasta (6.2.20) se derivan fácilmente algunos casos especiales. Por ejemplo, si w1 = w2, es decir, si son idénticos los factores de escala, el coeficiente de la pen- diente y su error estándar permanecen inalterados en el cambio de escala de (Yi, Xi) a (Y ∗, X ∗), i i lo cual intuitivamente debería ser claro. Sin embargo, el intercepto y su error estándar están multiplicados por w1. Si la escala X no se cambia (es decir, w2 = 1), pero la escala Y se cambia por el factor w1, el coeficiente de la pendiente, al igual que el intercepto y sus errores estándar respectivos, se multiplican por el mismo factor w1. Por último, si la escala Y permanece inalterada (es decir, w1 = 1), pero la escala X se cambia por el factor w2, el coeficiente de la pendiente y su error estándar se multiplican por el factor (1/w2), pero el coeficiente del intercepto y su error estándar permanecen inalterados. Sin embargo, debe observarse que la transformación de la escala (Y, X) a la escala (Y ∗, X ∗) no afecta las propiedades de los estimadores de MCO analizadas en los capítulos anteriores. EJEMPLO 2 Relación entre la IDPB y el PIB, Estados Unidos, 1990-2005 Para demostrar los resultados teóricos anteriores, consideremos de nuevo los datos presentados en la tabla 6.2 y examinemos los siguientes resultados (las cifras entre paréntesis son los errores estándar estimados). Si las escalas de la IDPB y del PIB están en miles de millones de dólares: IDPBt = −926.090 + 0.2535 PIBt ee = (116.358) (0.0129) r 2 = 0.9648 Si las escalas de la IDPB y del PIB están en millones de dólares: (2.21) IDPBt = −926 090 + 0.2535 PIBt ee = (116.358) (0.0129) r 2 = 0.9648 (2.22) Observe que el intercepto, lo mismo que su error estándar, es 1 000 veces los valores correspon- dientes de la regresión (6.2.21) (observe que w1 = 1 000 al pasar de miles de millones a millones de dólares), pero el coeficiente de la pendiente, al igual que su error estándar, permanecen sin cambio, como lo afirma la teoría. La IDPB en miles de millones de dólares y el PIB en millones de dólares: IDPBt = −926.090 + 0.0002535 PIBt ee = (116.358) (0.0000129) r 2 = 0.9648 (2.23) Como se esperaba, el coeficiente de la pendiente, al igual que su error estándar, es (1/1 000) de su valor en (6.2.21), pues sólo se modificó la escala de X, es decir, del PIB. La IDPB en millones de dólares y el PIB en miles de millones de dólares: IDPBt = −926 090 + 253.524 PIBt ee = (116 358.7) (12.9465) r 2 = 0.9648 (2.24)
3 Regresión sobre variables estandarizadas Extensiones del modelo de regresión lineal con dos variables De nuevo, observe que tanto el intercepto como el coeficiente de la pendiente y sus errores es- tándar respectivos son 1 000 veces sus valores en (2.21), lo cual concuerda con los resultados teóricos. Note que, en todas las regresiones presentadas antes, el valor de r 2 permanece constante, lo cual no sorprende debido a que el valor r 2 es invariable respecto de los cambios en las unidades de medición, pues es un número puro o adimensional. Advertencia sobre la interpretación Como el coeficiente de la pendiente, β2, es tan sólo la tasa de cambio, ésta se mide en las unida- des de la razón Unidades de la variable dependiente Unidades de la variable explicativa Así, en la regresión (6.2.21), la interpretación del coeficiente de la pendiente 0.2535 es que si el PIB cambia en una unidad, de 1 000 millones de dólares, la IDPB cambia en promedio en 0.2535 miles de millones de dólares. En la regresión (6.2.23), una unidad de cambio en el PIB, que es 1 millón de dólares, induce en promedio a un cambio de 0.0002535 miles de millones de dólares en la IDPB. Los dos resultados son por supuesto idénticos en sus efectos del PIB sobre la IDPB, simplemente están expresados en diferentes unidades de medición. 3 Regresión sobre variables estandarizadas En la sección anterior vimos que las unidades con que se expresan la variable independiente (regresora) y la dependiente (regresada) influyen en la interpretación de los coeficientes de re- gresión. Esto se evita si ambas variables (regresora y regresada) se expresan como variables estandarizadas. Se dice que una variable es estandarizada si se resta el valor de la media de esta variable de sus valores individuales y se divide esa diferencia entre la desviación estándar de la variable. Así, en la regresión de Y y X, si las redefinimos como: Y ∗ Yi − Y¯ i = (3.1) SY Xi − X¯ X ∗ i = (3.2) SX donde Y¯ = media muestral de Y, SY = desviación estándar muestral de Y, X¯ = media muestral de X y SX = desviación estándar muestral de X; las variables Y ∗ y X ∗ se llaman variables es- i i tandarizadas. Una propiedad interesante de una variable estandarizada es que el valor de su media siempre es cero y que su desviación estándar siempre es 1. (Para comprobar lo anterior, véase el apéndice 6A, sección 6A.2.) Como resultado, no importa en qué unidades se expresen ambas variables (la regresada y la regresora). En consecuencia, en lugar de llevar a cabo la regresión estándar (bivariada): Yi = β1 + β2 Xi + u i (3.3) podemos realizar la regresión sobre las variables estandarizadas de la siguiente manera: Y ∗ ∗ ∗ ∗ ∗ i = β1 + β2 Xi + ui (3.4) (3.5) = β∗ X ∗ + u∗ 2 i i
Modelos de regresión uniecuacionales pues resulta sencillo mostrar que, en la regresión que involucra a la regresada estandarizada y a la(s) regresora(s) estandarizada(s), el término del intercepto siempre es cero.6 Los coeficientes de regresión de las variables estandarizadas, denotados por β∗ y β∗, se conocen en la bibliografía 1 2 como los coeficientes beta.7 Por cierto, observe que (3.5) es una regresión a través del origen. ¿Cómo se interpretan los coeficientes beta? La interpretación es que si la regresora (estandari- zada) se incrementa una desviación estándar, en promedio, la regresada (estandarizada) aumenta 2 unidades de desviación estándar. Por tanto, a diferencia del modelo tradicional (3.3), se mide el efecto no en términos de las unidades originales en las expresadas X y Y, sino en unidades de desviación estándar. Para mostrar la diferencia entre (6.3.3) y (6.3.5) regresaremos al ejemplo de la IDPB y el PIB de la sección anterior. Los resultados de (6.2.21), ya examinados, se reproducen a continuación: β∗ IDPBt = −926.090 + 0.2535 PIBt (3.6) ee = (116.358) (0.0129) r2 = 0.9648 donde la IDPB y el PIB se miden en miles de millones de dólares. Los resultados que corresponden a (6.3.5) son los siguientes, en donde las variables con aste- risco son variables estandarizadas: IDPBt = 0.9822 PIB∗ ∗ t (3.7) ee = (0.0485) Ya sabemos interpretar (3.6): si el PIB se incrementa un dólar, la IDPB aumenta, en prome- dio, 30 centavos. ¿Y qué pasa con (3.7)? Aquí se interpreta como sigue: si el PIB (estandari- zado) se incrementara una desviación estándar, en promedio, la IDPB (estandarizada) aumentaría casi 0.94 desviaciones estándar. ¿Cuál es la ventaja del modelo de regresión estandarizado respecto del modelo tradicional? Ésta se manifiesta mejor cuando hay más de una regresora, tema que analizaremos en el capítulo 7. Al estandarizar todas las regresoras, quedan expresadas en una misma base y por consiguiente se pueden comparar de manera directa. Si el coeficiente de una regresora estandarizada es mayor que el de otra regresora estandarizada que aparece en ese modelo, esta última contribuye relati- vamente más a la explicación de la regresada de lo que contribuye la primera. En otras palabras, los coeficientes beta sirven como medida de la fuerza relativa de las diversas regresoras. Profun- dizaremos más en este tema en los dos siguientes capítulos. Antes de dar por terminado este asunto, vale la pena un par de observaciones. Primero, para la regresión estandarizada (6.3.7), no se dio el valor r 2 porque es una regresión a través del origen, para la cual no se aplica la r 2 usual, como se señaló en la sección 6.1. Segundo, existe una rela- ción interesante entre los coeficientes β del modelo convencional y los coeficientes beta. Para el caso bivariado, la relación es como sigue: βˆ∗ S x 2 = βˆ2 (3.8) S y donde Sx = la desviación estándar muestral de la regresora X y Sy = la desviación estándar muestral de la regresada. Por consiguiente, se pueden intercambiar los β con los coeficientes beta si se conoce la desviación estándar (muestral) de la regresora y de la regresada. En el siguiente capítulo veremos que esta relación se cumple también para la regresión múltiple. Se deja como ejercicio para el lector verificar la ecuación (6.3.8) para este ejemplo ilustrativo.
Formas funcionales de los modelos de regresión Extensiones del modelo de regresión lineal con dos variables Formas funcionales de los modelos de regresión Como mencionamos en el capítulo 2, este texto trata sobre todo con modelos lineales en los parámetros, que pueden ser o no lineales en las variables. En las secciones que siguen considera- remos algunos modelos de regresión muy comunes, que pueden ser no lineales en las variables pero sí lineales en los parámetros, o que pueden serlo mediante transformaciones apropiadas de las variables. En particular, analizaremos los siguientes modelos de regresión: El modelo log-lineal. Modelos semilogarítmicos. Modelos recíprocos. El modelo logarítmico recíproco. Ahora analizaremos las características especiales de cada modelo, los casos en los cuales su uso es apropiado y la forma de estimarlos. Cada modelo se ilustra con ejemplos apropiados. Cómo medir la elasticidad: modelo log-lineal Considere el siguiente modelo, conocido como modelo de regresión exponencial: Yi = β1 X β2 eu i i (5.1) que puede expresarse también como8 ln Yi = ln β1 + β2 ln Xi + u i (5.2) donde ln = logaritmo natural (es decir, logaritmo en base e y donde e = 2.718).9 Si escribimos (6.5.2) como ln Yi = α + β2 ln Xi + u i (5.3) donde α = ln β1, este modelo es lineal en los parámetros α y β2, lineal en los logaritmos de las variables Y y X, y se estima por regresión MCO. Debido a esta linealidad, tales modelos se deno- minan modelos log-log, doble-log o log-lineales. Véase el apéndice 6A.3, donde se explican las propiedades de los logaritmos. Si se cumplen los supuestos del modelo clásico de regresión lineal, los parámetros de (6.5.3) se estiman por el método MCO, considerando que Y ∗ i = α + β2 Xi + u i ∗ (5.4) donde Y ∗ = ln Yi y X ∗ = ln Xi. Los estimadores de MCO obtenidos, αˆ y βˆ2, serán los mejores estimadores lineales insesgados de α y β2, respectivamente. i i
FIGURA 3 Modelo de elasticidad constante. Modelos de regresión uniecuacionales FIGURA 3 Modelo de elasticidad constante. Y ln Y Cantidad demandada Log de la cantidad demandada Y = β 1Xi 2 –β ln Y = ln β β ln X 1 – 2 i X ln X Precio Log del precio a) b) Una característica atractiva del modelo log-log, que lo ha hecho muy popular en el trabajo empírico, es que el coeficiente de la pendiente β2 mide la elasticidad de Y respecto de X, es decir, el cambio porcentual en Y ante un pequeño cambio porcentual en X.10 Así, si Y representa la can- tidad demandada de un bien y X su precio unitario, β2 mide la elasticidad-precio de la demanda, parámetro de gran interés en economía. Si la relación entre la cantidad demandada y el precio es como se muestra en la figura 6.3a, la transformación doble-log de la figura 6.3b dará entonces la estimación de la elasticidad-precio (−β2). Pueden observarse dos características especiales del modelo log-lineal: el modelo supone que el coeficiente de la elasticidad entre Y y X, β2, permanece constante a través del tiempo (¿por qué?), de aquí su otro nombre, modelo de elasticidad constante.11 En otras palabras, como lo indica la figura 6.3b, el cambio en ln Y por unidad de cambio en ln X (es decir, la elasticidad, β2) permanece igual sin importar en cuál ln X se mida la elasticidad. Otro aspecto del modelo es que, a pesar de que αˆ y βˆ2 son estimadores insesgados de α y β2, β1 (el parámetro del modelo original) al estimarse como βˆ1 = antilog ( αˆ ) es, en sí, un estimador sesgado. En la mayor parte de los problemas prácticos, sin embargo, el término del intercepto es de importancia secundaria y no es necesario preocuparse por obtener este estimador insesgado.12 .
Extensiones del modelo de regresión lineal con dos variables En el modelo de dos variables, la forma más simple de decidir si el modelo log-lineal se ajusta a los datos es graficar el diagrama de dispersión de ln Yi frente a ln Xi y ver si las observaciones caen más o menos sobre una línea recta, como en la figura 6.3b. Advertencia: El lector debe tener presente la distinción entre un cambio porcentual y uno en puntos porcentuales. Por ejemplo, la tasa de desempleo a menudo se expresa en forma de porcen- taje; por decir, una tasa de desempleo de 6%. Si esta tasa aumenta a 8%, se dice que el cambio en puntos porcentuales de la tasa de desempleo es 2, mientras que el cambio porcentual de la tasa de desempleo es (8 − 6)/6, o alrededor de 33%. Por consiguiente, hay que tener cuidado cuando se trabaja con cambios porcentuales y cambios en puntos porcentuales, pues son dos conceptos muy diferentes. EJEMPLO 3 Gasto en bienes du- raderos en relación con el gasto de con- sumo personal total La tabla 6.3 presenta datos sobre el gasto de consumo personal total (GCPERT), el gasto en bienes duraderos (GASBD), el gasto en bienes perecederos (GASBPER) y el gasto en servicios (GASERV), todos medidos en miles de millones de dólares de 2000.13 Suponga que deseamos calcular la elasticidad del gasto en bienes duraderos respecto del gasto de consumo personal total. Al graficar el logaritmo del gasto en bienes duraderos contra el logaritmo del gasto de consumo personal total, observará que la relación entre las dos variables es lineal. Por tanto, el modelo del doble logaritmo puede resultar adecuado. Los resultados de la regresión son: ln GASBDt = −7.5417 + 1.6266 ln GCPERTt (5.5) ee = (0.7161) (0.0800) t = (−10.5309)* (20.3152)* r 2 = 0.9695 donde * indica que el valor p es en extremo pequeño. TABLA 3 Gasto personal total y categorías (miles de millones de dólares de 2000 ajustados por la inflación; datos trimes- trales con tasas anuales ajustadas por estacio- nalidad) Fuentes: Departamento de Comercio, Oficina de Análisis Económico, Economic Report of the President, 2007, tabla B-17, p. 347. Año o trimestre 2003-I GASERV 4 143.3 GASBD 971.4 GASBPER 2 072.5 GCPERT 7 184.9 2003-II 4 161.3 1 009.8 2 084.2 7 249.3 2003-III 4 190.7 1 049.6 2 123.0 7 352.9 2003-IV 4 220.2 1 051.4 2 132.5 7 394.3 2004-I 4 268.2 1 067.0 2 155.3 7 479.8 2004-II 4 308.4 1 071.4 2 164.3 7 534.4 2004-III 4 341.5 1 093.9 2 184.0 7 607.1 2004-IV 4 377.4 1 110.3 2 213.1 7 687.1 2005-I 4 395.3 1 116.8 2 241.5 7 739.4 2005-II 4 420.0 1 150.8 2 268.4 7 819.8 2005-III 4 454.5 1 175.9 2 287.6 7 895.3 2005-IV 4 476.7 1 137.9 2 309.6 7 910.2 2006-I 4 494.5 1 190.5 2 342.8 8 003.8 2006-II 4 535.4 1 190.3 2 351.1 8 055.0 2006-III 4 566.6 1 208.8 2 360.1 8 111.2 Nota: Véase la tabla B-2, que contiene datos sobre el gasto de consumo personal total correspondientes a 1959-1989. GASERV = gasto en servicios (miles de millones de dólares de 2000). GASBD = gasto en bienes duraderos (miles de millones de dólares de 2000). GASBPER = gasto en bienes perecederos (miles de millones de dólares de 2000). GCPERT = gasto de consumo personal total (miles de millones de dólares de 2000). (continúa) 13 Los bienes duraderos son vehículos automotores y refacciones, muebles y equipo doméstico; los bienes perecederos son comida, ropa, gasolina, aceite, combustible de petróleo y carbón mineral; y los servicios son vivienda, electricidad y gas, transporte y atención médica.