Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porMiguel Ávila Araya Modificado hace 10 años
2
Extensiones del modelo de regresión lineal con dos variables
Algunos aspectos del análisis de regresión lineal se insertan bien en el marco del modelo de regresión lineal con dos variables que hemos analizado hasta ahora. Primero consideraremos la regresión a través del origen, es decir, una situación en la cual el término del intercepto, β1, está ausente del modelo. Luego veremos el tema de las unidades de medición, o la forma como se midieron X y Y, y cómo un cambio en las unidades de medición afecta los resultados de la regresión. Por último, abordaremos el tema de la forma funcional del modelo de regresión lineal. Hasta el momento, consideramos modelos lineales en los parámetros y en las variables. Sin embargo, recuerde que la teoría de regresión de los capítulos anteriores sólo exige linealidad en los parámetros; las variables pueden o no entrar linealmente en el modelo. Al considerar mo- delos que son lineales en los parámetros pero no necesariamente en las variables, en este capítulo mostraremos la forma como el modelo de dos variables resuelve algunos problemas prácticos de interés. Una vez entendidas las ideas de este capítulo, su extensión a los modelos de regresión múltiple es muy sencilla, como comprobaremos en los capítulos 7 y 8. 1 Regresión a través del origen Hay ocasiones en las cuales la función de regresión poblacional (FRP) de dos variables adquiere la siguiente forma: Yi = β2 Xi + u i (1.1) En este modelo, el término del intercepto está ausente o es cero, lo cual explica el nombre: re- gresión a través del origen. A manera de ilustración consideremos el modelo de asignación de precios de activos de capi- tal (CAPM, del inglés capital asset pricing model) de la teoría moderna de portafolios, la cual, en su versión de prima por riesgo, se expresa como1 (ER i − r f ) = βi (ERm − r f ) (1.2)
3
FIGURA 1 donde ERi = tasa esperada de rendimiento del título i.
Modelos de regresión uniecuacionales donde ERi = tasa esperada de rendimiento del título i. ERm = tasa esperada de rendimiento del portafolios del mercado como la representa, por ejemplo, el índice compuesto de acciones S&P 500. rf = tasa de rendimiento libre de riesgo, por ejemplo, el rendimiento de los bonos del Tesoro estadounidense a 90 días. βi = el coeficiente Beta, una medida de riesgo sistemático, es decir, el riesgo que no se ha eliminado con la diversificación. Asimismo, es una medida del grado en el cual la i-ésima tasa de rendimiento del título se mueve con el mercado. Un βi > 1 implica un título volátil o riesgoso, mientras que βi < 1 es un título seguro. (Nota: No con- funda esta βi con el coeficiente de la pendiente de la regresión con dos variables, β2.) Si los mercados de capitales funcionan de manera eficiente, el CAPM postula que la prima esperada por el riesgo del título (= ERi − rf) es igual a ese coeficiente β del título multiplicado por la prima esperada del riesgo del mercado (= ERm − rf). Si el CAPM se mantiene se da la situación de la figura 6.1. La línea que aparece en la figura se conoce como línea del mercado de valores (LMV). Para fines empíricos, (6.1.2) suele expresarse así: R i − r f = βi ( R m − r f ) + u i (1.3) o R i − r f = αi + βi ( R m − r f ) + u i (1.4) Este último modelo se conoce como el Modelo del Mercado.2 Si el CAPM es válido, se espera que αi sea cero. (Véase la figura 6.2.) Observe que en (6.1.4) la variable dependiente, Y, es (Ri − rf), y la variable explicativa, X, es βi, el coeficiente de volatilidad, y no (Rm − rf). Por consiguiente, para realizar la regresión (6.1.4), se debe estimar primero βi, el cual se obtiene por lo general de la línea característica, como describimos en el ejercicio 5.5. (Para mayores detalles véase el ejercicio 8.28.) Como muestra este ejemplo, algunas veces la teoría que sirve de base requiere que el término del intercepto esté ausente del modelo. La hipótesis del ingreso permanente de Milton Friedman, que afirma que el consumo permanente es proporcional al ingreso permanente, es otro caso en el que el modelo de intercepto cero puede ser apropiado, como también en la teoría del análisis FIGURA 1 Riesgo sistemático. ER i – rf Línea del mercado de valores ER i – rf 1 βi
4
Xi Yi X 2 o 2 X 2 u2 xi yi x2 o 2 x2 u2 FIGURA 2
Extensiones del modelo de regresión lineal con dos variables FIGURA 2 El Modelo del Mercado de la teoría de portafolios (con el supuesto de que αi = 0). Ri – rf Prima por riesgo del título βi Riesgo sistemático de costos, que postula que la variable costo de producción es proporcional a la producción; y algunas versiones de la teoría monetarista que afirman que la tasa de cambio de los precios (es decir, la tasa de inflación) es proporcional a la tasa de cambio de la oferta monetaria. ¿Cómo se estiman modelos como (6.1.1) y qué problemas presentan? Para responder, primero escribimos la FRM de (6.1.1), a saber: Yi = βˆ2 Xi + uˆi (1.5) Ahora aplicamos el método MCO a (6.1.5) y se obtienen las siguientes fórmulas para βˆ2 y su varianza (las pruebas se presentan en el apéndice 6A, sección 6A.1): βˆ2 = Xi Yi X 2 (1.6) i o 2 var (βˆ2) = X 2 (1.7) i donde σ 2 se estima con u2 ˆi σˆ 2 = (1.8) n − 1 Es interesante comparar estas fórmulas con las obtenidas cuando se incluye el término del inter- cepto en el modelo: βˆ2 = xi yi x2 (1.6) i o 2 var (βˆ2) = x2 (3.1) i u2 ˆi σˆ 2 = (3.5) n − 2
5
X 2 r 2 para el modelo de regresión a través del origen EJEMPLO 6.1
Modelos de regresión uniecuacionales Deben ser obvias las diferencias entre estos dos conjuntos de fórmulas: en el modelo sin término de intercepto se utilizan sumas de cuadrados simples y productos cruzados, pero en el modelo con intercepto, se utilizan sumas de cuadrados ajustadas (de la media) y productos cru- zados. Segundo, los gl para calcular σˆ 2 son (n − 1) en el primer caso y (n − 2) en el segundo. (¿Por qué?) Aunque el modelo sin intercepto o con intercepto cero puede ser apropiado en algunas oca- siones, deben observarse algunas características de este modelo. Primero, uˆi, que es siempre cero en el modelo con intercepto (el modelo convencional), no necesita serlo cuando ese término está ausente. En resumen, uˆi no necesita ser cero en la regresión a través del origen. Segundo, r 2, el coeficiente de determinación presentado en el capítulo 3, que siempre es no negativo en el modelo convencional, en ocasiones puede volverse negativo en el modelo sin intercepto. Este resultado anómalo surge porque el r 2 que presentamos en el capítulo 3 supone explícitamente que el intercepto está incluido en el modelo. Por consiguiente, el r 2 calculado convencional- mente puede no ser apropiado en los modelos de regresión a través del origen.3 r 2 para el modelo de regresión a través del origen Como recién mencionamos y más adelante analizaremos en mayor detalle en el apéndice 6A, sección 6A.1, el r 2 convencional del capítulo 3 no es apropiado en regresiones que no incluyan o no consideren el intercepto. Pero se puede calcular para tales modelos, lo que se conoce como el r 2 simple, el cual se define como 2 Xi Yi r 2 simple = X 2 (1.9) i Yi 2 Nota: Se trata de sumas de cuadrados simples (es decir, no corregidas por la media) y de produc- tos cruzados. A pesar de que este r 2 simple satisface la relación 0 < r2 < 1, no es directamente comparable con el valor r 2 convencional. Por esta razón, algunos autores no presentan el valor r 2 en los mo- delos de regresión con intercepto cero. Debido a las características especiales de este modelo, se debe tener mucho cuidado al utili- zar el modelo de regresión con intercepto cero. A menos que haya una expectativa a priori muy sólida, es aconsejable apegarse al modelo convencional con presencia de intercepto. Esto tiene una doble ventaja. Primero, si se incluye en el modelo el término del intercepto pero es estadís- ticamente no significativo (es decir, estadísticamente igual a cero), para todos los fines prácticos se tiene una regresión a través del origen.4 Segundo y más importante, si el modelo sí tiene un intercepto pero insistimos en ajustar una regresión a través del origen, cometeríamos un error de especificación. Veremos esto en detalle en el capítulo 7. EJEMPLO 6.1 La tabla 6.1 presenta datos mensuales sobre los rendimientos excedentes Yt(%) de un índice de 104 acciones del sector de bienes de consumo cíclico y los rendimientos excedentes Xt(%) del índice de todo el mercado de valores en el Reino Unido, correspondientes al periodo , para un total de 240 observaciones.5 Por rendimientos excedentes se entiende el rendi- miento superior al que ofrece un activo sin riesgo (véase el modelo CAPM).
6
Extensiones del modelo de regresión lineal con dos variables
TABLA 1 OBS 1980:01 Y X 1984:12 1980:02 — 1985:01 1980:03 — — 1985:02 — 1980:04 1985:03 1980:05 — — 1985:04 1980:06 — 1985:05 — 1980:07 1985:06 — — 1980:08 — — 1985:07 — 1980:09 — 1985:08 1980:10 — 1985:09 — — 1980:11 — 1985:10 1980:12 — 1985:11 1981:01 — — 1985:12 — — 1981:02 1986:01 1981:03 1986:02 1981:04 1986:03 1981:05 — — 1986:04 — — 1981:06 — 1986:05 — 1981:07 — — 1986:06 1981:08 1986:07 — — 1981:09 — — 1986:08 — 1981:10 1986:09 — — 1981:11 1986:10 — 1981:12 — — 1986:11 — 1982:01 1986:12 1982:02 — — 1987:01 1982:03 1987:02 1982:04 1987:03 — — 1982:05 — 1987:04 1982:06 — — 1987:05 1982:07 — 1987:06 1982:08 1987:07 1982:09 — 1987:08 — — 1982:10 1987:09 1982:11 — 1987:10 — — 1982:12 — — 1987:11 — — 1983:01 1987:12 1983:02 1988:01 1983:03 1988:02 — — 1983:04 — 1988:03 — — 1983:05 — — 1988:04 1983:06 1988:05 — — 1983:07 — 1988:06 1983:08 1988:07 1983:09 — — 1988:08 — — 1983:10 — — 1988:09 — 1983:11 1988:10 1983:12 1988:11 — — 1984:01 1988:12 — — 1984:02 — 1989:01 1984:03 1989:02 — 1984:04 — 1989:03 — 1984:05 — — 1989:04 1984:06 — 1989:05 — — 1984:07 — — 1989:06 — 1984:08 1989:07 1984:09 1989:08 1984:10 1989:09 — — 1984:11 1989:10 — — (continúa)
7
TABLA 1 (continuación) OBS 1989:11 Y 1.100607603 X 5.350185944
1994:1 2 — 1989:12 1995:01 — — 1990:01 — — 1995:02 1990:02 — — 1995:03 1990:03 — — 1995:04 1990:04 — — 1995:05 1990:05 1995:06 — — 1990:06 — 1995:07 1990:07 — — 1995:08 1990:08 — — 1995:09 — 1990:09 — — 1995:10 — — 1990:10 — — 1995:11 — 1990:11 1995:12 — 1990:12 — — 1996:01 1991:01 — 1996:02 1991:02 1996:03 — 1991:03 1996:04 1991:04 — 1996:05 — — 1991:05 — — 1996:06 — — 1991:06 — — 1996:07 — — 1991:07 1996:08 1991:08 1996:09 1991:09 — 1996:10 — — 1991:10 — — 1996:11 — 1991:11 — — 1996:12 — 1991:12 1997:01 — 1992:01 1997:02 — 1992:02 1997:03 — 1992:03 — — 1997:04 — 1992:04 1997:05 1992:05 1997:06 — 1992:06 — — 1997:07 1992:07 — — 1997:08 — 1992:08 — — 1997:09 1992:09 1997:10 — — 1992:10 1997:11 — — 1992:11 1997:12 — 1992:12 1998:01 — 1993:01 1998:02 1993:02 — 1998:03 1993:03 1998:04 — 1993:04 — 1998:05 — 1993:05 — 1998:06 — — 1993:06 1998:07 — — 1993:07 1998:08 — — 1993:08 1998:09 — — 1993:09 — — 1998:10 1993:10 1998:11 — — 1993:11 — 1998:12 1993:12 — 1999:01 — 1994:01 1999:02 8.5036 1994:02 — — 1999:03 1994:03 — — 1999:04 1994:04 1999:05 — — 1994:05 — — 1999:06 1994:06 — — 1999:07 — 1994:07 1999:08 — — 1994:08 1999:09 — — 1994:09 — — 1999:10 — 1994:10 — 1999:11 1994:11 — 1999:12 — 152
8
EJEMPLO 6.1 (continuación)
Extensiones del modelo de regresión lineal con dos variables EJEMPLO 6.1 (continuación) En primer lugar ajustamos el modelo (6.1.3) a estos datos. Con EViews6 obtuvimos los siguientes resultados de regresión, que se presentan en el formato estándar de EViews. Variable dependiente: Y Método: mínimos cuadrados Muestra: 1980M M12 Observaciones incluidas: 240 Coeficiente Error estándar Estadístico t Probabilidad X 0.0000 R cuadrada Media de la variable dependiente R cuadrada ajustada† Desviación estándar de la variable dependiente *Estudiaremos este estadístico en el capítulo 12. † Véase el capítulo 7. Como muestran estos resultados, el coeficiente de la pendiente (el coeficiente Beta) es muy significativo, pues su valor p es muy pequeño. La interpretación en este caso es que si la tasa excedente del mercado aumenta un punto porcentual, el rendimiento excedente del índice del sector de bienes de consumo aumenta alrededor de 1.15 puntos porcentuales. El coeficiente de la pendiente no es sólo estadísticamente significativo, sino que es significativamente mayor que 1 (¿puede verificar esto?). Si un coeficiente Beta es mayor que 1, se dice que ese título (en este caso, un portafolios de 104 acciones) es volátil; se mueve más que proporcionalmente con el índice general del mercado de valores. Sin embargo, este resultado no debe sorprender, por- que en este ejemplo se consideran acciones del sector de bienes de consumo cíclico, como los bienes duraderos de uso doméstico, automóviles, textiles y equipo deportivo. Si ajustamos el modelo (6.1.4), obtenemos los siguientes resultados: Variable dependiente: Y Método: mínimos cuadrados Muestra: 1980M M12 Observaciones incluidas: 240 Error estándar de regresión Estadístico de Durbin-Watson* Suma de cuadrados de residuos Coeficiente Error estándar Estadístico t Probabilidad C – – 0.2188 X 0.0000 R cuadrada Media de la variable dependiente R cuadrada ajustada Desviación estándar de la variable dependiente Error estándar de regresión Estadístico de Durbin-Watson Suma de cuadrados de residuos Probabilidad (estadístico F) Estadístico F En estos resultados observamos que el intercepto no es estadísticamente diferente de cero, aunque el coeficiente de la pendiente (el coeficiente Beta) es muy significativo estadísticamente. Esto indica que el modelo de regresión a través del origen se ajusta bien a los datos. Además, en términos estadísticos, no hay diferencia entre los valores del coeficiente de la pendiente en los dos modelos. Observe que el error estándar del coeficiente de la pendiente en el modelo de regresión a través del origen es un poco menor que el del modelo con el intercepto presente, lo cual apoya el argumento de Theil de la nota 4. Aun en este caso, el coeficiente de la pendiente es estadísticamente mayor que 1, lo que una vez más confirma que los rendimientos de las ac- ciones del sector de bienes de consumo cíclico son volátiles. A propósito, observe que el valor de r 2 para el modelo de regresión a través del origen debe tomarse con ciertas reservas, pues la fórmula tradicional de r 2 no es aplicable en tales modelos. Sin embargo, EViews presenta de manera habitual el valor estándar de r 2, incluso para estos modelos.
9
2 Escalas y unidades de medición
Modelos de regresión uniecuacionales 2 Escalas y unidades de medición Para entender las ideas de esta sección, considere la información de la tabla 6.2, referente a la inversión doméstica privada bruta (IDPB) de Estados Unidos y al producto interno bruto (PIB) en miles de millones y en millones de dólares de 2000 ajustados por la inflación. Suponga que en la regresión de la IDPB sobre el PIB, un investigador utiliza información medida en miles de millones de dólares y otro expresa estos datos en millones de dólares. ¿Serán iguales los resultados de la regresión en ambos casos? De no ser así, ¿qué resultados deben usarse? En resumen, ¿las unidades con que se mide la variable regresada y la(s) variable(s) regresora(s) influyen de algún modo en los resultados de la regresión? De ser así, ¿qué curso razonable debe seguirse en la selección de las unidades de medición para el análisis de regresión? Para responder estas preguntas, procedamos sistemáticamente. Sea Yi = βˆ1 + βˆ2 Xi + uˆ i (2.1) donde Y = IDPB y X = PIB. Defina Y ∗ i = w1Yi (2.2) (2.3) X ∗ i = w2 Xi donde w1 y w2 son constantes, denominadas factores de escala; w1 puede ser igual o diferente a w2. De (6.2.2) y (6.2.3) es claro que Y ∗ y X ∗ son Yi y Xi reescaladas. Por tanto, si Yi y Xi se miden i i en miles de millones de dólares y se desea expresarlas en millones de dólares, se tendrá Y ∗ = 1 000 Yi y Xi = Xi; aquí w1 = w2 = ∗ i Ahora considere la regresión con las variables i y Xi : Y ∗ ∗ Y ∗ ∗ ∗ ∗ ∗ i = βˆ1 + βˆ2 Xi + uˆi (2.4) donde Y ∗ = w1Yi , X ∗ = w2 Xi y uˆ∗ = w1uˆi . (¿Por qué?) i i i TABLA 2 Inversión nacional pri- vada bruta y PIB, Esta- dos Unidos, (miles de millones de dólares [de 2000] ajus- tados por la inflación, salvo donde se indica lo contrario; datos trimes- trales con tasas anuales ajustadas por estaciona- lidad) Año 1990 IDPBmm 886.6 IDPBm PIBmm PIBm 1991 829.1 1992 878.3 1993 953.5 1994 1995 1996 1997 1998 1999 2000 Fuente: Economic Report of the President, 2007, tabla B-2, p. 328. 2001 2002 2003 2004 2005 Nota: IDPBmm = inversión doméstica privada bruta (miles de millones de dólares de 2000). IDPBm = inversiones nacionales privadas brutas (millones de dólares de 2000). PIBmm = producto interno bruto (miles de millones de dólares de 2000). PIBm = producto interno bruto (millones de dólares de 2000).
10
xi yi x2 X 2 x2 o 2 x2 u2 βˆ∗ ∗ ∗ ∗ x∗ ∗ βˆ∗ x∗2 X ∗2 x∗2 o ∗2 u∗2 βˆ∗
Extensiones del modelo de regresión lineal con dos variables Deseamos encontrar las relaciones entre los siguientes pares: 1. βˆ1 y βˆ∗ 1 2. βˆ2 y βˆ∗ 2 3. var (βˆ1) y var(βˆ∗) 1 4. var (βˆ2) y var(βˆ∗) 2 5. σˆ 2 y σˆ ∗2 6. r 2 y r 2 xy x∗ y∗ De la teoría de mínimos cuadrados, sabemos (véase el capítulo 3) que βˆ1 = Y¯ − βˆ2 X¯ (2.5) βˆ2 = xi yi x2 (2.6) i X 2 var (βˆ1) = i σ 2 (2.7) n x2 i o 2 var (βˆ2) = x2 (2.8) i ˆi u2 σˆ 2 = (2.9) n − 2 Del mismo modo, al aplicar el método MCO a (6.2.4), obtenemos βˆ∗ ∗ ∗ ∗ 1 = Y¯ − βˆ2 X¯ (2.10) x∗ ∗ βˆ∗ 2 = i yi x∗2 (2.11) i X ∗2 var (βˆ∗) = 1 n x∗2 i ∗2 σ (2.12) i o ∗2 var (βˆ∗) = 2 (2.13) x i ∗2 u∗2 ˆi σˆ ∗2 = (2.14) (n − 2) Con estos resultados es fácil establecer relaciones entre estos dos conjuntos de parámetros esti mados. Todo lo que se debe hacer es recordar las siguientes relaciones: Y ∗ = w1Yi (o y∗ = w1 yi ); Xi = w2 Xi (o xi = w2 xi ); uˆi = w1uˆi ; Y¯ = w1Y¯ ; y X¯ = w2 X¯ . Con estas definiciones, el lec- ∗ ∗ ∗ ∗ ∗ i i tor puede verificar fácilmente que βˆ∗ 2 = w1 β2 ˆ (2.15) w2 βˆ∗ 1 = w1βˆ1 (2.16) (2.17) (2.18) σˆ ∗2 = w2σˆ 2 1 var (βˆ∗) = w2 var (βˆ1) 1 1
11
w1 2 r 2 2 EJEMPLO 2 Relación entre la IDPB y el PIB,
Modelos de regresión uniecuacionales w1 2 w var (βˆ∗) = 2 var (βˆ2) (2.19) 2 r 2 2 xy = rx∗ y∗ (2.20) De los resultados anteriores debe quedar claro que, con los resultados de regresión basados en una escala de medición, se pueden obtener los resultados basados en otra, una vez que se co- nozcan los factores de escala, w. En la práctica, sin embargo, se deben escoger las unidades de medición en forma razonable; no tiene objeto manejar todos esos ceros al expresar números en millones o en miles de millones de dólares. De los resultados de (6.2.15) hasta (6.2.20) se derivan fácilmente algunos casos especiales. Por ejemplo, si w1 = w2, es decir, si son idénticos los factores de escala, el coeficiente de la pen- diente y su error estándar permanecen inalterados en el cambio de escala de (Yi, Xi) a (Y ∗, X ∗), i i lo cual intuitivamente debería ser claro. Sin embargo, el intercepto y su error estándar están multiplicados por w1. Si la escala X no se cambia (es decir, w2 = 1), pero la escala Y se cambia por el factor w1, el coeficiente de la pendiente, al igual que el intercepto y sus errores estándar respectivos, se multiplican por el mismo factor w1. Por último, si la escala Y permanece inalterada (es decir, w1 = 1), pero la escala X se cambia por el factor w2, el coeficiente de la pendiente y su error estándar se multiplican por el factor (1/w2), pero el coeficiente del intercepto y su error estándar permanecen inalterados. Sin embargo, debe observarse que la transformación de la escala (Y, X) a la escala (Y ∗, X ∗) no afecta las propiedades de los estimadores de MCO analizadas en los capítulos anteriores. EJEMPLO 2 Relación entre la IDPB y el PIB, Estados Unidos, Para demostrar los resultados teóricos anteriores, consideremos de nuevo los datos presentados en la tabla 6.2 y examinemos los siguientes resultados (las cifras entre paréntesis son los errores estándar estimados). Si las escalas de la IDPB y del PIB están en miles de millones de dólares: IDPBt = − PIBt ee = ( ) (0.0129) r 2 = Si las escalas de la IDPB y del PIB están en millones de dólares: (2.21) IDPBt = − PIBt ee = ( ) (0.0129) r 2 = (2.22) Observe que el intercepto, lo mismo que su error estándar, es veces los valores correspon- dientes de la regresión (6.2.21) (observe que w1 = al pasar de miles de millones a millones de dólares), pero el coeficiente de la pendiente, al igual que su error estándar, permanecen sin cambio, como lo afirma la teoría. La IDPB en miles de millones de dólares y el PIB en millones de dólares: IDPBt = − PIBt ee = ( ) ( ) r 2 = (2.23) Como se esperaba, el coeficiente de la pendiente, al igual que su error estándar, es (1/1 000) de su valor en (6.2.21), pues sólo se modificó la escala de X, es decir, del PIB. La IDPB en millones de dólares y el PIB en miles de millones de dólares: IDPBt = − PIBt ee = ( ) ( ) r 2 = (2.24)
12
3 Regresión sobre variables estandarizadas
Extensiones del modelo de regresión lineal con dos variables De nuevo, observe que tanto el intercepto como el coeficiente de la pendiente y sus errores es- tándar respectivos son veces sus valores en (2.21), lo cual concuerda con los resultados teóricos. Note que, en todas las regresiones presentadas antes, el valor de r 2 permanece constante, lo cual no sorprende debido a que el valor r 2 es invariable respecto de los cambios en las unidades de medición, pues es un número puro o adimensional. Advertencia sobre la interpretación Como el coeficiente de la pendiente, β2, es tan sólo la tasa de cambio, ésta se mide en las unida- des de la razón Unidades de la variable dependiente Unidades de la variable explicativa Así, en la regresión (6.2.21), la interpretación del coeficiente de la pendiente es que si el PIB cambia en una unidad, de millones de dólares, la IDPB cambia en promedio en miles de millones de dólares. En la regresión (6.2.23), una unidad de cambio en el PIB, que es 1 millón de dólares, induce en promedio a un cambio de miles de millones de dólares en la IDPB. Los dos resultados son por supuesto idénticos en sus efectos del PIB sobre la IDPB, simplemente están expresados en diferentes unidades de medición. 3 Regresión sobre variables estandarizadas En la sección anterior vimos que las unidades con que se expresan la variable independiente (regresora) y la dependiente (regresada) influyen en la interpretación de los coeficientes de re- gresión. Esto se evita si ambas variables (regresora y regresada) se expresan como variables estandarizadas. Se dice que una variable es estandarizada si se resta el valor de la media de esta variable de sus valores individuales y se divide esa diferencia entre la desviación estándar de la variable. Así, en la regresión de Y y X, si las redefinimos como: Y ∗ Yi − Y¯ i = (3.1) SY Xi − X¯ X ∗ i = (3.2) SX donde Y¯ = media muestral de Y, SY = desviación estándar muestral de Y, X¯ = media muestral de X y SX = desviación estándar muestral de X; las variables Y ∗ y X ∗ se llaman variables es- i i tandarizadas. Una propiedad interesante de una variable estandarizada es que el valor de su media siempre es cero y que su desviación estándar siempre es 1. (Para comprobar lo anterior, véase el apéndice 6A, sección 6A.2.) Como resultado, no importa en qué unidades se expresen ambas variables (la regresada y la regresora). En consecuencia, en lugar de llevar a cabo la regresión estándar (bivariada): Yi = β1 + β2 Xi + u i (3.3) podemos realizar la regresión sobre las variables estandarizadas de la siguiente manera: Y ∗ ∗ ∗ ∗ ∗ i = β1 + β2 Xi + ui (3.4) (3.5) = β∗ X ∗ + u∗ 2 i i
13
Modelos de regresión uniecuacionales
pues resulta sencillo mostrar que, en la regresión que involucra a la regresada estandarizada y a la(s) regresora(s) estandarizada(s), el término del intercepto siempre es cero.6 Los coeficientes de regresión de las variables estandarizadas, denotados por β∗ y β∗, se conocen en la bibliografía 1 2 como los coeficientes beta.7 Por cierto, observe que (3.5) es una regresión a través del origen. ¿Cómo se interpretan los coeficientes beta? La interpretación es que si la regresora (estandari- zada) se incrementa una desviación estándar, en promedio, la regresada (estandarizada) aumenta 2 unidades de desviación estándar. Por tanto, a diferencia del modelo tradicional (3.3), se mide el efecto no en términos de las unidades originales en las expresadas X y Y, sino en unidades de desviación estándar. Para mostrar la diferencia entre (6.3.3) y (6.3.5) regresaremos al ejemplo de la IDPB y el PIB de la sección anterior. Los resultados de (6.2.21), ya examinados, se reproducen a continuación: β∗ IDPBt = − PIBt (3.6) ee = ( ) (0.0129) r2 = donde la IDPB y el PIB se miden en miles de millones de dólares. Los resultados que corresponden a (6.3.5) son los siguientes, en donde las variables con aste- risco son variables estandarizadas: IDPBt = PIB∗ ∗ t (3.7) ee = (0.0485) Ya sabemos interpretar (3.6): si el PIB se incrementa un dólar, la IDPB aumenta, en prome- dio, 30 centavos. ¿Y qué pasa con (3.7)? Aquí se interpreta como sigue: si el PIB (estandari- zado) se incrementara una desviación estándar, en promedio, la IDPB (estandarizada) aumentaría casi 0.94 desviaciones estándar. ¿Cuál es la ventaja del modelo de regresión estandarizado respecto del modelo tradicional? Ésta se manifiesta mejor cuando hay más de una regresora, tema que analizaremos en el capítulo 7. Al estandarizar todas las regresoras, quedan expresadas en una misma base y por consiguiente se pueden comparar de manera directa. Si el coeficiente de una regresora estandarizada es mayor que el de otra regresora estandarizada que aparece en ese modelo, esta última contribuye relati- vamente más a la explicación de la regresada de lo que contribuye la primera. En otras palabras, los coeficientes beta sirven como medida de la fuerza relativa de las diversas regresoras. Profun- dizaremos más en este tema en los dos siguientes capítulos. Antes de dar por terminado este asunto, vale la pena un par de observaciones. Primero, para la regresión estandarizada (6.3.7), no se dio el valor r 2 porque es una regresión a través del origen, para la cual no se aplica la r 2 usual, como se señaló en la sección 6.1. Segundo, existe una rela- ción interesante entre los coeficientes β del modelo convencional y los coeficientes beta. Para el caso bivariado, la relación es como sigue: βˆ∗ S x 2 = βˆ2 (3.8) S y donde Sx = la desviación estándar muestral de la regresora X y Sy = la desviación estándar muestral de la regresada. Por consiguiente, se pueden intercambiar los β con los coeficientes beta si se conoce la desviación estándar (muestral) de la regresora y de la regresada. En el siguiente capítulo veremos que esta relación se cumple también para la regresión múltiple. Se deja como ejercicio para el lector verificar la ecuación (6.3.8) para este ejemplo ilustrativo.
14
Formas funcionales de los modelos de regresión
Extensiones del modelo de regresión lineal con dos variables Formas funcionales de los modelos de regresión Como mencionamos en el capítulo 2, este texto trata sobre todo con modelos lineales en los parámetros, que pueden ser o no lineales en las variables. En las secciones que siguen considera- remos algunos modelos de regresión muy comunes, que pueden ser no lineales en las variables pero sí lineales en los parámetros, o que pueden serlo mediante transformaciones apropiadas de las variables. En particular, analizaremos los siguientes modelos de regresión: El modelo log-lineal. Modelos semilogarítmicos. Modelos recíprocos. El modelo logarítmico recíproco. Ahora analizaremos las características especiales de cada modelo, los casos en los cuales su uso es apropiado y la forma de estimarlos. Cada modelo se ilustra con ejemplos apropiados. Cómo medir la elasticidad: modelo log-lineal Considere el siguiente modelo, conocido como modelo de regresión exponencial: Yi = β1 X β2 eu i i (5.1) que puede expresarse también como8 ln Yi = ln β1 + β2 ln Xi + u i (5.2) donde ln = logaritmo natural (es decir, logaritmo en base e y donde e = 2.718).9 Si escribimos (6.5.2) como ln Yi = α + β2 ln Xi + u i (5.3) donde α = ln β1, este modelo es lineal en los parámetros α y β2, lineal en los logaritmos de las variables Y y X, y se estima por regresión MCO. Debido a esta linealidad, tales modelos se deno- minan modelos log-log, doble-log o log-lineales. Véase el apéndice 6A.3, donde se explican las propiedades de los logaritmos. Si se cumplen los supuestos del modelo clásico de regresión lineal, los parámetros de (6.5.3) se estiman por el método MCO, considerando que Y ∗ i = α + β2 Xi + u i ∗ (5.4) donde Y ∗ = ln Yi y X ∗ = ln Xi. Los estimadores de MCO obtenidos, αˆ y βˆ2, serán los mejores estimadores lineales insesgados de α y β2, respectivamente. i i
15
FIGURA 3 Modelo de elasticidad constante.
Modelos de regresión uniecuacionales FIGURA 3 Modelo de elasticidad constante. Y ln Y Cantidad demandada Log de la cantidad demandada Y = β 1Xi 2 –β ln Y = ln β β ln X 1 – 2 i X ln X Precio Log del precio a) b) Una característica atractiva del modelo log-log, que lo ha hecho muy popular en el trabajo empírico, es que el coeficiente de la pendiente β2 mide la elasticidad de Y respecto de X, es decir, el cambio porcentual en Y ante un pequeño cambio porcentual en X.10 Así, si Y representa la can- tidad demandada de un bien y X su precio unitario, β2 mide la elasticidad-precio de la demanda, parámetro de gran interés en economía. Si la relación entre la cantidad demandada y el precio es como se muestra en la figura 6.3a, la transformación doble-log de la figura 6.3b dará entonces la estimación de la elasticidad-precio (−β2). Pueden observarse dos características especiales del modelo log-lineal: el modelo supone que el coeficiente de la elasticidad entre Y y X, β2, permanece constante a través del tiempo (¿por qué?), de aquí su otro nombre, modelo de elasticidad constante.11 En otras palabras, como lo indica la figura 6.3b, el cambio en ln Y por unidad de cambio en ln X (es decir, la elasticidad, β2) permanece igual sin importar en cuál ln X se mida la elasticidad. Otro aspecto del modelo es que, a pesar de que αˆ y βˆ2 son estimadores insesgados de α y β2, β1 (el parámetro del modelo original) al estimarse como βˆ1 = antilog ( αˆ ) es, en sí, un estimador sesgado. En la mayor parte de los problemas prácticos, sin embargo, el término del intercepto es de importancia secundaria y no es necesario preocuparse por obtener este estimador insesgado.12 .
16
Extensiones del modelo de regresión lineal con dos variables
En el modelo de dos variables, la forma más simple de decidir si el modelo log-lineal se ajusta a los datos es graficar el diagrama de dispersión de ln Yi frente a ln Xi y ver si las observaciones caen más o menos sobre una línea recta, como en la figura 6.3b. Advertencia: El lector debe tener presente la distinción entre un cambio porcentual y uno en puntos porcentuales. Por ejemplo, la tasa de desempleo a menudo se expresa en forma de porcen- taje; por decir, una tasa de desempleo de 6%. Si esta tasa aumenta a 8%, se dice que el cambio en puntos porcentuales de la tasa de desempleo es 2, mientras que el cambio porcentual de la tasa de desempleo es (8 − 6)/6, o alrededor de 33%. Por consiguiente, hay que tener cuidado cuando se trabaja con cambios porcentuales y cambios en puntos porcentuales, pues son dos conceptos muy diferentes. EJEMPLO 3 Gasto en bienes du- raderos en relación con el gasto de con- sumo personal total La tabla 6.3 presenta datos sobre el gasto de consumo personal total (GCPERT), el gasto en bienes duraderos (GASBD), el gasto en bienes perecederos (GASBPER) y el gasto en servicios (GASERV), todos medidos en miles de millones de dólares de Suponga que deseamos calcular la elasticidad del gasto en bienes duraderos respecto del gasto de consumo personal total. Al graficar el logaritmo del gasto en bienes duraderos contra el logaritmo del gasto de consumo personal total, observará que la relación entre las dos variables es lineal. Por tanto, el modelo del doble logaritmo puede resultar adecuado. Los resultados de la regresión son: ln GASBDt = − ln GCPERTt (5.5) ee = (0.7161) (0.0800) t = (− )* ( )* r 2 = donde * indica que el valor p es en extremo pequeño. TABLA 3 Gasto personal total y categorías (miles de millones de dólares de 2000 ajustados por la inflación; datos trimes- trales con tasas anuales ajustadas por estacio- nalidad) Fuentes: Departamento de Comercio, Oficina de Análisis Económico, Economic Report of the President, 2007, tabla B-17, p. 347. Año o trimestre 2003-I GASERV GASBD 971.4 GASBPER GCPERT 2003-II 2003-III 2003-IV 2004-I 2004-II 2004-III 2004-IV 2005-I 2005-II 2005-III 2005-IV 2006-I 2006-II 2006-III Nota: Véase la tabla B-2, que contiene datos sobre el gasto de consumo personal total correspondientes a GASERV = gasto en servicios (miles de millones de dólares de 2000). GASBD = gasto en bienes duraderos (miles de millones de dólares de 2000). GASBPER = gasto en bienes perecederos (miles de millones de dólares de 2000). GCPERT = gasto de consumo personal total (miles de millones de dólares de 2000). (continúa) 13 Los bienes duraderos son vehículos automotores y refacciones, muebles y equipo doméstico; los bienes perecederos son comida, ropa, gasolina, aceite, combustible de petróleo y carbón mineral; y los servicios son vivienda, electricidad y gas, transporte y atención médica.
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.