Descargar la presentación
La descarga está en progreso. Por favor, espere
1
Datos de panel con Stata
Vicente Royuela
2
Datos de panel con Stata
Bibliografía recomendada Cameron, A. Colin y Pravin K. Trivedi, Microeconometrics: Methods and applications, Cambridge: Cambridge University Press, 2005. Cameron, A. Colin y Pravin K. Trivedi, Microeconometrics Using Stata, College Station, Texas: Stata Press, 2009. Wooldridge, Jeffrey, Econometric Analysis of Cross Section and Panel Data, Cambridge, Massachusetts: MIT Press, 2002. Wooldridge, Jeffrey, Introductory Econometrics, 3rd ed., Mason, Ohio: Thomson South-Western, 2006.
3
El modelo de regresión con datos de panel en stata
Estructura para datos de panel. Cómo cargar los datos en stata. La función reshape Cómo tratar la heterogeneidad individual. La estimación básica de los parámetros y la estimación de la varianza del estimador (VCE) La estimación con errores IID y con errores INID (robust estimation) El estimador ‘cluster-robust’ del VCE La estimación Pool (pooled ordinary least squares, POLS) La estimación generalizada: GLS, FGLS, REFGLS La estimación Pool – FGLS (PFGLS) Modelos con efectos fijos La transformación within La transformación en primeras diferencias (FD) Los estimadores within y FD La estimación FGLS en modelos de efectos fijos (FDFGLS) El test de Hausman: RE vs. FE La versión Mundlak (1978) del contraste de Hausman y la versión cluster-robust de Woolridge (2002) Estimadores de variables instrumentales El estimador GMM Exogeneidad y utilidad de los instrumentos Los modelos Hausman-Taylor (xttaylor) Los modelos dinámicos y la estimación Arellano-Bond (xtabond) Constrastes de especificación (Sargan)
4
Estructura para datos de panel.
En un modelo con datos de panel esperamos la siguiente estructura genérica: Donde: Yit: es la variable dependiente, que varía en individuos (i) y momentos del tiempo (t) Xit: vector de variables explicativas (covariables), con dimensión kx, que varía en individuos (i) y momentos del tiempo (t) Zit: vector de variables explicativas (covariables), con dimensión kz, que varía en individuos (i),pero no en el tiempo (t) vi: efecto a nivel de grupo que no varía en el tiempo (t) it: variable aleatoria que varía en individuos (i) y en el tiempo (t) i=1,2,…N (suponemos N) t=1, 2,..T (suponemos T constante)
5
Estructura para datos de panel.
Utilizaremos el ejemplo que aparece en la documentación de Stata relativa a datos de panel: Una submuestra de la ‘National Longtudinal Survey of Youth’ NLSY data (Center for Human Resource Research 1989) sobre mujeres jóvenes con edades comprendidas entre 14 y 26 años en Las mujeres encuestadas se tiene información entre los años 1968 y 1988 (excepto 1974, 1976, 1979, 1981, 1984, y1986). Hay dos tipos de submuestras: nlswork.dta and union.dta nlswork.dta: submuestra de 4,711 mujeres empleadas, que no se encuentran estudiando y con salarios entre 1 y 700 $/hora. Y describimos la base de datos (describe) . use . describe
7
Estructura para datos de panel.
Declaramos que la base de datos es un panel con el comando xtset, indicando la variable que se refiere al individuo (id) y la que se refiere al tiempo (year). Es absolutamente imprescindible dar este paso para poder ejecutar las otras órdenes del panel de stata xt_xyz.
8
Estructura para datos de panel.
En ocasiones los datos vienen con un formato que indica el período al que se refieren las variables en su mismo título. Es lo que se denomina en stata formato wide. Se puede convertir una estructura de datos wide en una estructura de datos long empleando la función reshape. . use . list . reshape long inc ue, i(id) j(year) . list, sep(3) . reshape wide inc ue, i(id) j(year)
10
Estructura para datos de panel.
Como siempre pasa antes de proceder a hacer un estudio econométrico, es muy importante hacer un descriptivo de los datos. Cuando hablamos de datos de panel, las variables podrán tener mayor varianza en la dimensión de sección cruzada o en la dimensión temporal. Este tipo de análisis se pueden hacer con el comando xtsum. Nos ofrece información: Global (overall), con toda la información Cross-section (between), con el promedio para cada invididuo Información temporal (within), transformando las variables, construyendo las variables en desviaciones con respecto a la media del nivel de cada grupo. . use . summarize hours . xtsum hours race
11
La variable race no varía en la dimensión temporal
12
Algunos gráficos
13
Algunos gráficos
14
Algunos gráficos: variación within
15
Sigamos con algo de econometría...
Ya hemos visto nuestro modelo de partida: vi recoge el efecto la heterogeneidad no observada, que no varía con el tiempo. Si este proceso no tiene correlación con los regresores fijos, xit y zi , entonces el modelo general tomará la forma de efectos aleatorios, teniendo la perturbación general del modelo una forma determinada (correlación intragrupos). Si este proceso tiene correlación con los regresores fijos, xit y zi , entonces el modelo general tomará la forma de efectos fijos.
16
Sigamos con algo de econometría...
Estimación del vector de parámetros. Deseamos obtener una estimación del vector de parámetros que será aproximadamente normal y con varianza de la estimación igual a N-1A-1BA-1. La forma de la matriz de varianzas y covarianzas de la estimación dependerá de la forma de las matrices A y B, que a su vez dependerán de los supuestos que hagamos sobre la forma del término de perturbación global del modelo. Si suponemos que las variables explicativas del modelo son exógenas (incorrelacionadas con el término de perturbación), entonces la estimación será consistente y sólo deberemos preocuparnos por estimar la varianza del vector de parámetros (estimador de la varianza del estimador, VCE).
17
Sigamos con algo de econometría...
¿Cómo estimar pues VCE? Si obtenemos estimadores consistentes de A y B podremos hacer inferencia de manera correcta. Si B cambia con cómo suponemos los errores, no pasa lo mismo con A, que es independiente de los mismos. Hay 3 casos de interés relativos a la forma de B: it es un proceso distribuido independiente e idénticamente por individuos y en el tiempo (IID). it es un proceso distribuido independiente pero no idénticamente (INID): hay correlación entre it y is. Es el caso de la estimación robusta. Las observaciones entre grupos no están relacionadas: permitimos la correlación entre it y is pero no con js.
18
Sigamos con algo de econometría...
¿Cómo estimar pues VCE? Si obtenemos estimadores consistentes de A y B podremos hacer inferencia de manera correcta. Si B cambia con cómo suponemos los errores, no pasa lo mismo con A, que es independiente de los mismos. Si it es un proceso distribuido independiente e idénticamente por individuos y en el tiempo (IID), entonces: …. y llegamos a algo conocido:
19
Con procesos IID la estimación MCO es consistente y eficiente
20
Sigamos con algo de econometría...
Ahora it es un proceso distribuido independiente, pero No Idénticamente distribuido (INID), entonces: …. y llegamos a algo conocido: Esto es un caso particular del estimador robusto del VCE, permitiendo correlación entre los errores intra-grupo.
21
Esta estimación es consistente, pero no es eficiente
Esta estimación es consistente, pero no es eficiente. Cuando marcamos robust obtenemos los mismos parámetros y además conseguimos calcular los verdaderos errores estándar.
22
El estimador POOL – MCO (Pooled – OLS => POLS)
La estimación Pool parte del modelo que ya conocemos: Esta estimación utiliza las observaciones de todos los grupos Requiere el supuesto de que las covariables no tienes correlación con vi POLS no requiere exogeneidad estricta Los resultados son consistentes pero no eficientes POLS utiliza el estimador robusto que permite que los errores esté correlacionados intra grupos, pero no entre grupos
23
El estimador POOL – MCO (Pooled – OLS => POLS)
Consideramos el modelo: Supuesto 1 POLS: Este supuesto implica que el error compuesto es independiente en media de las covariables. Esto es más restrictivo que suponer que no hay correlación, ya que ésta sólo conlleva relaciones lineales. La independencia en media implica que no hay correlación con las covariables o con una función de las mismas Sí que podemos incluir términos exponenciales o interacciones en el modelo Y además:
24
El estimador POOL – MCO (Pooled – OLS => POLS)
Reescribimos el modelo: De manera que: donde cada elemento i es un vector con T observaciones. POLS implica para cualquier i y t
25
Seguimos con el estimador POLS
Seguimos con el modelo: Supuesto 2 POLS: Se permite la presencia de correlación de i dentro de cada individuo, de modo que el proceso genérico es INID sobre i. Supuesto 3 POLS: E[W’W] es invertible. La consecuencia es que podremos estimar el vector de parámetros . Si se cumplen los supuestos 1, 2 y 3 el estimador POLS es consistente asintóticamente distribuido normalmente. Además, el estimador robusto es consistente
26
Las soluciones se expresan del modo siguiente:
Que se distribuye normalmente: Donde Y por lo tanto: Este estimador es sencillo de computar y explicar y no requiere exogeneidad estricta. Pero… no es eficiente, requiere E[vi]=0, y e la varianza del estimador no se estima.
27
La estimación POLS nos da, de nuevo, los mismos parámetros estimados y cambia la estimación de los errores estándar.
28
La estimación generalizada factible (FGLS)
Para obtener estimaciones eficientes es necesario modelizar de algún modo la correlación intra grupos. Les estimación generalizada considera estas situaciones. La estimación FGSL estima la matriz de varianzas y covarianzas de los errores, y la emplea para transformar el modelo de manera que los errores sean IID y posteriormente hacer MCO de los datos transformados. Requeriremos el supuesto de exogeneidad estricta.
29
La estimación generalizada factible (FGLS)
Supuestos de la estimación FGLS para efectos aleatorios (RE-FGLS): Supuesto 1. Es el mismo supuesto 1 que POLS. Supuesto 2: proponemos la estructura de varianzas y covarianzas del término de perturbación:
30
La estimación generalizada factible (FGLS)
Como en toda estimación generalizada, si conocemos , conocemos y podemos transformar el modelo: Como resulta que Y el modelo transformado se puede estimar mediante MCO
31
La estimación generalizada factible (FGLS)
Los supuestos 1 y 2 implican: Definimos Q y tal que: Entonces:
32
La estimación generalizada factible (FGLS)
A continuación definimos la transformación de uno de los componentes del término de perturbación (vi): Si disponemos de estimaciones consistentes de y entonces tenemos estimaciones consistentes de y podemos hacer la estimación FGLS del modelo de efectos aleatorios.
33
La estimación generalizada factible (FGLS)
Supuesto 3. La matriz es invertible Los supuestos 1 a 3 aseguran la estimación consistente. Supuesto 4: nos asegura que el estimador RE-FGLS sea asintóticamente normalmente distribuido: disponemos de una muestra (Yi, Wi) que es IID sobre i.
34
La estimación generalizada factible (FGLS)
La estimación RE-FGLS se computa paso a paso: Se hacen unas estimaciones MCO del modelo Se obtienen estimaciones de y Se calcula Se hace la transformación RE-FGLS en cada una de las variables del modelo (Yi, Wi) Se estima por MCO del modelo transformado Si it es IID sobre i y T, entonces tiene la forma que caracteriza un modelo de efectos aleatorios, de modo que la estimación VCE es consistente Si hay correlación en la dimensión temporal del proceso it , el estimador REFGLS es consistente pero para disponer de los errores estándar correctos hay que emplear el estimador cluster-robust del VCE. En este último caso, la estimación de no es plenamente eficiente.
37
Si hay correlación en la dimensión temporal de los it la forma de la matriz impuesta por el supuesto RE-FGLS no es correcta En este caso es más eficiente la estimación POOL – FGLS En esta estimación sustituimos el supuesto 2 de RE-FGLS por un supuesto nuevo, además de mantener el resto de supuestos (1, 3 y 4): Supuesto 1 de P-FGLS: E[ ’| xi] = E[ ’] = se estima mediante son los residuos derivados de POLS.
38
El comando xtgee estima los parámetros de modelos lineales generalizados para la media de la población (modelos PA, population average) En modelos lineales los modelos PA son los modelos que los modelos combinados (pooled)
39
Modelos de efectos fijos
En muchas ocasiones no se pueden mantener el supuesto de efectos aleatorios Ahora añadimos el supuesto 1 de efectos fijos E[it| xit, zi,vi,] = 0 para cualquier t En efectos fijos permitimos pues la correlación entre xit y vi. Si hacemos la regresión en la que los salarios dependan de una serie de factores: Simplemente el hecho de haber olvidado algún factor, quedará recogido en el término de perturbación, y en concreto en vi. Si ese factor olvidado está correlacionado con alguna de las variables explicativas (pej educación), entonces se violan los supuestos del modelo de efectos aleatorios.
40
E[yit| xit, vi,] = xit + vi
Modelos de efectos fijos El modelo de efectos fijos es: E[yit| xit, vi,] = xit + vi zi no figura en el modelo porque si introducimos los efectos fijos habrá correlación perfecta. ¿Cómo estimamos ? Tenemos dos opciones: Estimación within: resta la media al nivel del grupo de una variable Transformación en primeras diferencias temporales
41
Modelos de efectos fijos
Estimación within El modelo básico es el siguiente: Ahora tomamos promedios para cada individuo a lo largo del tiempo Restamos ambas ecuaciones y encontramos la expresión within
42
Modelos de efectos fijos
Estimación within Definimos las variables transformadas en desviaciones con respecto de su media como: Y el modelo transformado queda como:
43
Modelos de efectos fijos
Primeras diferencias Las variables transformadas en primeras diferencias son: Partimos del modelo original: Y el modelo transformado queda como:
44
Modelos de efectos fijos
Las estimaciones de los modelos within y en primeras diferencias por MCO son consistentes. Y por supuesto, esperamos obtener las mismas . No obstante, si el proceso it es IID sobre i y t entonces, al hacer primeras diferencias estaríamos introduciendo una raíz unitaria. Lo habitual es que it tenga algún tipo de correlación serial, de manera que el proceso transformado también tendrá algún tipo de correlación serial. Según el tipo de correlación temporal de it será más eficiente la estimación within o la estimación por primeras diferencias.
45
Modelos de efectos fijos
Supuestos del modelo de efectos fijos Supuesto 1 within: E[it| xit,vi] = 0 para cualquier t Supuesto 2 within: es invertible Supuesto 3 within: E[’it, it | xit,vi] = 2 IT Supuesto 4 within: la muestra (Yi, Wi) es IID sobre i. Los supuestos 1 y 2 aseguran la consistencia de la estimación. Los supuestos 3 y 4 nos permiten disponer de la distribución asintóticamente normal
47
Modelos de efectos fijos
Si el supuesto 3 within no se cumple ( E[’it, it | xit,vi] = 2 IT ), entonces el estimador within es consistente, pero no eficiente. Es el caso en el cual hay correlación serial, y además necesitamos una estimación de los verdaderos errores estándar (la estimación VCE cluster-robust).
49
Modelos de efectos fijos
Supuestos de la estimación por primeras diferencias. Supuesto 1 PD: E[it| xit,vi] = 0 para cualquier t Supuesto 2 PD: es invertible Supuesto 3 PD: E[’it, it | xit,vi] = 2 IT Supuesto 4 PD: la muestra (Yi, Wi) es IID sobre i. De nuevo, los supuestos 1 y 2 aseguran la consistencia de la estimación. Y de nuevo los supuestos 3 y 4 nos permiten disponer de la distribución asintóticamente normal
51
Modelos de efectos fijos
Como ya hemos apuntado anteriormente, si los errores del modelo original no siguen un camino aleatorio, entonces it ya no es un proceso IID. Si el proceso original tiene algún tipo de correlación serial, entonces el estimador de primeras diferencias también tendrá algún tipo de correlación serial, y por lo tanto la estimación MCO del modelo en primeras diferencias será ineficiente. De nuevo, necesitamos una estimación de los verdaderos errores estándar (la estimación VCE cluster-robust).
53
Modelos de efectos fijos
Toda vez que supongamos que el supuesto 3 (tanto en el modelo within como en el modelo de primeras diferencias) no se cumple, entonces la estimación eficiente es la estimación generalizada. En la estimación generalizada, de las dos opciones (within y PD) la segunda (PD) es más fácil de implementar. Supuestos de la estimación PD-FGLS. Supuesto 1 PD: E[it| xit,vi] = 0 para cualquier t Supuesto 2 PD: es invertible Supuesto 3 PD: E[’it, it | xit,vi] = Supuesto 4 PD: la muestra (Yi, Wi) es IID sobre i. Los supuestos 1 y 2 aseguran la consistencia y los supuestos 3 y 4 nos permiten disponer de la distribución asintóticamente normal.
55
¿Efectos fijos o efectos aleatorios?
En econometría las preguntas las respondemos mediante contrastes. La elección entre efectos fijos o efectos aleatorios se resuelve utilizando el test de Hausman. Hipótesis nula: las variables explicativas no están correlacionadas con vi. Entonces la estimación de efectos aleatorios es consistente y eficiente, mientras que la estimación de efectos fijos también es consistente, pero es ineficiente. Hipótesis alternativa: las variables explicativas están correlacionadas con vi. Entonces la estimación de efectos aleatorios es inconsistente, mientras que la estimación de efectos fijos es consistente. Hipótesis de contraste:
56
¿Efectos fijos o efectos aleatorios?
Estadístico de contraste: A medida que los vectores estimados sean diferentes, el estadístico de contraste se hará mayor y se rechazará la hipótesis nula. Desde el punto de vista asintótico tiene que cumplirse que la estimación de efectos fijos al ser no eficiente, tiene que ser mayor que la varianza de la estimación efectos aleatorios. Hausman demostró que bajo ciertas condiciones: Por tanto:
57
¿Efectos fijos o efectos aleatorios?
No obstante, no está garantizado que los supuestos hechos por Hausman se cumplan, por lo cual es posible que no se cumpla que Y por lo tanto, podría ser que la varianza de la diferencia de vectores no sea una matriz definida positiva. En tal caso, el estadístico no tiene porqué seguir una 2. De hecho, el estadístico podría ser negativo. Stata calcula el estadístico de Hausman empleando los resultados que se hayan ido guardando en el programa. Primero se especifica el nombre de la estimación consistente e ineficiente (efectos fijos) y a continuación la estimación potencialmente consistente y eficiente (efectos aleatorios).
59
Claramente se rechaza la hipótesis nula: los vectores de parámetros son muy diferentes y eso indica que la estimación potencialmente eficiente, es inconsistente.
60
Contraste de la dimensión temporal de los residuos
Ya se ha visto que hay diferencias entre la estimación within y la estimación por primeras diferencias. La segunda requiere que el término de perturbación del modelo original sea un proceso integrado, de manera que Supuesto 3 PD: E[’it, it | xit,vi] = 2 IT o bien: E[’it, it | xit,vi] = Si los residuos it son IID, entonces E[’it, it-1] = -0.5 Woodridge (2002) propone un contraste en el cual los residuos del modelo en primeras diferencias se regresan en función de sus retardos, revisando al hipótesis de que el coeficiente sea -0.5
61
Contraste de la dimensión temporal de los residuos
62
La versión Mundlak (1978) del contraste de Hausman y la versión cluster-robust de Woolridge (2002)
La idea es consiste en concentrar en la misma regresión la estimación de efectos fijos y la diferencia entre la estimación de efectos fijos y de efectos aleatorios. Al tener la segunda parte en una misma regresión, se evitan los problemas que conlleva relacionados con la matriz de varianzas y covarianzas de la diferencia entre los vectores a contrastar. 1º se calcula el promedio para cada invididuo
63
2º A continuación se estima un modelo con las variables originales y, además, las variables que recogen el promedio.
64
La estimación Mundlak nos ofrece en una estimación de efectos aleatorios, por un lado la estimación de los efectos fijos (estimación within), y por otro lo que se desvía de los efectos fijos. Finalmente se hace un simple test de Wald de restricciones lineales sobre los parámetros la última estimación.
65
Estimadores de variables instrumentales
Cuando los regresores (X) están corrlacionados con el término de perturbación (), entonces ya hemos visto que la estimación es inconsistente. Supongamos que disponemos de kQ variables instrumentales (Q), las cuales no están correlacionadas con , pero sí lo están con las variables explicativas: - E[Q'i, i] = 0 - E[Q'i,Xi] 0 SI resulta que tenemos la misma cantidad de variables explicativas que de variables instrumentales ( kQ = kX ) entonces tenemos un modelo exactamente identificado que se conoce como estimación de variables instrumentales (VI).
66
Estimación por GMM (método generalizado de los momentos)
Cuando hay más instrumentos que variables explicativas en el modelo (kQ > kX), la estimación por VI no puede hacerse. Las dos soluciones habituales son los Mínimos Cuadrados en Dos Etapas (MC2E, TSLS), o la estimación mediante el Método Generalizado de los Momentos (MGM, GMM). Este segundo método no requiere ningún supuesto sobre la distribución probabilística de los estimadores, y busca minimizar una función de pérdida en la cual cada argumento pretende reproducir las condiciones de ortogonalidad (los instrumentos no están correlacionados con los errores):
67
Estimación por GMM (método generalizado de los momentos)
S es una matriz kQ x kQ que define la métrica del sistema de ecuaciones, de manera que sirve para ponderar cada una de las condiciones de ortogonalidad. La forma de S no afecta a la consistencia de la estimación, pero sí a su eficiencia. Cuantos más instrumentos se añadan al sistema, mayor será la forma del sistema generalizado. Esto puede ayudar a mejorar la eficiencia, pero a costa de aumentar el sesgo de la estimación. El estimador GMM emplea 2 etapas. En la primera se utiliza o bien la matriz identidad (I), o bien la matriz Q’Q. Se obtiene así la primera estimación de GMM. En una segunda etapa se obtienen los residuos de la primera estimación que se emplean para estimar S y producir una mejor estimación de GMM.
68
Exogeneidad y utilidad de los instrumentos
La estimación GMM necesita dos tipos de supuestos para identificar los parámetros. Exogeneidad E[Q'i, i] = 0 Relevancia del instrumento: Rango(E[Q'i,Qi] = kQ Rango(E[Q'i,Xi] = kX El supuesto 2b implica los instrumentos estén correlacionados con los regresores, pero no se especifica qué cantidad de correlación es necesaria. Evidentemente, cuanto mayor sea, mejor (menor será el sesgo en muestra finita y menor la varianza del estimador). Si la correlación es muy pequeña, hablaremos del problema de los instrumentos débiles.
69
Los modelos Hausman-Taylor (xttaylor)
Hay modelos de efectos aleatorios en los cuales algunos regresores están correlacionados con vi. E[X1it,vi] = 0 ; E[Z1it,vi] = 0 E[X2it,vi] 0 ; E[Z2it,vi] = 0 Asumimos que los errores idiosincráticos sí que cumplen el criterio de exogeneidad con todas las variables E[X1it,it] = E[Z1it, it] = E[X2it, it] = E[Z2it, it ] = 0 EL estimador de efectos fijos estima consistentemente 1 y 2, pero no puede identificar 3 y 4.
70
Los modelos Hausman-Taylor (xttaylor)
Hausman y Taylor (1981) y Baltagi (2005) derivan el estimador como un estimador TSLS, un caso especial de GMM. El modelo de partida es: La idea es usar transformaciones de X1 y de X2 (y además Z1, claro) como instrumentos: ivregress 2sls contiene la media a nivel de grupo de la variable xit es la transfomación within de la variable xit es la transformación MCG de la variable xit
71
Los modelos Hausman-Taylor (xttaylor)
Este estimador emplea la estructura de los datos longitudinales para crear variables instrumentales: si bien X2 es una variable endógena con vi, su transformación within no lo es, por lo que se convierte en un instrumento válido. Por su parte, la transformación MCG es una combinación lineal de las transformaciones within y between de X. En consecuencia se puede calcular el estimador Hausman Taylor directamente mediante: ivregress 2sls
72
Los modelos Hausman-Taylor (xttaylor)
Este modelo está sobre identificado so kX1 > kZ2 , lo que clarifica que las transformaciones de X2 son los que actúan como instrumentos para X2. La estimación de 2 dependerá de cómo es la varianza de X2, de manera que será necesario que la varianza de la transformación within sea suficientemente grande. Por último, la estimación de 4 dependerá de la bondad como instrumentos del resto de variables exógenas.
73
Los modelos Hausman-Taylor (xttaylor)
Ejemplo Baltagi y Khanti-Akom (1990, Journal of Applied Econometrics) 595 observaciones de individuos durante el período 1976–1982. Fuente Panel Study of Income Dynamics (PSID). En el modelo el salario (lnwage) es función de: la antigüedad en la empresa (wks), dummies geográficas (smsa, south), el estado civil (ms), los años de educación (ed), la experiencia laboral( exp , exp2), la ocupación (occ), el sector (ind) y variables binarias relativas a la sindicación (union), sexo (fem) y raza (blk)
74
Los modelos Hausman-Taylor (xttaylor)
75
Los modelos Hausman-Taylor (xttaylor)
1º descripción de la base de datos Y Z1 X1
76
Los modelos Hausman-Taylor (xttaylor)
1º descripción de la base de datos X2 Z2
77
Los modelos Hausman-Taylor (xttaylor)
1º descripción de la base de datos X2 Z2
78
Los modelos Hausman-Taylor (xttaylor)
Comprobamos hasta qué punto las puramente exógenas puedan ser instrumentos de Z2 (ed)
79
Los modelos Hausman-Taylor (xttaylor)
Hacemos la estimación por efectos fijos
80
Los modelos Hausman-Taylor (xttaylor)
Hacemos la estimación por efectos aleatorios
81
Los modelos Hausman-Taylor (xttaylor)
Hacemos la estimación por HT
82
Los modelos Hausman-Taylor (xttaylor)
Hacemos la estimación por HT, con la estimación Amemiya MaCurdy
83
Los modelos Hausman-Taylor (xttaylor)
Resumen de las estimaciones Podemos hacer una tabla en Excel con el comando outreg2
84
Los modelos Hausman-Taylor (xttaylor)
85
Un ejemplo de instrumentos débiles
use
86
Un ejemplo de instrumentos débiles
87
Modelos dinámicos para datos de panel
El modelo de referencia es ahora un modelo dinámico, en el cual lo que pasa hoy (t) depende de lo que pasó ayer (t-1). Por definición yit está correlacionado con vi, el efecto individual, independiente-mente de si it está correlacionado en el tiempo. La estimación consistente no se puede hacer mediante el procedimiento within, pero sí mediante primeras diferencias. A continuación se estima el modelo usando variables instrumentales y empleando el método GMM.
88
Modelos dinámicos para datos de panel
Partimos pues del modelo en primeras diferencias: De este modo se elimina vi, pero resulta que yit es función de it y por tanto de it-1, con lo cual seguimos teniendo endogeneidad en el modelo. Aparecen entonces diversas alternativas de estimación. Bajo el supuesto de que it es IIDsobre i y t: Anderson y Hsiao (1981, JASA): se pueden emplear retardos de yit como instrumentos de yit-1 (ver xtivreg). Holtz-Eakin et al (1988, Econometrica) y Arellano y Bond(1991, R Ec Studies): : pueden usarse tanto retardos de y como primeras diferencias de las X.
89
Modelos dinámicos para datos de panel
La cuestión de qué instrumentos empleamos es clave en la estimación. Stata indica qué transformaciones de las variables se emplearon como instrumentos y por lo tanto, como condiciones de momentos en la estimación GMM. Arellano y Bond (1991)desarrollaron la identificación de cuántos retardos de la variable dependiente, de las variables explicativas exógenas y de las variables explicativas endógenas son instrumentos válidos y se pueden emplear en una amplia matriz de instrumentos. Para ejemplificar el procedimiento empleamos el mismo modelo que el presentado en Arellano y Bond (1991) en RES:
90
Modelos dinámicos para datos de panel
Donde: n log de empleo w log del salario real k log del stock de capital bruto ys log del output de la industria t es un efecto temporal común a todas las empresas Yr : dummies
91
Modelos dinámicos para datos de panel
Reproducimos los resultados de la tabla 4 de AB(91) con el comando xtabond
92
Modelos dinámicos para datos de panel
Reproducimos los resultados de la tabla 4 de AB(91) con el comando xtabond
93
Modelos dinámicos para datos de panel
l(0/1).w: incluye wit, wit-1 l(0/2).(k ys) incluye kit, kit-1, kit-2 incluye ysit, ysit-1, ysit-2 yr1980-yr1984 incluye las dummies year incluye la tendencia lags(2): incluye dos retardos de la endógena Noconstant: No se incluye constante en el modelo
94
Modelos dinámicos para datos de panel
El comando nos indica cuántos instrumentos se han empleado: en este ejemplo, son 41. Lista de instrumentos utilizados. L(2/.).n : indica que se emplearon n, n(-1) y n(-2) como instrumentos L2. indica un retardo (lag) de orden 2 D. indica 1ª diferencia L2D. Indica un retardo de orden 2 de la primera diferencia
95
Modelos dinámicos para datos de panel
96
Modelos dinámicos para datos de panel
Es un contraste de significación conjunta tipo Wald,en el que todos los coeficientes del modelo, excepto la constante, son iguales a cero. Equivalente a test l.n l2.n w l.w k l.k l2.k ys l.ys l2.ys yr1980 yr1981 yr1982 yr1983 yr1984 year
97
Modelos dinámicos para datos de panel
La estimación, no obstante, no coincide plenamente con la de AB(91): los errores estándar no son los correctos. Comprobamos con estat sargan si se cunple el contraste de sobreidentificacion de las restricciones. Este contraste, no obstante, sólo es válido si el error es homocedástico. Lo comprobamos con estat abond. Recordamos que cuando it son IID, entonces tiene que haber correlación de primer orden en el modelo estimado. Es justo lo que encontramos:
98
Modelos dinámicos para datos de panel
Hacemos ahora la estimación robusta. Ahora también coinciden los s.e. de la estimación de AB(1991)
99
Modelos dinámicos para datos de panel
Tras hacer VCE(robust no podemos hacer Sargan, pero sí que se puede pasar el test de autocorrelación:
100
El estimador AB de dos etapas
Básicamente emplea la segunda etapa de las estimaciones de todo GMM: usa los residuos de la primera etapa para ahcer una estimación de la matriz S. Los resultados ofrecen s.e. sesgados, por lo que hay que emplear la estimación robusta
101
El estimador AB de dos etapas
Estimación robusta
102
Modelos dinámicos para datos de panel
Y siempre hacemos el test de autocorrelación serial, ya que si los residuos orginales no son IID, la distribución de los contrastes es deconocida
103
Modelos dinámicos para datos de panel
Hasta ahora hemos mantenido que las variables explicativas son exógenas, pero bien podría darse el caso que hablásemos de variables endógenas que, no obstante, son predeterminadas una vez las hemos observado. Así: E[Xit,is] = 0 si st Y permitimos: E[Xit,is] 0 si s<t Un ejemplo: un shock en que haga aumentar el nivel de capital instalado hoy (o los salarios reales), es posible que afecte a la demanda de trabajo mañana, pero no a la inversa: lo que pase hoy en el capital (o salarios) no afecta a los shocks mañana Cuando se dé esta situación no podemos emplear todos los retardos de las primeras diferencias de las variables como instrumentos. La solución que se aplica es la misma que lo que hacemos para instrumentalizar y: empleamos los retardos de las variables X en niveles.
104
Indicamos que hay dos variables potencialmente pueden ser predeterminadas.
Arellano y Bover (1995, J of Econometrics) encuentran que si un proceso autorregresivo es muy persistente, los retardos de las variables en niveles pueden ser instrumentos débiles.
105
Modelos dinámicos para datos de panel
Puede darse el caso de que alguna variable sea endógena en lugar de que sea predeterminada. En tal caso: Así: E[Xit,is] 0 si s t Pero: E[Xis,it] = 0 si s>t Básicamente la idea es que ahora permitimos que haya correlación temporal entre Xit y it, cosa que en las predeterminadas no permitíamos. Las variables endógenas se tratan igual que los retardos de las variables dependientes, de manera que se emplean los retardos en niveles de dichas variables como instrumentos.
106
Estimación con variables endógenas
107
Finalmente, xtabond nos permite restringir el número de retardos que emplearemos como instrumentos, ya que eso puede aumentar el sesgo de la estimación en muestra pequeña. En el ejemplo, cuando asumimos que la variable es predeterminada. Pasamos de 83 a 67 instrumentos.
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.