La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Variables Artificiales

Presentaciones similares


Presentación del tema: "Variables Artificiales"— Transcripción de la presentación:

1 Variables Artificiales
Son variables binarias o variables cero-uno diseñadas para describir informacion cualitativa

2

3 La muestra separada de Hombres

4 La muestra separada de Mujeres

5 Dos modelos separados: Yi = 1 +  1 Xi + ui (hombre)
Salario Y Y = 1 +  X (hombre) ^ ^ ^ ^ Y =  2 +  X (mujer) X Años de enseñanza Dos modelos separados: Yi = 1 +  1 Xi + ui (hombre) Yj =  2 + 2 Xj + uj (mujer)

6 Supongamos que la relacion entre Y y X no cambia, es decir, las pendientes son las mismas:  1 = 2 . Modelo: Yi = 1 + 2 Di +  Xi + ui Supongamos que la relacion entre Y y X cambia, es decir, las pendientes no son las mismas:  1  2. Modelo: Yi = 1 + 2 Di +  Xi +  D*Xi + ui Yi = salario anual Xi = años de esperiencia enseñando Di = si hombre = en caso contrario (mujer) Variable de control

7 Dos modelos separados: Yi = 1 +  1 Xi + ui
Salario Y Y = 1 +  1X (hombre) ^ ^ ^ ^ Y =  2 + 2X (mujer) X Años de enseñanza Dos modelos separados: Yi = 1 +  1 Xi + ui Yj =  2 + 2 Xj + uj (hombre) (mujer)

8 D1 + D2 = 1 D1 = 1 - D2

9 (La Trampa de la Variable Dummy)
Si se introducen dos variables dummies en un modelo como Yi = 1 + 2 D1i + 2 D2i +  Xi + uI donde D1i = 1 hombre = 0 lo contrario donde D2i = 1 mujer = 0 lo contrario, entonces este modelo no se puede estimar debido a la existencia de multicolinealidad perfecta entre la constante, D1 y D2. D1 = 1 - D2 o D2 = 1 - D1 o D1 + D2 = ( Multicolinealidad Perfecta)

10 Para evitar la multicolinealidad perfecta, si una variable cualitativa tiene “m” categorias, introducir solo “m-1” variables dummies. 1 Cuando a una de las categorias de una variable dummy se le asigna el valor de cero se la llama categoria-control (o grupo omitido). 2

11 Volvamos al ejemplo del principio:
Model: Yi = 1 + 2 Di +  Xi + uI Di = 1 hombre = 0 en caso contrario Hombre: ==> Yi = (1 + 2 Di) +  Xi Di = 1 ^ Mujer: ==> Yi = 1 +  Xi Di = 0

12 Regresiones Separadas por sexo
Mujeres Hombres

13 Regresiones via dummies para el mismo ejemplo
D2:H =1 D1:M =1 Yi = (1 + 2 D) +  Xi ^ Yi = (1 + 2 D) +  Xi ^ = ( ) X = ( ) X

14 Regresion sin distincion de sexos
Yi = 1 +  Xi ^ = X

15 Mujer: Y = (1 + 2 D) + (1 + 2D)X Hombre: Y = 1 + 1 Xi ^
D1: Mujer =1 Interpreta esta regresion donde se permite la pendiente sea diferente para cada sexo Mujer: Y = (1 + 2 D) + (1 + 2D)X Hombre: Y = 1 + 1 Xi ^ = X = X

16 D2: Hombre=1 = X Hombre: Y = (1 + 2 D) + (1 +2D)X Mujer: Y = 1 + 1 Xi ^ = X

17 Una variable cualitativa con mas de dos categorias
(Gasto medico) = 1 + 2 D2 + 3 D3 + Renta + u (Y) (X) D2 = 1 Educacion secundaria = 0 otros D3 = 1 Educacion universitaria

18 Gasto Medico Educacion Universitaria Y = (1 + 3 D3) +  X ^ D3 = 1 Educacion Secundaria Y = (1 + 2 D2) +  X ^ D2 = 1 Menos que Secundaria Y = 1 +  X ^ 3 ^ 2 ^ 1 ^ renta

19 ========================================= obs Y X D2 D3
D2 = 1 Secundaria = 0 otros D3 = 1 Universitaria = 0 otros ========================================= obs Y X D2 D3

20

21 Menos que secundaria: Yi = Xi ^ Secundaria: Yi = ( ) Xi ^ = X = X Yi = ( ) Xi ^ = Xi Universitaria: = X

22 Una variable cualitativa con varias categorias :
Ejemplo : Un modelo para el gasto medico segun la edad Yi = 0 + 1 A1 + 2 A2 +  Xi + ui (t-valor) (t-valor) donde A1 = 1 si 55 > edad > 25 = 0 otros A1 + A2  1 A2 = 1 si edad > 55 = 0 otros A2 =1 A1 =1 25 55

23 (Cont.) Entonces los modelos estimados son: Menos de 25 Y = 0 +  X ^
25 < edad < 55 Y = (0 + 1A1) +  X ^ ^ ^ ^ edad > 55 Y = (1 + 2A2) +  X ^ ^ ^ ^ Pensad que hipotesis pueden ser interesantes para contrastar y como hacerlo

24 En un diagrama de puntos Y-X:
0 ^ 1 2 Y X edad < 25 25 < edad < 55 edad > 55 Y = ( 0 + 2) +  X Y = ( 0 + 1) +  X Y = 0 +  X

25 Dos variables cualitativas
(Y) Salario= 1 + 2 D2 + 3 D3 +  X + u o Y = 1 + 2 D2 + 3 D3 +  X + 1 D2*X + 2 D3*X + u’ D2 = hombre = 0 otros sexo D3 = blanca = 0 otras raza (1) Salario medio para profesoras de raza negra: ^ Y = 1 +  X es decir D2 = 0, D3 = 0 ^ ^ (2) Salario medio para profesores de raza negra: Y = (1 + 2 D2) +  X es decir D2 = 1, D3 = 0 ^ ^ ^

26 (3) Salario medio para profesoras de raza blanca:
^ Y = (1 + 2 D3) +  X esto es D2 = 0, D3 = 1 ^ ^ (4) Salario medio para profesores de raza blanca: Y = (1 + 2 D2 + 3 D3) +  X esto es D2 = 1, D3 = 1 ^

27 Diferentes tipos de regresion con variables dummies
1. Identica: Y = 1 + 2 X + 3 D + 4 D*X H0 : 3 = 0 y 4 = 0 D = 1 si = 0 demas ( ) 2. Paralela: Y = 1 + 2 X + 3 D + 4 D*X H0 : 4 = 0 3. Concurrente: Y = 1 + 2 X + 3 D + 4 D*X H0 : 3 = 0 4. Cruzada: Y = 1 + 2 X + 3 D + 4 D*X H0 : 3  0 y 4  0

28 Periodo (46-54): Yt = A1 + A2 Xt + u1t
Periodo (55-63): Yt = B1 + B2 Xt +u2t Y Y B2 1 A2 A2 = B2 B1 1 1 A1 A1 = B1 X X A1  B1, A2 = B2 Identica Paralela

29 Y Y A2 A2 1 B2 B2 1 1 1 B1 A1 = B1 A1 X X A1 = B1, A2  B2 A1  B1, A2  B2 Concurrente Cruzada

30 Efectos interactivos entre dos variables cualitativas
Ejemplo: Gasto(Y) = 1 +  2 D2 +  3 D3 +  renta(X) + u D2 = 1 mujer = 0 demas sexo D3 = 1 estudiante universitario educacion Efecto Interactivo: Gasto(Y) =  1 +  2 D2 +  3 D3 +  4 D2*D3 +  renta(X) + u  2 = efecto diferenciador de ser mujer  3= efecto diferenciador de ser estudiante universitario  4 = efecto diferenciador de ser mujer estudiante universitaria

31 Modelo Concurrente (o modelo con variacion en la pendiente)
Ejemplo: Como podemos contrastar la hipotesis de que el consumo de gasolina es diferente en un coche nuevo que en un coche usado??? Supongamos que al comienzo no hay ninguna diferencia de consumo entre los dos tipos de coches: ^ ^ Consumo gasolina Usado Y = 0 + X ^ Y = 0 + (0 + 1) X Y Nuevo Y = 0 + 0 X ^ o o o o o o o o o o * * * * * * * * * * * 0 ^ X millas

32 Sea  = 0 + 1 D donde D = 1 coche usado = 0 otros
Entonces Yi = 0 + (0 + 1 D) Xi +ui Variable dummy multiplicativa = 0 + 0 Xi + 1 D*Xi +ui = 0 + 0 Xi + 1 Zi +ui Las relaciones estimadas son: Nuevo : Yi = 0 + 0 Xi ^ ^ ^ == Usado: Yi = 0 + (0 + 1 Di) Xi donde Di = 1 ^ ^ ^ ^ Yi = 0 +  Xi == ^ o

33 Queremos contrastar si 1 = 0 o no. Se pueden utilizar dos estrategias:
^ ^ ^ (i) Comparar : (a) Y = 0 +  X ^ ^ ^ (b) Y = 0 +  0X (ii) Usar el t-test : Y = 0 +0 Xi + 1 Z ^ H0 : 1 = 0 Si t* > tcP, N-3 H1 : 1 > 0 o (1  0) => rechazar H0

34 …... …... …... …... …... ^ ^ ^ ^ Y = 0 + 0 Xi + 1 Zi +
Calcular el t-valor

35 Variaciones tanto en la constante como en la pendiente
Ejemplo: Estimacion de efectos estacionales : E =  +  T + u E : consumo de electricidad T : temperatura Para capturar los efectos estacionales solo en la constante: E = 0 + 1 D1 +2 D2 + 3 D3 +  T + u D1 = invierno otros donde D2 = primavera otros prim verano oto invier Q1 Q2 Q3 Q4 D3 = verano otros

36 Considerad ahora tambien un cambio en las pendientes por razones estacionales.
Sea  = 0 + 1 D1 + 2 D2 + 3 D3 Entonces, el modelo completamente especificado es E = [0 + 1 D1 + 2 D2 + 3 D3] + 0 T + 1 D1 T + 2 D2 T + 3 D3 T +  Z1 Z2 Z3

37 Los cuatro submodelos son:
Otoño E = 0 + 0 T ^ Invierno E = (0 + 1) + (0 + 1) T Primavera E = (0 + 2) + (0 + 2) T Verano E = (0 + 3) + (0 + 3) T 0 ^ 1 2 4 T E E = 0 + 0 T (Otoño) E = (0 + 1) + (0 +2)T(Invier) E = (0 + 1) + (0 + 2)T (Primaver) E = (0 + 3) + (0 + 3)T (Verano)

38 Trimestre de control es el primero
Los efectos estacionales a veces se modelan como efectos trimestrales D2 = Trimestre = 0 otros D3 = Trimestre = 0 otros D4 = Trimestre = 0 otros Trimestre de control es el primero

39 1. En E-views dummy = 1 si estamos en el 1-er trimestre
= 0 otros

40 Como son las variables artificiales?

41 Contraste de Cambio Estructural basado en variables dummies
Modelo Basico 1974 1960 1989 YT =  +  XT + uT Se define la variable dummy : D = 1 para el periodo que va de 1974 al 1989 = 0 el resto Pra contrastar si las estructuras de los dos periodos son diferentes, la especificacion debe asumir que  = 0 + 1 D  =  1 + 2 D El modelo de regresion: YT = 0 + 1 D +  1 XT + 2 D XT + uT

42 Ejemplo: El contraste de Chow en el modelo que relaciona tasa de desempleo y tasa de utilizacion de capacidad Var Depend. Constante CAPt R2 F RSS n _ Muestra : desemplt (12.1) (9.7) RSSR ^ Muestra : desemplt (5.9) (4.4) RSS1 ^ Muestra : desemplt (13.1) (10.1) RSS2 ^ Notae : en parentesis los t-valores

43 Contraste de cambio estructural via un test F:
H0 : No cambio estructural H1 : Si Para el modelo no restringido:: RSSNR = RSS1 + RSS2 = = 7.98 F* = (RSSR - RSSNR) / k RSSNR / (T - 2k) = ( ) / 2 7.98 / (30 - 4) = 14.9 Fc 0.01, k, T -2k = Fc = 5.53 = 3.37 0.05 0.05, 2, 26 F* > Fc ==> rechazar H0

44 ^ ^ ^ Tasa de desempleo- tasa de utilizacion de capacidad
Muestra : Dt = a 1980 = 0 antes de 1974 desempl = Dt CAPt (Dt*CAPt) ^ (6.7) (2.7) (5.0) (2.5) R2 = SEE = F = n = 30 _ El modelo estimado para el periodo : desempl = CAP El modelo estimado para el periodo : desempl = ( ) - ( )CAP = CAP ^ ^

45 …………………………………..…... …………………………………..…... D = 1 Si t 7 4 = 0 otros
Datos Año ut CAPt Dt Dt*CAPt …………………………………..…... …………………………………..…... 10.5 10.5 11.2 11.2 …...…

46 Año ut CAPt Dt Dt.CAPt …………………….… …………………….… …………………….… U = 0 + 1 CAP + 2 Dt*CAPt

47 La interpretacion de variables dummies en modelos de regresion Semilog (o Log-Lin)
(Salario) (años de enseñanza) ln Y = 1 + 2 X + 3 D D1 = hombre = demas ln Y = X D ^ t=(481.5) (48.3) (27.2) R2 = dw = 2.51 Tomando antilogaritmos de = Esto significa que el salario inicial de un profesor-hombre es mas alto que el de una profesora-mujer en un porciento. El modelo estimado para el salario de los profesores-hombres es: ln Y = ( ) X ln Y = X ^


Descargar ppt "Variables Artificiales"

Presentaciones similares


Anuncios Google