La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Variables Artificiales Son variables binarias o variables cero-uno diseñadas para describir informacion cualitativa.

Presentaciones similares


Presentación del tema: "Variables Artificiales Son variables binarias o variables cero-uno diseñadas para describir informacion cualitativa."— Transcripción de la presentación:

1 Variables Artificiales Son variables binarias o variables cero-uno diseñadas para describir informacion cualitativa

2

3 La muestra separada de Hombres

4 La muestra separada de Mujeres

5 Salario Y X Años de enseñanza Dos modelos separados: Y i =  1 +  1 X i + u i Y j =  2 +  2 X j + u j (hombre) (mujer) Y =  2 +  X (mujer) ^ ^ ^ Y =  1 +  X (hombre) ^ ^ ^

6 Supongamos que la relacion entre Y y X no cambia, es decir, las pendientes son las mismas:  1 =  2. Modelo: Y i =  1 +  2 D i +  X i + u i Y i =  1 +  2 D i +  X i +  D*X i + u i Y i = salario anual X i = años de esperiencia enseñando D i = 1 si hombre = 0 en caso contrario (mujer) Variable de control Supongamos que la relacion entre Y y X cambia, es decir, las pendientes no son las mismas:  1   2. Modelo:

7 Salario Y X Años de enseñanza Dos modelos separados: Y i =  1 +  1 X i + u i Y j =  2 +  2 X j + u j (hombre) (mujer) Y =  2 +  2 X (mujer) ^ ^ ^ Y =  1 +  1 X (hombre) ^ ^ ^

8 D 1 + D 2 = 1 D 1 = 1 - D 2

9 (La Trampa de la Variable Dummy) Si se introducen dos variables dummies en un modelo como Y i =  1 +  2 D1 i +  2 D2 i +  X i + u I donde D1 i = 1 hombre = 0 lo contrario donde D2 i = 1 mujer = 0 lo contrario, entonces este modelo no se puede estimar debido a la existencia de multicolinealidad perfecta entre la constante, D1 y D2. D1 = 1 - D2 o D2 = 1 - D1 o D1 + D2 = 1 ( Multicolinealidad Perfecta)

10 Para evitar la multicolinealidad perfecta, si una variable cualitativa tiene “m” categorias, introducir solo “m-1” variables dummies. 1 2 Cuando a una de las categorias de una variable dummy se le asigna el valor de cero se la llama categoria-control (o grupo omitido).

11 Volvamos al ejemplo del principio: Model: Y i =  1 +  2 D i +  X i + u I Hombre: ==> Y i = (  1 +  2 D i ) +  X i D i = 1 ^ ^ ^ ^ Mujer: ==> Y i =  1 +  X i D i = 0 ^ ^ ^ D i = 1 hombre = 0 en caso contrario

12 Mujeres Hombres Regresiones Separadas por sexo

13 Regresiones via dummies para el mismo ejemplo Y i = (  1 +  2 D) +  X i ^ ^^ ^ = (19.937-1.2810) + 1.561X D1:M =1 D2:H =1 = (16.656+1.2810) + 1.561X Y i = (  1 +  2 D) +  X i ^ ^^ ^

14 Y i =  1 +  X i ^ ^ ^ = 17.095+1.608X Regresion sin distincion de sexos

15 D1: Mujer =1 Mujer: Y = (  1 +  2 D) + (  1 +  2 D)X Hombre: Y =  1 +  1 X i ^ ^ ^ ^ ^ ^ = 18.689 + 1.373 X = 16.255 +1.677 X Interpreta esta regresion donde se permite la pendiente sea diferente para cada sexo

16 D2: Hombre=1 Hombre: Y = (  1 +  2 D) + (  1 +  2 D)X Mujer: Y =  1 +  1 X i ^ ^ ^ ^ ^ ^ =16.255 + 1.677 X =18.689 + 1.373 X

17 Una variable cualitativa con mas de dos categorias (Gasto medico) =  1 +  2 D 2 +  3 D 3 +  Renta + u (Y)(X) D 2 = 1 Educacion secundaria = 0 otros D 3 = 1 Educacion universitaria = 0 otros

18 Gasto Medico renta D 3 = 1 Educacion Universitaria Y = (  1 +  3 D 3 ) +  X ^ ^^ ^ Educacion Secundaria Y = (  1 +  2 D 2 ) +  X ^ ^ ^ ^ Menos que Secundaria Y =  1 +  X ^ ^^ D 2 = 1 11 ^ 22 ^ 33 ^

19 D 2 = 1 Secundaria = 0 otros D 3 = 1 Universitaria = 0 otros ========================================= obsYXD2D3 ========================================= 16.00000040.000000.0000001.000000 23.90000031.000001.0000000.000000 31.80000018.000000.0000000.000000 41.90000019.000000.0000000.000000 57.20000047.000000.0000001.000000 63.30000027.000001.0000000.000000 73.10000026.000001.0000000.000000 81.70000017.000000.0000000.000000 96.40000043.000000.0000001.000000 107.90000049.000000.0000001.000000 111.50000015.000000.0000000.000000 123.10000025.000001.0000000.000000 133.60000029.000001.0000000.000000 142.00000020.000000.0000000.000000 156.20000041.000000.0000001.000000 =========================================

20

21 Menos que secundaria:Y i = -1.2859 + 0.1722 X i ^ Y i = (-1.2859 - 0.068 ) + 0.1722 X i ^ = -1.3539 + 0.1722 X = -1.2859 + 0.1722 X Secundaria: Y i = (-1.2859 + 0.447 ) + 0.1722 X i ^ = -0.8389 + 0.1722 X i Universitari a: = -1.2859 + 0.1722 X

22 Una variable cualitativa con varias categorias : Ejemplo :Un modelo para el gasto medico segun la edad Y i =  0 +  1 A 1 +  2 A 2 +  X i + u i (t-valor) dondeA 1 = 1 si 55 > edad > 25 = 0 otros A 2 = 1 si edad > 55 = 0 otros A1 + A2  1 A 2 =1A 1 =10 2555

23 Entonces los modelos estimados son: (Cont.) Menos de 25 Y =  0 +  X ^ ^ ^ Y = (  0 +  1 A 1 ) +  X ^ ^^ ^ 25 < edad < 55 edad > 55 Y = (  1 +  2 A 2 ) +  X ^ ^^ ^ Pensad que hipotesis pueden ser interesantes para contrastar y como hacerlo

24 En un diagrama de puntos Y-X: 00 ^ 11 ^ 22 ^ Y X edad < 25 25 < edad < 55 edad > 55 Y = (  0 +  2 ) +  X ^ ^^ ^ Y = (  0 +  1 ) +  X ^ ^^ ^ Y =  0 +  X ^ ^ ^

25 Dos variables cualitativas (Y) Salario=  1 +  2 D 2 +  3 D 3 +  X + u o Y =  1 +  2 D 2 +  3 D 3 +  X +  1 D 2 *X +  2 D 3 *X + u’ D 2 = 1 hombre = 0 otros sexo D 3 = 1 blanca = 0 otras raza (1) Salario medio para profesoras de raza negra: Y =  1 +  X es decir D 2 = 0, D 3 = 0 ^ ^ (2) Salario medio para profesores de raza negra: Y = (  1 +  2 D 2 ) +  X es decir D 2 = 1, D 3 = 0 ^ ^ ^ ^

26 (3) Salario medio para profesoras de raza blanca: Y = (  1 +  2 D 3 ) +  X esto es D 2 = 0, D 3 = 1 ^ ^ ^ (4) Salario medio para profesores de raza blanca: Y = (  1 +  2 D 2 +  3 D 3 ) +  X esto es D 2 = 1, D 3 = 1 ^^ ^^

27 D = 1 si 1946-1954 = 0 demas (1955-1963) 1. Identica: Y =  1 +  2 X +  3 D +  4 D*X H 0 :  3 = 0 y  4 = 0 2. Paralela: Y =  1 +  2 X +  3 D +  4 D*X H 0 :  4 = 0 4. Cruzada: Y =  1 +  2 X +  3 D +  4 D*X H 0 :  3  0 y  4  0 3. Concurrente: Y =  1 +  2 X +  3 D +  4 D*X H 0 :  3 = 0 Diferentes tipos de regresion con variables dummies

28 Periodo (46-54): Y t = A 1 + A 2 X t + u 1t Periodo (55-63): Y t = B 1 + B 2 X t +u 2t Y X A 1 = B 1 1 A 2 = B 2 Identica Y X A1A1 1 A2A2 Paralela A 1  B 1, A 2 = B 2 B2B2 1 B1B1

29 Y X A 1 = B 1 1 B2B2 Concurrente A2A2 1 Y X A1A1 1 A2A2 Cruzada A 1  B 1, A 2  B 2 B1B1 A 1 = B 1, A 2  B 2 1 B2B2

30 Efectos interactivos entre dos variables cualitativas Gasto(Y) =  1 +  2 D 2 +  3 D 3 +  renta(X) + u Ejemplo: D 2 = 1 mujer = 0 demas sexo D 3 = 1 estudiante universitario = 0 demas educacion Gasto(Y) =  1 +  2 D 2 +  3 D 3 +  4 D 2 *D 3 +  renta(X) + u Efecto Interactivo:  2 = efecto diferenciador de ser mujer  3 = efecto diferenciador de ser estudiante universitario  4 = efecto diferenciador de ser mujer estudiante universitaria

31 Modelo Concurrente (o modelo con variacion en la pendiente) Ejemplo: Como podemos contrastar la hipotesis de que el consumo de gasolina es diferente en un coche nuevo que en un coche usado??? Supongamos que al comienzo no hay ninguna diferencia de consumo entre los dos tipos de coches: Consumo gasolina millas Y X 00 ^ * * * * * * * * * * * o o o o o o o o o o ^^ Usado Y =  0 +  X ^ Y =  0 + (  0 +  1 ) X ^ ^^^ Nuevo Y =  0 +  0 X ^ ^^

32 Sea  =  0 +  1 D donde D = 1 coche usado = 0 otros Entonces Variable dummy multiplicativa Y i =  0 + (  0 +  1 D) X i +u i =  0 +  0 X i +  1 D*X i +u i =  0 +  0 X i +  1 Z i +u i Las relaciones estimadas son: Usado: Y i =  0 + (  0 +  1 D i ) X i donde D i = 1 ^ ^^^ Nuevo : Y i =  0 +  0 X i ^ ^^ == Y i =  0 +  X i == ^ ^ ^ o

33 Queremos contrastar si  1 = 0 o no. Se pueden utilizar dos estrategias: (i) Comparar : (a) Y =  0 +  X ^ ^ ^ (b) Y =  0 +  0 X ^ ^^ (ii) Usar el t-test : Y =  0 +  0 X i +  1 Z ^ ^^^ H 0 :  1 = 0 H 1 :  1 > 0 Si t* > t c P, N-3 => rechazar H 0 o (  1  0)

34 …... Y =  0 +  0 X i +  1 Z i + Calcular el t-valor ^ ^ ^^

35 Variaciones tanto en la constante como en la pendiente Ejemplo: Estimacion de efectos estacionales : E =  +  T + u E : consumo de electricidad T : temperatura Para capturar los efectos estacionales solo en la constante: E =  0 +  1 D 1 +  2 D 2 +  3 D 3 +  T + u donde D 1 = 1 invierno 0 otros D 2 = 1 primavera 0 otros D 3 = 1 verano 0 otros primveranootoinvier Q1Q2Q3Q4

36 Considerad ahora tambien un cambio en las pendientes por razones estacionales. Sea  =  0 +  1 D 1 +  2 D 2 +  3 D 3 Entonces, el modelo completamente especificado es E = [  0 +  1 D 1 +  2 D 2 +  3 D 3 ] +  0 T +  1 D 1 T +  2 D 2 T +  3 D 3 T +  Z1Z1 Z2Z2 Z3Z3

37 Los cuatro submodelos son: Otoño E =  0 +  0 T ^ ^ ^ Invierno E = (  0 +  1 ) + (  0 +  1 ) T ^ ^ ^ ^ ^ Primavera E = (  0 +  2 ) + (  0 +  2 ) T ^ ^^ ^ ^ Verano E = (  0 +  3 ) + (  0 +  3 ) T ^ ^ ^ ^^ 00 ^ 11 ^ 22 ^ 44 ^ T E E =  0 +  0 T (Otoño) ^ ^ ^ E = (  0 +  1 ) + (  0 +  2 )T(Invier) ^ ^^ ^^ E = (  0 +  1 ) + (  0 +  2 )T (Primaver) ^ ^ ^ ^ E = (  0 +  3 ) + (  0 +  3 )T (Verano) ^ ^ ^ ^

38 Los efectos estacionales a veces se modelan como efectos trimestrales D2 = 12-- Trimestre = 0otros D3 = 13-- Trimestre = 0otros D4 = 14-- Trimestre = 0otros Trimestre de control es el primero

39 1. En E-views dummy = 1 si estamos en el 1-er trimestre = 0 otros

40 Como son las variables artificiales?

41 Contraste de Cambio Estructural basado en variables dummies Modelo Basico Y T =  +  X T + u T 1974 1960 1989 Se define la variable dummy : D = 1 para el periodo que va de 1974 al 1989 = 0 el resto Pra contrastar si las estructuras de los dos periodos son diferentes, la especificacion debe asumir que  =  0 +  1 D  =  1 +  2 D El modelo de regresion: Y T =  0 +  1 D +  1 X T +  2 D X T + u T

42 Ejemplo: El contraste de Chow en el modelo que relaciona tasa de desempleo y tasa de utilizacion de capacidad Var Depend.ConstanteCAP t R 2 FRSSn _ Muestra : 60 - 89 desempl t 30.0-0.2930.76193.617.1530 (12.1) (9.7) RSS R ^ Muestra : 60 - 73 desempl t 19.64-0.1750.5919.74.6914 (5.9) (4.4) RSS 1 ^ Muestra : 74 - 89 desempl t 30.63-0.2960.871102.13.2916 (13.1) (10.1) RSS 2 ^ Notae : en parentesis los t-valores

43 H 0 : No cambio estructural H 1 : Si Para el modelo no restringido:: RSS NR = RSS 1 + RSS 2 = 4.69 + 3.29 = 7.98 F * = (RSS R - RSS NR ) / k RSS NR / (T - 2k) = (17.15 - 7.98) / 2 7.98 / (30 - 4) = 14.9 F c 0.01, k, T -2k = F c 0.01 = 5.53 0.050.05, 2, 26 F * > F c ==> rechazar H 0 = 3.37 Contraste de cambio estructural via un test F:

44 Tasa de desempleo- tasa de utilizacion de capacidad Muestra : 1960 - 1989 D t = 11974 a 1980 = 0antes de 1974 desempl = 19.6 + 11.0 D t - 0.175 CAP t - 0.121 (D t *CAP t ) ^ (6.7)(2.7)(5.0) (2.5) R 2 = 0.88 SEE = 0.554 F = 72.2 n = 30 _ El modelo estimado para el periodo 1960-1973: desempl = 19.6 - 0.175 CAP El modelo estimado para el periodo 1974-1980: desempl = (19.6+11.0) - (0.175+0.121)CAP = 30.6 - 0.296 CAP ^ ^

45 D = 1 Si t  7 4 = 0 otros Datos Añou t CAP t D t D t *CAP t 604.205.7000 6100 6200 6300 6400 6500 6600 6700 6800 6900 7000 7100 7200 7300 741 751 761 771 781 … ………………………………..…... 10.5 11.2 10.5 11.2 …...…

46 Añou t CAP t D t Dt . CAP t 791 801 811 821 831 841 851 861 871 881 891 …………………….… U =  0 +  1 CAP +  2 D t *CAP t

47 La interpretacion de variables dummies en modelos de regresion Semilog (o Log-Lin) ln Y =  1 +  2 X +  3 D (Salario) (años de enseñanza) D 1 = 1 hombre = 0 demas ln Y = 2.9298 + 0.0546 X 2 + 0.1341 D ^ t=(481.5) (48.3) (27.2) R 2 = 0.995 dw = 2.51 Tomando antilogaritmos de 0.1341 = 1.1435 Esto significa que el salario inicial de un profesor-hombre es mas alto que el de una profesora-mujer en un 14.35 porciento. El modelo estimado para el salario de los profesores- hombres es: ln Y = (2.9298 + 0.1341) + 0.0546 X ln Y = 3.0639 + 0.0546 X ^ ^


Descargar ppt "Variables Artificiales Son variables binarias o variables cero-uno diseñadas para describir informacion cualitativa."

Presentaciones similares


Anuncios Google