Variables Artificiales

Slides:



Advertisements
Presentaciones similares
TOPICOS DE ECONOMETRIA APLICADA Series de Tiempo Introducción
Advertisements

TOPICOS DE ECONOMETRIA APLICADA Uso de Variables Dummy Series de Tiempo Daniel Lema.
Estadística Administrativa II
Variables Artificiales Son variables binarias o variables cero-uno diseñadas para describir informacion cualitativa.
Free and Quick Translation of Anderson's slides1 Analisis de Regresión Múltiple y =  0 +  1 x 1 +  2 x  k x k + u 5. Variables Dummies o Artificiales.
REGRESIÓN LINEAL MÚLTIPLE TEMA INTRODUCCIÓN 2 x1x1 Y x2x2 x3x3 xKxK.
Contraste de Hipotesis
TEMA 3: ESTADÍSTICA BIDIMENSIONAL. ÍNDICE: 1.- Relación estadística: correlación. 2.- Diagramas de dispersión o nube de puntos. 3.- Tablas de frecuencia.
ECONOMETRíA GECO Tema 7 (Libro M. Matilla et al. Tema 14) TENDENCIAS, RAÍCES UNITARIAS Y REGRESIONES ESPUREAS CONCEPTO DE TENDENCIA Tendencias.
PRUEBA DE HIPÓTESIS. 1. Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste involucra la toma de decisión acerca.
1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.
Asi es Como Tendria que Ser la Vida
METODOS ECONOMETRICOS Datos de Panel Introducción a Efectos Fijos Efectos Aleatorios Daniel Lema.
DISEÑO EN CUADRADO LATINO Y GRECOLATINO
Estudio comparativo de la frecuencia de uso de estrategias de aprendizaje en estudiantes de la Facultad de Psicología y la Facultad de Ciencias Económicas.
Unidad 1 Cinemática Semana 1:
UCEMA-ITBA MEP Daniel Lema
TECNOLOGICO DE ESTUDIOS SUPERIORES DE COACALCO
Introducción a las Estadísticas
Capítulo 5 Método de MonteCarlo
Procedimiento completo de regresión múltiple
Qué es la Econometría No hay acuerdo en la definición ya que:
El modelo simple de regresión
Introducción a los modelos econométricos
Asi es Como Tendria que Ser la Vida
MODELOS MULTIECUACIONALES
Regresion Multiple Varias variables explicativas
Temas Estimador de Efectos Fijos: utiliza una transformación para eliminar el efecto inobservable ai antes de la estimación Estimador de Efectos Aleatorios:
Diferentes Formas Funcionales Cosas del Analisis de Regresion
Panorama de la educación 2016
Analisis de Regresion Para dos Variables (poblacion y muestra)
Variables dummy Una variable dummy toma valores entre 1 y 0 Ejemplo:
DISCUSIÓN DE LA FORMA FUNCIONAL
SUPUESTOS DEL MODELO DE MINIMOS CUADRADOS
RELACIÓN ENTRE UNA VARIABLE DEPENDIENTE Y UNA O MAS INDEPENDIENTES.
ECONOMETRIA APLICADA Uso de Variables Dummy Series de Tiempo
REGRESÍON LINEAL SIMPLE
ECONOMETRIA I 3. MODELO LINEAL DE TRES VARIABLES
Welcome a Econometría I
DISEÑO DE EXPERIMENTOS
Los elementos básicos de la oferta y la demanda. Integrantes: Ariana Anchundia David Colcha Dayana Espinoza Tatiana Guevara Luis Loor Harry Portilla.
Propiedades de los estimadores MCO
Estrategias Mixtas En teoría de juegos una estrategia mixta, a veces también llamada estrategia mezclada (del nombre en inglés mixed strategy), es una.
VARIACIONES DE LA DEMANDA en el caso de la demanda simplificamos considerando que la demanda del mercado depende solo del precio del bien. Xd=D(P) Pero.
Modelo de regresión lineal múltiple. Estimación de parámetros. Evaluación de la recta estimada. Diagnóstico del modelo. Detección, evaluación de puntos.
ANALISIS DE VARIANZA
Propiedades de los estimadores MCO
Analisis de Regresion Para dos Variables.
Contraste de Hipotesis
ICPM050 – ECONOMETRÍA tema 03: ESTIMACIÓN MODELO LINEAL SIMPLE
Analisis de Regresion Para dos Variables.
7.2. Demanda Inducida por la Oferta
Contraste de Hipotesis
SERIES DE TIEMPO. Concepto Una serie de tiempo es un conjunto de observaciones de un fenómeno tomadas en tiempos específicos, generalmente a intervalos.
 CALCULO DIFERENCIAL.  Matemáticamente la derivada de una función es una medida de la rapidez con la que cambia el valor de dicha función matemática,
Regresión lineal múltiple bayesiana
Modelo de Regresión Lineal Simple
1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad.
TOPICOS DE ECONOMETRIA APLICADA Sesgo por Variable Omitida
Contraste de Hipotesis
Distribución Normal de una Variable
Analisis de Regresion Para dos Variables (poblacion y muestra)
Qucik and Free Translation of Anderson's slides
Free and Quick Translation of Anderson's slides
Analisis de Regresion Multiple
By Jozzph.
09/05/2019MIX NATALIA LORENA.  Cuando existen movimientos de la curva por el precio, sabemos que la cantidad cambia, por haber cambiado el precio. Pero:
Qucik and Free Translation of Anderson's slides
ANÁLISIS DE REGRESIÓN LINEAL Y CORRELACIÓN SIMPLE ANÁLISIS DE REGRESIÓN LINEAL Y CORRELACIÓN SIMPLE 1 1.
Resumen Posición, velocidad y aceleración son tres maneras diferentes de describir el movimiento aunque están relacionadas. El cambio con el tiempo es.
Transcripción de la presentación:

Variables Artificiales Son variables binarias o variables cero-uno diseñadas para describir informacion cualitativa

La muestra separada de Hombres

La muestra separada de Mujeres

Dos modelos separados: Yi = 1 +  1 Xi + ui (hombre) Salario Y Y = 1 +  X (hombre) ^ ^ ^ ^ Y =  2 +  X (mujer) X Años de enseñanza Dos modelos separados: Yi = 1 +  1 Xi + ui (hombre) Yj =  2 + 2 Xj + uj (mujer)

Supongamos que la relacion entre Y y X no cambia, es decir, las pendientes son las mismas:  1 = 2 . Modelo: Yi = 1 + 2 Di +  Xi + ui Supongamos que la relacion entre Y y X cambia, es decir, las pendientes no son las mismas:  1  2. Modelo: Yi = 1 + 2 Di +  Xi +  D*Xi + ui Yi = salario anual Xi = años de esperiencia enseñando Di = 1 si hombre = 0 en caso contrario (mujer) Variable de control

Dos modelos separados: Yi = 1 +  1 Xi + ui Salario Y Y = 1 +  1X (hombre) ^ ^ ^ ^ Y =  2 + 2X (mujer) X Años de enseñanza Dos modelos separados: Yi = 1 +  1 Xi + ui Yj =  2 + 2 Xj + uj (hombre) (mujer)

D1 + D2 = 1 D1 = 1 - D2

(La Trampa de la Variable Dummy) Si se introducen dos variables dummies en un modelo como Yi = 1 + 2 D1i + 2 D2i +  Xi + uI donde D1i = 1 hombre = 0 lo contrario donde D2i = 1 mujer = 0 lo contrario, entonces este modelo no se puede estimar debido a la existencia de multicolinealidad perfecta entre la constante, D1 y D2. D1 = 1 - D2 o D2 = 1 - D1 o D1 + D2 = 1 ( Multicolinealidad Perfecta)

Para evitar la multicolinealidad perfecta, si una variable cualitativa tiene “m” categorias, introducir solo “m-1” variables dummies. 1 Cuando a una de las categorias de una variable dummy se le asigna el valor de cero se la llama categoria-control (o grupo omitido). 2

Volvamos al ejemplo del principio: Model: Yi = 1 + 2 Di +  Xi + uI Di = 1 hombre = 0 en caso contrario Hombre: ==> Yi = (1 + 2 Di) +  Xi Di = 1 ^ Mujer: ==> Yi = 1 +  Xi Di = 0

Regresiones Separadas por sexo Mujeres Hombres

Regresiones via dummies para el mismo ejemplo D2:H =1 D1:M =1 Yi = (1 + 2 D) +  Xi ^ Yi = (1 + 2 D) +  Xi ^ = (16.656+1.2810) + 1.561X = (19.937-1.2810) + 1.561X

Regresion sin distincion de sexos Yi = 1 +  Xi ^ = 17.095+1.608X

Mujer: Y = (1 + 2 D) + (1 + 2D)X Hombre: Y = 1 + 1 Xi ^ D1: Mujer =1 Interpreta esta regresion donde se permite la pendiente sea diferente para cada sexo Mujer: Y = (1 + 2 D) + (1 + 2D)X Hombre: Y = 1 + 1 Xi ^ = 18.689 + 1.373 X = 16.255 +1.677 X

D2: Hombre=1 =16.255 + 1.677 X Hombre: Y = (1 + 2 D) + (1 +2D)X Mujer: Y = 1 + 1 Xi ^ =18.689 + 1.373 X

Una variable cualitativa con mas de dos categorias (Gasto medico) = 1 + 2 D2 + 3 D3 + Renta + u (Y) (X) D2 = 1 Educacion secundaria = 0 otros D3 = 1 Educacion universitaria

Gasto Medico Educacion Universitaria Y = (1 + 3 D3) +  X ^ D3 = 1 Educacion Secundaria Y = (1 + 2 D2) +  X ^ D2 = 1 Menos que Secundaria Y = 1 +  X ^ 3 ^ 2 ^ 1 ^ renta

========================================= obs Y X D2 D3 D2 = 1 Secundaria = 0 otros D3 = 1 Universitaria = 0 otros ========================================= obs Y X D2 D3 1 6.000000 40.00000 0.000000 1.000000 2 3.900000 31.00000 1.000000 0.000000 3 1.800000 18.00000 0.000000 0.000000 4 1.900000 19.00000 0.000000 0.000000 5 7.200000 47.00000 0.000000 1.000000 6 3.300000 27.00000 1.000000 0.000000 7 3.100000 26.00000 1.000000 0.000000 8 1.700000 17.00000 0.000000 0.000000 9 6.400000 43.00000 0.000000 1.000000 10 7.900000 49.00000 0.000000 1.000000 11 1.500000 15.00000 0.000000 0.000000 12 3.100000 25.00000 1.000000 0.000000 13 3.600000 29.00000 1.000000 0.000000 14 2.000000 20.00000 0.000000 0.000000 15 6.200000 41.00000 0.000000 1.000000

Menos que secundaria: Yi = -1.2859 + 0.1722 Xi ^ Secundaria: Yi = (-1.2859 - 0.068 ) + 0.1722 Xi ^ = -1.3539 + 0.1722 X = -1.2859 + 0.1722 X Yi = (-1.2859 + 0.447 ) + 0.1722 Xi ^ = -0.8389 + 0.1722 Xi Universitaria: = -1.2859 + 0.1722 X

Una variable cualitativa con varias categorias : Ejemplo : Un modelo para el gasto medico segun la edad Yi = 0 + 1 A1 + 2 A2 +  Xi + ui (t-valor) (t-valor) donde A1 = 1 si 55 > edad > 25 = 0 otros A1 + A2  1 A2 = 1 si edad > 55 = 0 otros A2 =1 A1 =1 25 55

(Cont.) Entonces los modelos estimados son: Menos de 25 Y = 0 +  X ^ 25 < edad < 55 Y = (0 + 1A1) +  X ^ ^ ^ ^ edad > 55 Y = (1 + 2A2) +  X ^ ^ ^ ^ Pensad que hipotesis pueden ser interesantes para contrastar y como hacerlo

En un diagrama de puntos Y-X: 0 ^ 1 2 Y X edad < 25 25 < edad < 55 edad > 55 Y = ( 0 + 2) +  X Y = ( 0 + 1) +  X Y = 0 +  X

Dos variables cualitativas (Y) Salario= 1 + 2 D2 + 3 D3 +  X + u o Y = 1 + 2 D2 + 3 D3 +  X + 1 D2*X + 2 D3*X + u’ D2 = 1 hombre = 0 otros sexo D3 = 1 blanca = 0 otras raza (1) Salario medio para profesoras de raza negra: ^ Y = 1 +  X es decir D2 = 0, D3 = 0 ^ ^ (2) Salario medio para profesores de raza negra: Y = (1 + 2 D2) +  X es decir D2 = 1, D3 = 0 ^ ^ ^

(3) Salario medio para profesoras de raza blanca: ^ Y = (1 + 2 D3) +  X esto es D2 = 0, D3 = 1 ^ ^ (4) Salario medio para profesores de raza blanca: Y = (1 + 2 D2 + 3 D3) +  X esto es D2 = 1, D3 = 1 ^

Diferentes tipos de regresion con variables dummies 1. Identica: Y = 1 + 2 X + 3 D + 4 D*X H0 : 3 = 0 y 4 = 0 D = 1 si 1946-1954 = 0 demas (1955-1963) 2. Paralela: Y = 1 + 2 X + 3 D + 4 D*X H0 : 4 = 0 3. Concurrente: Y = 1 + 2 X + 3 D + 4 D*X H0 : 3 = 0 4. Cruzada: Y = 1 + 2 X + 3 D + 4 D*X H0 : 3  0 y 4  0

Periodo (46-54): Yt = A1 + A2 Xt + u1t Periodo (55-63): Yt = B1 + B2 Xt +u2t Y Y B2 1 A2 A2 = B2 B1 1 1 A1 A1 = B1 X X A1  B1, A2 = B2 Identica Paralela

Y Y A2 A2 1 B2 B2 1 1 1 B1 A1 = B1 A1 X X A1 = B1, A2  B2 A1  B1, A2  B2 Concurrente Cruzada

Efectos interactivos entre dos variables cualitativas Ejemplo: Gasto(Y) = 1 +  2 D2 +  3 D3 +  renta(X) + u D2 = 1 mujer = 0 demas sexo D3 = 1 estudiante universitario educacion Efecto Interactivo: Gasto(Y) =  1 +  2 D2 +  3 D3 +  4 D2*D3 +  renta(X) + u  2 = efecto diferenciador de ser mujer  3= efecto diferenciador de ser estudiante universitario  4 = efecto diferenciador de ser mujer estudiante universitaria

Modelo Concurrente (o modelo con variacion en la pendiente) Ejemplo: Como podemos contrastar la hipotesis de que el consumo de gasolina es diferente en un coche nuevo que en un coche usado??? Supongamos que al comienzo no hay ninguna diferencia de consumo entre los dos tipos de coches: ^ ^ Consumo gasolina Usado Y = 0 + X ^ Y = 0 + (0 + 1) X Y Nuevo Y = 0 + 0 X ^ o o o o o o o o o o * * * * * * * * * * * 0 ^ X millas

Sea  = 0 + 1 D donde D = 1 coche usado = 0 otros Entonces Yi = 0 + (0 + 1 D) Xi +ui Variable dummy multiplicativa = 0 + 0 Xi + 1 D*Xi +ui = 0 + 0 Xi + 1 Zi +ui Las relaciones estimadas son: Nuevo : Yi = 0 + 0 Xi ^ ^ ^ == Usado: Yi = 0 + (0 + 1 Di) Xi donde Di = 1 ^ ^ ^ ^ Yi = 0 +  Xi == ^ o

Queremos contrastar si 1 = 0 o no. Se pueden utilizar dos estrategias: ^ ^ ^ (i) Comparar : (a) Y = 0 +  X ^ ^ ^ (b) Y = 0 +  0X (ii) Usar el t-test : Y = 0 +0 Xi + 1 Z ^ H0 : 1 = 0 Si t* > tcP, N-3 H1 : 1 > 0 o (1  0) => rechazar H0

…... …... …... …... …... ^ ^ ^ ^ Y = 0 + 0 Xi + 1 Zi + Calcular el t-valor

Variaciones tanto en la constante como en la pendiente Ejemplo: Estimacion de efectos estacionales : E =  +  T + u E : consumo de electricidad T : temperatura Para capturar los efectos estacionales solo en la constante: E = 0 + 1 D1 +2 D2 + 3 D3 +  T + u D1 = 1 invierno 0 otros donde D2 = 1 primavera 0 otros prim verano oto invier Q1 Q2 Q3 Q4 D3 = 1 verano 0 otros

Considerad ahora tambien un cambio en las pendientes por razones estacionales. Sea  = 0 + 1 D1 + 2 D2 + 3 D3 Entonces, el modelo completamente especificado es E = [0 + 1 D1 + 2 D2 + 3 D3] + 0 T + 1 D1 T + 2 D2 T + 3 D3 T +  Z1 Z2 Z3

Los cuatro submodelos son: Otoño E = 0 + 0 T ^ Invierno E = (0 + 1) + (0 + 1) T Primavera E = (0 + 2) + (0 + 2) T Verano E = (0 + 3) + (0 + 3) T 0 ^ 1 2 4 T E E = 0 + 0 T (Otoño) E = (0 + 1) + (0 +2)T(Invier) E = (0 + 1) + (0 + 2)T (Primaver) E = (0 + 3) + (0 + 3)T (Verano)

Trimestre de control es el primero Los efectos estacionales a veces se modelan como efectos trimestrales D2 = 1 2-- Trimestre = 0 otros D3 = 1 3-- Trimestre = 0 otros D4 = 1 4-- Trimestre = 0 otros Trimestre de control es el primero

1. En E-views dummy = 1 si estamos en el 1-er trimestre = 0 otros

Como son las variables artificiales?

Contraste de Cambio Estructural basado en variables dummies Modelo Basico 1974 1960 1989 YT =  +  XT + uT Se define la variable dummy : D = 1 para el periodo que va de 1974 al 1989 = 0 el resto Pra contrastar si las estructuras de los dos periodos son diferentes, la especificacion debe asumir que  = 0 + 1 D  =  1 + 2 D El modelo de regresion: YT = 0 + 1 D +  1 XT + 2 D XT + uT

Ejemplo: El contraste de Chow en el modelo que relaciona tasa de desempleo y tasa de utilizacion de capacidad Var Depend. Constante CAPt R2 F RSS n _ Muestra : 60 - 89 desemplt 30.0 -0.293 0.761 93.6 17.15 30 (12.1) (9.7) RSSR ^ Muestra : 60 - 73 desemplt 19.64 -0.175 0.59 19.7 4.69 14 (5.9) (4.4) RSS1 ^ Muestra : 74 - 89 desemplt 30.63 -0.296 0.871 102.1 3.29 16 (13.1) (10.1) RSS2 ^ Notae : en parentesis los t-valores

Contraste de cambio estructural via un test F: H0 : No cambio estructural H1 : Si Para el modelo no restringido:: RSSNR = RSS1 + RSS2 = 4.69 + 3.29 = 7.98 F* = (RSSR - RSSNR) / k RSSNR / (T - 2k) = (17.15 - 7.98) / 2 7.98 / (30 - 4) = 14.9 Fc 0.01, k, T -2k = Fc 0.01 = 5.53 = 3.37 0.05 0.05, 2, 26 F* > Fc ==> rechazar H0

^ ^ ^ Tasa de desempleo- tasa de utilizacion de capacidad Muestra : 1960 - 1989 Dt = 1 1974 a 1980 = 0 antes de 1974 desempl = 19.6 + 11.0 Dt - 0.175 CAPt - 0.121 (Dt*CAPt) ^ (6.7) (2.7) (5.0) (2.5) R2 = 0.88 SEE = 0.554 F = 72.2 n = 30 _ El modelo estimado para el periodo 1960-1973: desempl = 19.6 - 0.175 CAP El modelo estimado para el periodo 1974-1980: desempl = (19.6+11.0) - (0.175+0.121)CAP = 30.6 - 0.296 CAP ^ ^

…………………………………..…... …………………………………..…... D = 1 Si t 7 4 = 0 otros Datos Año ut CAPt Dt Dt*CAPt 60 4.20 5.70 0 0 61 0 0 62 0 0 63 0 0 64 0 0 65 0 0 66 0 0 67 0 0 68 0 0 69 0 0 70 0 0 71 0 0 72 0 0 73 0 0 74 1 75 1 76 1 77 1 78 1 …………………………………..…... …………………………………..…... 10.5 10.5 11.2 11.2 …...…

Año ut CAPt Dt Dt.CAPt 79 1 80 1 81 1 82 1 83 1 84 1 85 1 86 1 87 1 88 1 89 1 …………………….… …………………….… …………………….… U = 0 + 1 CAP + 2 Dt*CAPt

La interpretacion de variables dummies en modelos de regresion Semilog (o Log-Lin) (Salario) (años de enseñanza) ln Y = 1 + 2 X + 3 D D1 = 1 hombre = 0 demas ln Y = 2.9298 + 0.0546 X2 + 0.1341 D ^ t=(481.5) (48.3) (27.2) R2 = 0.995 dw = 2.51 Tomando antilogaritmos de 0.1341 = 1.1435 Esto significa que el salario inicial de un profesor-hombre es mas alto que el de una profesora-mujer en un 14.35 porciento. El modelo estimado para el salario de los profesores-hombres es: ln Y = (2.9298 + 0.1341) + 0.0546 X ln Y = 3.0639 + 0.0546 X ^