La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

LOS COMPONENTES ALEATORIOS DE LOS COEFICIENTES DE REGRESIÓN

Presentaciones similares


Presentación del tema: "LOS COMPONENTES ALEATORIOS DE LOS COEFICIENTES DE REGRESIÓN"— Transcripción de la presentación:

1 LOS COMPONENTES ALEATORIOS DE LOS COEFICIENTES DE REGRESIÓN
Modelo real Modelo estimado Los coeficientes de regresión son tipos especiales de variable aleatorias. Demostraremos esto usando el modelo de regresión simple en el cual Y depende de X. Las dos ecuaciones muestran el modelo real y la regresión estimada. 1

2 Modelo real Modelo estimado Investigaremos el comportamiento del estimador ordinario de mínimos cuadrados (ordinary least squares, OLS) del coeficiente de la pendiente, mostrado arriba. behavior of the ordinary least squares (OLS) estimator of the slope coefficient, shown above. 2

3 Modelo real Modelo estimado Y tiene dos componentes: un componente no-aleatorio que depende de X y los parámetros, y el componente aleatorio u. Puesto b2 depende de Y, depende indirectamente de u. 3

4 Modelo real Modelo estimado Si los valores de u en la muestra hubieran sido diferentes, habríamos tenido diversos valores de Y y, por lo tanto, un valor distinto para b2. Podemos en teoría descomponer b2 en sus componentes no-aleatorio y aleatorios. 4

5 Modelo real Modelo estimado Comenzaremos con el numerador, substituyendo para Y y su media muestral del modelo real. 5

6 Modelo real Modelo estimado El término b1 es el segundo factor en cancelarse. Reacomodamos los términos restantes. 6

7 Expandimos el producto.
Modelo real Modelo estimado Expandimos el producto. 7

8 Modelo real Modelo estimado Substituyendo esto por el numerador de la expresión para b2, descomponemos b2 en el valor real b2 y un término de error que depende de los valores de X y u. 8

9 Modelo real Modelo estimado El término de error (error term) depende del valor del término de error (the disturbance term) en cada observación de la muestra, y, por lo tanto, es un tipo especial de variable aleatoria. 9

10 Modelo real Modelo estimado El error term es responsable de la variación de b2 al rededor de su componente fijo b2. 10

11 Esta es la expresión hasta ahora.
11

12 El siguiente paso es hacer una pequeña simplificación en el numerador del error term. Primero, se desarrolla como se muestra. 12

13 El valor medio de u es una factor común de la segunda suma, por lo que puede ser extraída.
13

14 El segundo término desaparece debido a que las suma de las desviaciones de X respecto a la media muestral es automaticamente cero. 14

15 Por lo tanto, podemos reescribir la de ecuación como se muestra
Por lo tanto, podemos reescribir la de ecuación como se muestra. Por conveniencia, el denominador ha sido indicado como D. 15

16 Otro pequeño cambio de la expresión para el error term.
16

17 Otro cambio. 17

18 Una más. 18

19 Por lo tanto, hemos demostrado que b2 es igual al valor real más una combinación lineal (weighted linear combination) de los valores del término de error en la muestra, donde los weights están en función de los valores de X en las observaciones en la muestra. 19

20 Como se puede observar, cada valor en la muestra del término de error afecta el valor muestral de b2. 20

21 Antes de avanzar, talvez sea útil aclarar una cuestión matemática
Antes de avanzar, talvez sea útil aclarar una cuestión matemática. En la suma del denominador para la expresión de ai, el subíndice ha sido cambiado por j. ¿Por qué? 21

22 El denominador fue reescrito de una manera más cuidadosa para hacer explícito que la suma de las desviaciones cuadráticas (summation of the squared deviations) de X es para todos los valores de 1 hasta n. of X is for all values from 1 to n. 22

23 No importa en absoluto que letra se utilice para denotar el índice que conduce la suma, con la condición de que no estemos ya usando la letra en alguna parte de la expresión. 23

24 Esto sucede tanto que ya estamos utilizando I en el numerador, así que para evitar la confusión, y mantener a los matemáticos felices, debemos utilizar otra letra para el índice de la adición. 24

25 Investigaremos de dos maneras el efecto del error term sobre b2: 1) en el resto de esta presentación, a través del Experimento Monte Carlo; 2) en la siguiente presentación, utilizaremos un método analítico. 25

26 Elija valores de los parámetros Elija distribución para u X =
Elija el modelo en el cual Y es determinada por X, valores de los parámetro, y u. Y = b1 + b2X + u Elija datos para X Elija valores de los parámetros Elija distribución para u X = 1, 2, ... , 20 b1 = 2.0 b2 = 0.5 u is independent N(0,1) Modelo Y = X + u Generar los valores de Y Generate the values of Y Un experimento Monte Carlo es un ejercicio de “laboratorio” usualmente llevado a cabo con el objetivo de evaluar las propiedades de los estimadores de regresión bajo condiciones controladas. 26

27 Elija valores de los parámetros Elija distribución para u
Elija el modelo en el cual Y es determinada por X, valores de los parámetro, y u. Y = b1 + b2X + u Elija valores de los parámetros Elija distribución para u Elija datos para X X = 1, 2, ... , 20 b1 = 2.0 b2 = 0.5 u is independent N(0,1) Modelo Y = X + u Generar los valores de Y Generate the values of Y Llevaremos a cabo uno para investigar el comportamiento de los coeficientes de regresión OLS cuando son aplicados a un modelo de regresión simple. 27

28 Elija valores de los parámetros Elija datos para X Elija distribución
Elija el modelo en el cual Y es determinada por X, valores de los parámetro, y u. Y = b1 + b2X + u Elija valores de los parámetros Elija datos para X Elija distribución para u X = 1, 2, ... , 20 b1 = 2.0 b2 = 0.5 u is independent N(0,1) Modelo Y = X + u Generar los valores de Y Generate the values of Y Asumiremos que Y está determianda por una variable X y un término de error u, escogeremos valores para X, y elegiremos los valores de los parámetros. 28

29 Elija valores de los parámetros Elija distribución para u
Elija el modelo en el cual Y es determinada por X, valores de los parámetro, y u. Y = b1 + b2X + u Elija valores de los parámetros Elija distribución para u Elija datos para X X = 1, 2, ... , 20 b1 = 2.0 b2 = 0.5 u is independent N(0,1) Modelo Y = X + u Generar los valores de Y Generate the values of Y También generaremos valores aleatorios, de una distribución conocida, para el término de error. 29

30 Elija valores de los parámetros Elija datos para X Choose
Elija el modelo en el cual Y es determinada por X, valores de los parámetro, y u. Y = b1 + b2X + u Elija valores de los parámetros Elija datos para X Choose distribution for u X = 1, 2, ... , 20 b1 = 2.0 b2 = 0.5 u is independent N(0,1) Y = X + u Modelo Generate the values of Y Generar los valores de Y Los valores de Y en la muestra estarán determinados por los valores de X, los parámetros y los valores del término de error. 30

31 Elija valores de los parámetros Elija datos para X Elija distribución
REGRESSION COEFFICIENTS AS RANDOM VARIABLES Elija el modelo en el cual Y es determinada por X, valores de los parámetro, y u. Y = b1 + b2X + u Elija valores de los parámetros Elija datos para X Elija distribución para u X = 1, 2, ... , 20 b1 = 2.0 b2 = 0.5 u is independent N(0,1) Model Y = X + u Generar los valores de Y Generate the values of Y Estimadores Estimar los valores de los parámetros Entonces utilizaremos la técnica de regresión para obtener las estimaciones de los parámetros usando solamente los datos sobre Y y X. 31

32 Generar los valores de Y Generate the values of Y
REGRESSION COEFFICIENTS AS RANDOM VARIABLES Elija el modelo en el cual Y es determinada por X, valores de los parámetro, y u. Y = b1 + b2X + u Elija valores de los parámetros Elija datos para X Elija distribución para u X = 1, 2, ... , 20 b1 = 2.0 b2 = 0.5 u is independent N(0,1) Modelo Y = X + u Generar los valores de Y Generate the values of Y Estimadores Estimate the values of the parameters Podemos repetir el proceso indefinidamente al utilizar los mismos datos para X y los mismos valores de los parámetros, pero con nuevos valores generados al azar para el término de error. 32

33 Elija valores de los parámetros Elija datos para X Elija distribución
REGRESSION COEFFICIENTS AS RANDOM VARIABLES Elija el modelo en el cual Y es determinada por X, valores de los parámetro, y u. Y = b1 + b2X + u Elija valores de los parámetros Elija datos para X Elija distribución para u X = 1, 2, ... , 20 b1 = 2.0 b2 = 0.5 u is independent N(0,1) Modelo Y = X + u Generar los valores de Y Generate the values of Y Estimadores Estimar los valores de los parámetros De esta manera podemos derivar las distribuciones de probabilidad para los estimadores de regresión que permiten que, por ejemplo, averigüemos si están sesgados o no. biased or unbiased. 33

34 Elija valores de los parámetros Elija datos para X Elija distribución
Elija el modelo en el cual Y es determinada por X, valores de los parámetro, y u. Y = b1 + b2X + u Elija valores de los parámetros Elija datos para X Elija distribución para u X = 1, 2, ... , 20 b1 = 2.0 b2 = 0.5 u is independent N(0,1) Modelo Y = X + u Generar los valores de Y Generate the values of Y Estimadores Estimar los valores de los parámetros En este experimento tenemos 20 observaciones en la muestra. X toma los valores de 1, 2, ..., 20. b1 es igual a 2.0 y b2 es igual a 0.5. 34

35 Generar los valores de Y Generar los valores de Y
REGRESSION COEFFICIENTS AS RANDOM VARIABLES Elija el modelo en el cual Y es determinada por X, valores de los parámetro, y u. Y = b1 + b2X + u Elija valores de los parámetros Elija datos para X Elija distribución para u X = 1, 2, ... , 20 b1 = 2.0 b2 = 0.5 u is independent N(0,1) Modelo Y = X + u Generar los valores de Y Generar los valores de Y Estimadores Estimar los valores de los parámetros El término de error es generado aleatoriamente utilizando una distribución normal zero mean and unit variance. Por consiguiente, generamos los valores de Y. 35

36 Generar los valores de Y Generar los valores de Y
Elija el modelo en el cual Y es determinada por X, valores de los parámetro, y u. Y = b1 + b2X + u Elija valores de los parámetros Elija datos para X Elija distribución para u X = 1, 2, ... , 20 b1 = 2.0 b2 = 0.5 u is independent N(0,1) Modelo Y = X + u Generar los valores de Y Generar los valores de Y Estimadores Estimar los valores de los parámetros Estimar los valores de los parámetros Entonces, haremos una regresión de Y sobre X utilizando la técnica OLS de estimación y observaremos qué tan bien correponden nuestros estimadores b1 y b2 con los valores reales de b1 and b2. 36

37 X X u Y X X u Y – – – – Y = X + u Aquí se encuentran los valores de X, eleguidos arbitrariamente. 37

38 X X u Y X X u Y – – – – Y = X + u Dada nuestra elección de números para b1 y b2, podemos derivar el componente no aleatorio de Y. 38

39 El componente no aleatorio se muestra graficamente.
39

40 X X u Y X X u Y – – – – Y = X + u A continuación, generamos aleatoriamente un valor del término de error para cada observación para una distribución N(0,1) (normal with zero mean and unit variance). 40

41 X X u Y X X u Y – – – – Y = X + u De este modo, por ejemplo, el valor de Y en la primera observación es 1.91, no 2.50. 41

42 X X u Y X X u Y – – – – Y = X + u Similarmente, generamos valores de Y para las 19 observaciones restantes. 42

43 Las 20 obervaciones se muestran graficamente.
43

44 Generar los valores de Y Generar los valores de Y
Elija el modelo en el cual Y es determinada por X, valores de los parámetro, y u. Y = b1 + b2X + u Elija valores de los parámetros Elija datos para X Elija distribución para u X = 1, 2, ... , 20 b1 = 2.0 b2 = 0.5 u is independent N(0,1) Modelo Y = X + u Generar los valores de Y Generar los valores de Y Estimadores Estimar los valores de los parámetros Hemos alcanzado este punto en el experiemnto Monte Carlo. 44

45 Generar los valores de Y Generar los valores de Y
Elija el modelo en el cual Y es determinada por X, valores de los parámetro, y u. Y = b1 + b2X + u Elija valores de los parámetros Elija datos para X Elija distribución para u X = 1, 2, ... , 20 b1 = 2.0 b2 = 0.5 u is independent N(0,1) Modelo Y = X + u Generar los valores de Y Generar los valores de Y Estimadores Estimar los valores de los parámetros Estimar los valores de los parámetros Ahora aplicaremos los estimadores OLS para b1 y b2a a los datos de X y Y, y veremos qué tan bien los estimadores corresponde a los valores reales. 45

46 Aquí está nuevamente el diagrama de dispersión.
46

47 Los estimadores de regresión sólo utilizan los valores observados de X y Y.
47

48 Aquí está la ecuación de regresión estimada para lo datos.
48

49 Para comparación, el componente no aleatorio de la relación real también se muestra. b2 (valor real 0.50) ha sido sobrestimada y b1 (valor real 2.00) ha sido subestimada. 49

50 Repetiremos el proceso iniciando con el mismo componente no aleatorio de Y.
50

51 Como antes, los valores de Y son modificados agregando los valores generados de forma aleatoria para el término de error. 51

52 Los nuevos valores del término de disturbio se extraen de la misma distribución N(0,1) igual que las anteriores pero, a menos que exista una coincidencia, serán diferentes. 52

53 Este vez el coeficientede de la pendiente ha sido subestimado y el intercepto sobrestimado.
53

54 Repetiremos el proceso una vez más.
54

55 Un conjunto nuevo de datos ha sido utilizado para generar los valores de Y.
55

56 Como la última vez, el coeficiente de la pendiente ha sido subestimado y el intercepto sobrestimado.
56

57 repeticiones b b2 La tabla resume los resultados de las tres regresiones y agrega aquellos que se obtuvieron mediante la repetición del proceso siete veces. 57

58 10 repeticiones Aquí se presetna un histograma para los estimadores deb2. 58

59 Aquí se presentan los estimadores de b2 obtenidos mediante 40 repeticiones del proceso. 59

60 50 repeticiones El histograma empieza a mostrar una tendencia central.
60

61 100 repeticiones Este es un histograma con 100 repeticiones. Podemos observar que la distribución es simétrica al rededor del valor real, lo que implica que el estimador no está sesgado. unbiased. 61

62 100 replications Sin embargo, la distribución is still rather jagged. Sería mejor repetir el proceso veces, quizás más. 62

63 100 replications La curva rija muestra el la forma de la distribución. Es simétrica alrededor del valor real, lo que indica que el estimador no está sesgado. 63

64 100 repeticiones La distribución es normal proque el término de error fue extraído de una distribución normal. 64

65 Copyright Christopher Dougherty 1999–2006
Copyright Christopher Dougherty 1999– This slideshow may be freely copied for personal use.


Descargar ppt "LOS COMPONENTES ALEATORIOS DE LOS COEFICIENTES DE REGRESIÓN"

Presentaciones similares


Anuncios Google