La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1.

Presentaciones similares


Presentación del tema: "F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1."— Transcripción de la presentación:

1 F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre

2 F. VELA / J. F. ISLAS / Sesión 1 I. Descripción del Curso II. Elementos básicos Qué es Stata Cómo obtener ayuda Manejando la base de datos III. Estadísticas Descriptivas y Gráficos Tablas con frecuencias relativas Histogramas 2

3 F. VELA / J. F. ISLAS / Sesión 1 I. Descripción del Curso II. Funciones básicos Qué es Stata Cómo obtener ayuda Manejando la base de datos III. Estadísticas Descriptivas y Gráficos Tablas con frecuencias relativas Histogramas 3

4 F. VELA / J. F. ISLAS / Descripción En este curso se muestran algunas técnicas de regresión que permiten estimar relaciones entre variables, desarrollar pruebas de hipótesis y predecir valores futuros de variables en función del modelo considerado. El curso tiene un carácter aplicado y busca mostrar como utilizar Stata. 4

5 F. VELA / J. F. ISLAS / Objetivos Ofrecer los elementos básicos vinculados a las técnicas econométricas de regresión lineal y algunos modelos no lineales Dotar del manejo básico del Stata para poder llevar a cabo un análisis empírico basado en los conocimientos teóricos adquiridos 5

6 F. VELA / J. F. ISLAS / Sesión 1 I. Descripción del Curso II. Funciones básicos ¿Qué es Stata? Cómo obtener ayuda Manejando la base de datos III. Estadísticas Descriptivas y Gráficos Tablas con frecuencias relativas Histogramas 6

7 F. VELA / J. F. ISLAS / Stata es una herramienta computacional diseñada para realizar análisis estadístico la cual fue creada en 1985 por StataCorp. El denominativo de Stata es una abreviación de las palabrasStatistics" y "data ". Actualmente es utilizado tanto en instituciones académicas como en empresas donde sus usuarios se ubican en las áreas de la economía, sociología, ciencia política, ciencias de la salud y epidemiología. 7

8 F. VELA / J. F. ISLAS / Sus capacidades incluyen : - Manejo y organización de datos - Graficación. - Análisis estadístico. - Simulación. - Programación de tareas. 8

9 F. VELA / J. F. ISLAS / Actualmente, en el mercado se encuentra la versión 13. Su lenguaje computacional es C. Existen versiones para plataformas en Windows, Mac, UNIX y LINUX. 9

10 F. VELA / J. F. ISLAS / Stata ofrece diferentes extensiones en los archivos por él creados: ado archivos de programas automáticamente cargado do archivo de tareas dta base de datos gph gráfica log texto mata codigos de Mata mmat matriz mata smcl texto para Stata 10

11 F. VELA / J. F. ISLAS / Sesión 1 I. Descripción del Curso II. Elementos básicos ¿Qué es Stata? ¿Cómo obtener ayuda? Manejando la base de datos III. Estadísticas Descriptivas y Gráficos Tablas con frecuencias relativas Histogramas 11

12 F. VELA / J. F. ISLAS / Stata tiene varias formas de encontrar ayuda: La forma más sencilla de encontrar ayuda es ejecutar el comando help seguido de la función sobre la cual requerimos información help summarize Además en el Menú principal la opción abre un submenú con diversas alternativas para solicitar ayuda 12

13 F. VELA / J. F. ISLAS / ¿ preguntas? 13

14 F. VELA / J. F. ISLAS / Conceptos básicos 14

15 F. VELA / J. F. ISLAS / Clasificación de las variables Nivel de medición Escala de medición Función en la investigación Discretas Continuas Nominales Ordinales Intervalo Continuas Dependiente(s) Independiente(s) 15

16 F. VELA / J. F. ISLAS / Escalas de medición de las variables Nominales: nombres o clasificaciones que se utilizan para datos en categorías distintas y separadas. Ordinales: son las que clasifican las observaciones en categorías con un orden significativo. Intervalo: medidas numéricas en la cual el valor cero es arbitrario pero la diferencia entre valores es importante. Razón: medidas numéricas en las cuales el valor cero es un valor fijo y la diferencia entre valores es importante. 16

17 F. VELA / J. F. ISLAS / Pantalla inicial de Stata 17

18 F. VELA / J. F. ISLAS / Ejercicio sysuse uslifeexp.dta describe notes edit summar le sum le, d sum sum, d help recode sum le, d 18

19 F. VELA / J. F. ISLAS / Ejercicio recode le (39.1/68.1=0) (68.1/70=1) (70/76.7=2), gen (lev_le) sum lev_le tab lev_le histogram le histogram le, normal scatter le_male le_female graph box le 19

20 F. VELA / J. F. ISLAS / ¿Qué es el análisis de regresión? Es una metodología estadística que es utiliza la relación entre dos o más variables, de manera tal que la variable de respuesta o de resultado, puede ser predecida a partir de otra(s) variable(s). Es una herramienta utilizada en distintas áreas del conocimiento. Sirve también como medio en la contrastación de hipótesis y/o teorías con la realidad a través de modelos estadísticos. 20

21 F. VELA / J. F. ISLAS / Análisis de regresión Relación funcional vs relación estadística. Linealidad vs no linealidad Selección de variables predictoras. Forma funcional. 21

22 F. VELA / J. F. ISLAS / Tipo de datos Corte transversal Un conjunto de datos de una muestra de individuos, hogares, empresas, ciudades, estados o países tomados en un punto del tiempo en particular. Serie de tiempo Observaciones de distintas variables efectuadas en el tiempo. 22

23 F. VELA / J. F. ISLAS / Panel Es la combinación de datos de corte transversal con datos en series de tiempo donde tienen como característica principal que las unidades de observación son siempre los mismos. 23

24 F. VELA / J. F. ISLAS / Tema 2. El modelo de regresión lineal simple (MRSL) 24

25 F. VELA / J. F. ISLAS / Temas Modelo de regresión lineal simple. Estimaciones puntuales de los mínimos cuadrados. Estimaciones puntuales y predicciones puntuales. Suposiciones del modelo y el error estándar. Prueba de significancia individual para la pendiente y la ordenada al origen. Intervalos de confianza y de predicción. Coeficientes de determinación y correlación simples. Una prueba F para el modelo. 25

26 F. VELA / J. F. ISLAS / Modelo de regresión lineal simple Requisitos básicos: i) las variables dependiente (y) e independiente (x) son de intervalo al menos; ii) la relación entre la variable dependiente (y) y la variable independiente (x) es aproximadamente lineal 26

27 F. VELA / J. F. ISLAS / Modelo de regresión lineal simple Diagrama de dispersión observamos: - tendencia positiva - puntos dispersos alrededor de la línea Fuente: Kutner et. al. (2005:19). 27

28 F. VELA / J. F. ISLAS / Modelo de regresión lineal simple Diagrama de dispersión Fuente: Kutner et. al. (2005:19). 28

29 F. VELA / J. F. ISLAS / Modelo de regresión lineal simple Diagrama de dispersión Fuente: Fox (2008: 62). 29

30 F. VELA / J. F. ISLAS / Modelo de regresión lineal simple y = μ y|x + = β 0 + β 1 x + donde μ y|x = β 0 + β 1 x es el valor medio de la variable dependiente y cuando el valor de la variable independiente es x. β 0 = ordenada al origen (valor medio de y cuando x = 0) β 1 = pendiente ( valor medio de y cuando x una unidad) es un término de error: describe los efectos de todos los factores no incluidos en el modelo 30

31 F. VELA / J. F. ISLAS / Modelo de regresión lineal simple Si β 0 = y β 1 = 3.57, entonces cuando lot = 60, el valor medio estimado de horas trabajadas μ y|x = β 0 + β 1 x = (65) = horas trabajadas. 31

32 F. VELA / J. F. ISLAS / Modelo de regresión lineal simple β 0 y β 1 se llaman parámetros de regresión. Ya que no conocemos los valores reales de β 0 y β 1, debemos estimarlos con los datos de la muestra. La interpretación de β 0 en ocasiones no es aplicable. Importante: observamos que estas variables se mueven juntas, mas no podemos deducir claramente una relación causa-efecto. 32

33 F. VELA / J. F. ISLAS / Estimaciones puntuales de los mínimos cuadrados Estimación puntual de los mínimos cuadrados de la pendiente β 1 33

34 F. VELA / J. F. ISLAS / Estimaciones puntuales y predicciones puntuales Estimación puntual del valor medio de la variable dependiente cuando el valor de la variable independiente es x 0 se predice = 0 34

35 F. VELA / J. F. ISLAS / Estimaciones puntuales y predicciones puntuales Se puede demostrar que estas estimaciones puntuales dan un valor de la suma de los errores cuadráticos (SSE) que es menor que la que se obtiene con cualesquiera otros valores de b 0 y b 1. Se les llaman estimaciones puntuales de los mínimos cuadrados. La recta se llama recta de regresión de mínimos cuadrados La ecuación se llama ecuación de predicción de mínimos cuadrados. 35

36 F. VELA / J. F. ISLAS / Suposiciones del modelo y el error estándar Suposiciones 1. A cualquier valor dado de x, la media de la población de los valores potenciales del término error es igual a cero. 2. Suposición de varianza constante. A cualquier valor dado de x, tiene una varianza que no depende del valor de x. 3. Suposición de normalidad. A cualquier valor dado de x, tiene una distribución normal. 4. Suposición de independencia. Cualquier valor del término error es estadísticamente independiente de cualquier otro valor de. 36

37 F. VELA / J. F. ISLAS / Suposiciones del modelo y el error estándar En otras palabras dado un valor de x, la población de valores potenciales del término de error tiene una distribución normal, con valor medio 0 y varianza σ 2 que no depende de x. La población de valores potenciales de y|x tiene distribución normal con valor medio de β 0 + β 1 x y varianza σ 2 que no depende de x. Es más probable que la suposición de independencia se viole cuando se utilizan series de tiempo en un estudio de regresión. 37

38 F. VELA / J. F. ISLAS / Suposiciones del modelo y el error estándar Error cuadrático medio = estimación puntual de σ 2 error estándar = estimación puntual de σ vary|x 38

39 F. VELA / J. F. ISLAS / Prueba de la significancia de la pendiente y la ordenada al origen Hipótesis nula: β 1 = 0 nivel de significancia α (0.10, 0.05, 0.01) los valores p se basan en n-2 grados de libertad Se rechaza la hipótesis nula si se cumple la condición de punto de rechazo de alguna de las hipótesis alternativas, o si p < α 39

40 F. VELA / J. F. ISLAS / Prueba de la significancia de la pendiente y la ordenada al origen Si se cumplen los supuestos de la regresión, entonces la población de todos los valores posibles de b 1 es normalmente distribuida con valor medio β 1 y desviación estándar cuya estimación puntual es 40

41 F. VELA / J. F. ISLAS / Prueba de la significancia de la pendiente y la ordenada al origen y la población de todos los valores posibles de la estadística de prueba t tiene una distribución t con n – 2 grados de libertad. 41

42 F. VELA / J. F. ISLAS / Prueba de la significancia de la pendiente y la ordenada al origen Hipótesis alternativa Condición de punto de rechazo Valor p H a : β (área bajo la curva t a la derecha de |t|) H a : β 1 > 0área bajo la curva t a la derecha de t H a : β 1 < 0área bajo la curva t a la izquierda de t 42

43 F. VELA / J. F. ISLAS / Intervalos de confianza y de predicción Si se cumplen las suposiciones de la regresión, un intervalo de confianza de 100(1-α)% para la pendiente verdadera β 1 es 43

44 F. VELA / J. F. ISLAS / Intervalos de confianza y de predicción Si se cumplen las suposiciones de la regresión, un valor de distancia (v.d.) para un valor particular x 0 de x (para la regresión lineal simple) es 44

45 F. VELA / J. F. ISLAS / Intervalos de confianza y de predicción Si se cumplen las suposiciones de la regresión, un intervalo de confianza de 100(1-α)% para el valor medio de y cuando la variable independiente es x 0 es 45

46 F. VELA / J. F. ISLAS / Intervalos de confianza y de predicción La población de todos los errores posibles de predicción está normalmente distribuida con media cero y desviación estándar σ1 + valor de distancia La estimación puntual es s1 + valor de distancia Se llama error estándar del error de predicción 46

47 F. VELA / J. F. ISLAS / Intervalos de confianza y de predicción Si se cumplen las suposiciones de la regresión, un intervalo de predicción 100(1-α)% para un valor individual de y cuando la variable independiente es x 0 es 47

48 F. VELA / J. F. ISLAS / Intervalos de confianza y de predicción Nótese que el intervalo de predicción es mayor que el intervalo de confianza: mayor incertidumbre acerca del término de error. Entre más alejado del valor medio es x i, mayores son los intervalos de confianza y de predicción. 48

49 F. VELA / J. F. ISLAS / Coeficientes de determinación y correlación simples En el caso del modelo de regresión lineal simple, 1. Variación total = Σ(y i -y) 2 2. Variación explicada = Σ(y i -y) 2 3. Variación inexplicada = Σ(y i -y i ) 2 4. Variación total = Variación explicada + Variación inexplicada 5. El coeficiente de determinación simple es r 2 = (variación explicada)/(variación total) 6. El r 2 es la proporción de la variación total en los n valores observados de la variable dependiente que explica el modelo de regresión lineal simple 49

50 F. VELA / J. F. ISLAS / Coeficientes de determinación y correlación simples Coeficiente de correlación simple (r) entre y y x si b 1 > 0 si b 1 < 0 donde b 1 es la pendiente de la recta de mínimos cuadrados que relaciona y con x. Este coeficiente de correlación mide la fuerza de la relación lineal entre y y x. 50

51 F. VELA / J. F. ISLAS / Coeficientes de determinación y correlación simples También se puede calcular mediante la fórmula 51

52 F. VELA / J. F. ISLAS / Coeficientes de determinación y correlación simples La correlación de la población de todas las combinaciones posibles de valores observados de x e y se denomina ρ. Para probar la hipótesis nula H 0 : ρ = 0, utilizamos la estadística de prueba 52

53 F. VELA / J. F. ISLAS / Prueba F para el modelo Estadística F global Variación inexplicada /1 F(modelo) = (Variación explicada)/(n-2) Podemos rechazar H 0 :β 1 =0 y aceptar H a : β 1 0 en el nivel de significan- cia α si se cumple alguna de: F(modelo)>F [α] Valor p < α En el punto F [α] se basa en 1 grado de libertad para el numerador y n-2 grados de libertad para el denominador. 53


Descargar ppt "F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1."

Presentaciones similares


Anuncios Google