Maestría en Transporte Estadística

Slides:

Advertisements

Presentaciones similares

ANOVA DE UN FACTOR.

Advertisements

Regresión mínimo cuadrada (II)

Tema 6: Regresión lineal.

Tema.9.Predicción y estimación. Concepto. Cálculo de la ecuación de regresión lineal. Modelo general lineal. Evaluación del modelo. Diagnóstico del modelo.

Regresión mínimo cuadrada (I)

REGRESION LINEAL SIMPLE

ESTADISTICA INFERENCIAL

Modelos de Variable Dependiente Binaria -Logit y Probit-

KRIGING CON TENDENCIA.

Pronósticos, Series de Tiempo y Regresión

Bivariadas y Multivariadas

MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I HETEROSCEDASTICIDAD

GEOESTADISTICA MULTIVARIADA

INFERENCIA ESTADISTICA

Pruebas de Especificación en el Modelo de Regresión Múltiple

PROPIEDADES ESTADÍSTICAS DE LOS ESTIMADORES

FACULTAD DE ECONOMÍA UNAM Maestría en Economía

MODELO DE REGRESIÓN MÚLTIPLE

MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I MULTICOLINEALIDAD

ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL

Econometria 2. Modelo de Regresión Lineal Simple

Modelo básico de regresión Lineal

Capitulo 10: La metodología Box-Jenkins

Regresión y correlación

Estadística Descriptiva: 4. Correlación y Regresión Lineal

Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Regresión Lineal Simple

9 Regresión Lineal Simple

División de Estudios Políticos, CIDE

Tema 2: Métodos de ajuste

Estadística 2010 Maestría en Finanzas Universidad del CEMA Profesor: Alberto Landro Asistente: Julián R. Siri.

Técnicas estadísticas paramétricas univariantes: regresión

Inferencia Estadística

PROBLEMAS ECONOMETRICOS

CHI-CUADRADO Y DISTRIBUCION NORMAL

Curso Práctico de Bioestadística Con Herramientas De Excel Fabrizio Marcillo Morla MBA (593-9)

CONTRASTE Y VALIDACIÓN DE UN MODELO

TIPOS DE MODELOS DE REGRESIÓN Y SUPUESTOS PARA EL MODELO A

Pronósticos, Series de Tiempo y Regresión

Pronósticos, Series de Tiempo y Regresión

INTERVALO DE CONFIANZA

Unidad V: Estimación de

Métodos de calibración: regresión y correlación

Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.

Departamento de Informática Universidad Técnica Federico Santa María

Titular: Agustín Salvia

Normalidad, Variabilidad y estimación del Modelo de Regresión

Introducción a la Inferencia Estadística

Estadística Intermedia

Estimador de Efectos Fijos

Unidad V: Estimación de

Análisis de correspondencia canónica (CCA)

Regresión lineal simple

Regresión lineal múltiple

PRUEBAS ESTADISTICAS NO PARAMETRICAS

SEMINARIO DE INVESTIGACION Titular: Agustín Salvia

ANÁLISIS DE REGRESIÓN SIMPLE

Maestría en Transporte Regresamos... (el problema de la regresión lineal) Clase 5.

Estadística II Regresión Lineal.

Regresión Lineal Simple

MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I MODELO DE REGRESIÓN GENERAL 1 Profesor: Barland A. Huamán Bravo 2011 UNIVERSIDAD NACIONAL AGRARIA DE LA.

Modelos de regresión lineal

Departamento de Informática Universidad Técnica Federico Santa María EconometríaEconometría Capitulo II.

REGRESIÓN LINEAL SIMPLE

REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.

REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.

1 REGRESIÓN CON VARIABLES DICOTÓMICAS TEMA 1 (CONTINUACIÓN)

Free and Quick translation of Prof. Anderson's slides1 Analisis de Regresion Multiple y =  0 +  1 x 1 +  2 x  k x k + u 1. Estimacion.

ANALISIS DE VARIANZA.

Transcripción de la presentación:

Maestría en Transporte Estadística

Concepto Se busca establecer una relación que indique que la media de una población dada depende de una variable X (o varias...), y que la relación es lineal...

Suposiciones Variable Y (dependiente) continua. Relación lineal en los parámetros. Observaciones independientes y muestreadas aleatoriamente. Existencia de incertidumbre en la relación Y -> X (existencia de errores). Errores de esperanza nula y varianza constante. Errores no correlacionados. Errores no correlacionados con X. Errores aproximadamente normales.

Suposiciones II

Violaciones a los supuestos Fallas a la Normalidad Existencia de correlación en las regresoras Heterocedasticidad Existencia de correlación Errores en la especificación de modelos.

Mas sobre Regresiones Bondad de Ajuste, un poco mas allá... ¿Que son “outliers”? ¿Como detectarlos? ¿Como actuar? Fallas a la homocedasticidad Fallas a la falta de correlación serial Fallas a la falta de normalidad

Un poco mas de bondad (de ajuste)...

Prueba F Se trata probar acerca de la bondad de modelos competidores Primero se estima el modelo completo El mejor modelo que se disponga Todas las regresoras Luego se estima un modelo restringido es un modelo al que se han quitado variables Puede ser un modelo en el que, incluso se han quitado TODAS las regresoras y se deja sólo el término constante...

Prueba F (II) La lógica de la prueba es comparar la variablidad de los errores en el modelo completo vs la variabilidad en el modelo reducido. Se comparan las sumas de cuadrados de los errores de ambos modelos SSEfull y SSEred

Prueba F EL estadístico calculado tiene distribución F con Donde dfr-dff grados de libertad en el numerador dff grados de libertad en el denominador Donde dfr = n-pr dff = n-pf n es el número de observaciones pf es número de parámetros en el modelo completo (full) pr es el número de parámetros en el modelo restringido

Prueba F ¿y si se excluyen todas los parámetros beta? SSEr=2(n-1) dfr=n-1 La prueba F sólo es válida para modelos “anidados”, esto es donde en uno de ellos se excluye una o mas regresoras respecto al otro.

Criterios de Información Para comparar entre modelos en general (con distintas regresoras) se usan los Criterios de información. Conceptualmente los CI (o IC en inglés): dan cuenta de la variabilidad de los errores, cuanto menos variabilidad mejor, dan cuenta de la cantidad de variables regresoras incluidas, cuanto menos mejor (criterio de parsimonia). De manera que penalízan cuando se incluyen mas regresoras...

Criterios de Información Los criterios se comparan seleccionando el modelo que resulte en un valor menor (menor variabilidad de los errores) k número de parámetros estimados n número de observaciones l log de la verosimilitud

Criterios de Información Ejemplo: definición alternativa de AIC (bajo normalidad) Ejercicio: mostrar que las expresiones son iguales

¿Quién no quiere ser singular ¿Quién no quiere ser singular? ¿quién no quiere ser tratado especialmente? ¿quién no quiere que su participación tenga real influencia? Todos somos... Outliers

Outliers Conocidas como Observaciones Aberrantes Son observaciones atípicas de mucha influencia en la pendiente de la recta.

Outliers Influencia a causa de alejamiento en el eje de las y A causa de alejamiento en el eje (los ejes) de las x A causa de alejamiento en ambos sentidos La influencia en los parámetros es el cuadrado de la distancia.

Outliers Matriz “Hat” sombrero (notación maticial) Parámetros estimados Valores Ajustados (proyección) H es la matriz “hat”

Outliers Entonces, los valores ajustados son combinación lineal de la muestra (los observados) Además donde e son residuos e I es la matriz identidad (ejercicio, mostrar esto)

Outliers donde hii es el i-ésimo elemento de la matriz diagonal de H. Se puede demostrar que

Outliers Cuando mas grande es hii, mas pequeño es Var(ei), mas influencia tiene en determinar la recta. Valores de alto hii tienen menores residuos. El “leverage” hii es grande cuando supera el doble del promedio de todos los leverage. Ejercicio ¿cuál es este promedio?

Outliers Distancia de Cook Cuantifica el impacto de remover una observación de la estimación sobre los parámetros.

Outliers La distancia depende del residuo en “i” y del leverage en “i”. Si cualquiera es elevado Di será grande respecto al resto de las observaciones.

Outliers Acciones Revisar el modelo Revisar las observaciones (¿variables indicadoras? ¿otras variables regresoras?) Revisar las observaciones ¿no corresponde a errores o diferente metodología de recolección? Revisar los instrumentos de medida Revisar manipulación previa de los datos

Outliers Acciones (II) Es recomendable identificar y explicar las observaciones aberrantes. Quitarlas puede llevar a críticas por “tratar de ajustar los datos al modelo y no a la inversa” Si se comprueba un error justificable, quitarlas.

Heterocedasticidad Los mínimos cuadrados son un poco pesados...

OLS Ordinary Least Squares o MCO Notación matricial: minúsculas indican vectores, mayúsculas indican matrices (incluso en letras griegas). Los escalares se denotan igual que vectores

OLS Adicionalmente, normalidad de los errores

OLS Ecuaciones normales (p ecuaciones para p incognitas) (hemos cambiado la notación para los estimadores de B a “Beta Sombrero”

OLS Si (X’X) no es singular... Y asumiendo normalidad de los errores se puede obtener la distribución de los beta^ que resultan se normales. Se aplican pruebas t, etc...

Generalized Least Squares GLS También conocidos como estimadores de Aitken.

Generalized Least Squares GLS También conocidos como estimadores de Aitken.

GLS siempre que V sea simétrica y definida positiva |V|>0.

GLS Si se usa una matriz triangular tal P’P=V-1 (la matriz V-1 ha sido descompuesta. Se denomina descomposición de Choleki). Resulta que...

GLS Supóngase la siguiente transformación Ejercicio, hallar la distribución de eta  Ejercicio, hallar la expresión de beta^ en función de las variables originales

GLS Inconveniente, necesitamos conocer V!! Las aplicaciones de GLS son diversas entre ellas los WLS Weighted Least Squares o Mínimos Cuadrados Pesados, una de las posibles soluciones para la heterocedasticidad, cuando existen réplicas o cuasi réplicas...

Mínimos Cuadrados Pesados Se pueden construir mejores estimadores si se acepta que existe heterocedasticidad. Si se sabe que cada observación tiene una varianza distinta... Nótese que aún existe no correlación entre errores de observaciones distintas

Mínimos Cuadrados Pesados Para algún valor arbitrario de 2 se puede escribir... Voila!! Todo está solucionado (si conociéramos las varianzas de cada observación!!!) Entonces (a) puede hacerse una suposición “de fé” sobre la variación de la varianza, algo similar a decir “los errores son normales” es una suposición previa. (b) si existen réplicas se pueden calcular las varianzas para cada observación i

Mínimos Cuadrados Pesados Existe tres réplicas X1, tres réplicas X2 y cuatro réplicas X3

Mínimos Cuadrados Pesados

Mínimos Cuadrados Pesados En una regresión simple, todo resulta en que regresión OLS con dos variables y sin ordenada al origen A los efectos del cálculo

Mínimos Cuadrados Pesados Las ecuaciones normales implican que se debe aplicar pesos 1/2. Ejercicio mostrar las validez de las siguientes expresiones

Mínimos Cuadrados Pesados Dado que las varianzas son estimadas algunos autores (Ej:Kmenta) proponen calcular iterativamente. Se calcula una regresión OLS y se estiman los residuos de las réplicas. Se determinan las varianzas de. Se calcula una regresión WLS y se estiman los residuos de las réplicas. Se determinan las varianzas de los errores de las réplicas. Se itera hasta obtener convergencia de varianzas (igualdad de varianzas entre réplicas!!)

Mínimos Cuadrados Pesados Similares cuestiones surgen cuando la variable respuesta es un promedio de varias observaciones yi es promedio de ni observaciones y como tal su varianza es Ejercicio, hallar la expresión de V

Mínimos Cuadrados Pesados Es necesario tener consideraciones especiales a la hora de realizar predicciones respecto a bandas de predicción y bandas de predicción individual.

Mínimos Cuadrados Pesados

Autocorrelación (ya no se me ocurre nada que decir...)

Autocorrelación Se aplica cuando las observaciones son obtenidas a través del tiempo. Observación de los residuos agrupamiento de amplitud Durbin Watson, modelo Ejercicio, verificar que

Autocorrelación Ejercicio ¿Que efectos tiene sobre los estimadores de una regresión lineal simple, el hecho que  no sea nulo? Verificar si los estimadores son insesgados Verificar el efecto en la varianza de los estimadores OLS. ¿Porqué no ? Estudio de Series de Tiempo Box y Jenkins Aproximación AR(1) es buena en muchos casos!!

Autocorrelación  es positivo! Residuo Región crítica si d<dl se rechaza H0 si d>du no se rechaza H0 si du<d<dl no es concluyente

Autocorrelación

Autocorrelación De igual forma se puede tratar para <0, pero se calcula 4-d con igual región crítica. El estadístico d está limitado por 0 y por 4, si es cercano a 2 no se rechaza la hipótesis.

Autocorrelación Existen transformaciones para usar OLS. El estudio de series de tiempo es mas general Si rho fuese conocido puede aplicarse GLS. Una posibilidad es estimar rho sobre residuos de una primera estimación OLS.

Autocorrelación La estimación vía Máxima Verosimilitud Autocorrelación con datos trimestrales Autocorrelación con datos mensuales