Continuación DE MCO.

Slides:



Advertisements
Presentaciones similares
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Advertisements

Definición del Modelo de Regresión Simple Estimaciones por MCO Método de MCO Valores Esperados y Varianzas por MCO.
INFERENCIA ESTADÍSTICA
Contraste de Hipotesis
ANÁLISIS ESTADÍSTICO de los RESULTADOS DEL AJUSTE
ESTADÍSTICA DESCRIPTIVA MEDIDAS DE VARIABILIDAD Psic. Gerardo A. Valderrama M.
Free and Quick Translation of Anderson´s slides1 Analisis de Regresión Multiple y =  0 +  1 x 1 +  2 x  k x k + u 2. Inferencia.
ESTADÍSTICA II Ing. Danmelys Perozo MSc. Blog:
PPTCEG049EM32-A16V1 Distribución normal EM-32. Recordemos… -¿Cómo se calcula el valor esperado para una determinada variable aleatoria? -¿Cómo es posible.
Free and Quick Translation of Anderson's slides1 Modelo de Regresión Lineal Simple y =  0 +  1 x + u.
PPTCES047MT22-A16V1 Clase Medidas de dispersión y muestreo MT-22.
Bioestadística Distribuciones muestrales para variables cuantitativas.
PRUEBA DE HIPÓTESIS. 1. Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste involucra la toma de decisión acerca.
REGRESIÓN Y CORRELACIÓN  REGRESIÓN Es un Proceso estadístico que consiste en predecir una variable a partir de otra utilizando datos anteriores. INGA.
1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.
ESTADÍSTICA Mercedes de la Oliva ESTADÍSTICA INFERENCIAL Teorema Central del límite Distribución de media y proporción muestral.
ESCUELA PROFESIONAL CIENCIA POLITICA Y GOBIERNO
ESTADÍSTICAS INFERENCIALES
Instituto Nacional de Estadística y Geografía
Intervalos de Confianza
“Bootstrap” Jaime Mojica Cuevas
El modelo simple de regresión
ESTADÍSTICA II Ing. Danmelys Perozo MSc.
INFERENCIA ESTADÍSTICA PARA DOS POBLACIONES
EL MODELO EN FORMA DE MATRICES
Clase 8: Contraste de Hipótesis
Regresion Multiple Varias variables explicativas
¿Cuándo usar esta distribución?
Convergencia de variables aleatorias
Analisis de Regresion Multiple
Analisis de Regresion Para dos Variables (poblacion y muestra)
Tema 9 Fiabilidad de las puntuaciones
SUPUESTOS DEL MODELO DE MINIMOS CUADRADOS
REGRESÍON LINEAL SIMPLE
Estimación de parámetros: Estimación puntual y por intervalos
UNIDAD CURRICULAR: ESTADÍSTICA II
“Formulación de Hipótesis Estadística”
Principios de Estadística
Propiedades de los estimadores MCO
Kriging Consideremos información de determinada propiedad en el yacimiento y puntos en los cuales se tiene la estimación dea partir de los puntos.
ANÁLISIS DE REGRESIÓN SIMPLE
Tamaño de muestra Ecología Marina. Una población se define como un conjunto de individuos de una especie que habita un área determinada. Los métodos disponibles.
ESTIMACIÓN (Inferencia Estadística) Intervalos de Confianza
Modelo de regresión lineal múltiple. Estimación de parámetros. Evaluación de la recta estimada. Diagnóstico del modelo. Detección, evaluación de puntos.
ANALISIS DE VARIANZA
Excel Estadístico Medidas de Dispersión.
Propiedades de los estimadores MCO
Analisis de Regresion Para dos Variables.
Contraste de Hipotesis
Operador de Suma La Letra Griega ∑ (sigma) se usa para indicar una suma, de manera qué:
ICPM050 – ECONOMETRÍA tema 03: ESTIMACIÓN MODELO LINEAL SIMPLE
Elementos Básicos de Probabilidad y Estadística
Analisis de Regresion Para dos Variables.
ESTADISTICA MEDIDAS DE DISPERSIÓN Cristian Gómez Coordinar Técnico Calidad Laboratorio Labsai.
Free and Quick Translation of Anderson's slides
Analisis de Regresion Multiple
Intervalos de confianza Muestras pequeñas
Contraste de Hipotesis
CONCEPTO DE ESTIMADOR ES UNA REGLA O MÉTODO QUE DICE COMO CALCULAR LA ESTIMACIÓN DE UN PARÁMETRO BASÁNDOSE EN LA INFORMACIÓN DE UNA MUESTRA, GENERALMENTE.
Modelo de Regresión Lineal Simple
Contraste de Hipotesis
Analisis de Regresion Para dos Variables (poblacion y muestra)
Analisis de Regresion Multiple
MEDIDAS DE DISPERSIÓN “Medidas de dispersión”. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
ANALISIS DE REGRESION SIMPLE
TRATAMIENTO Y EVALUACION DE RESULTADOS ANALITICOS 1.Conceptos generales sobre la medida. Tipos de errores, concepto, componentes, corrección. Distribución.
ESTADÍSTICA APLICADA  ZEUS DE JESÚS RODRÍGUEZ BUDA  GABRIELA MÁRQUEZ TORRES  MARÍA ENRIQUETA GIL CÓRDOVA  ELIÁN ANTONIO GONZALEZ GARCÍA  CRISTELL.
REGRESION LINEAL SIMPLE
Distribución Normal. La Normal Estándar El modelo normal estándar es el de una variable aleatoria continua cuya imagen son todos los números reales.
VARIANZA Y Y COVARIANZA DE VARIABLES ALEATORIAS Estadística II MI. MARTHA PAMELA RAMÍREZ VELA ITESM CAMPUS SALTILLO 1.
Transcripción de la presentación:

Continuación DE MCO

Definición Valores ajustados o estimados matrix ygorro= x*b (matrix list ygorro) Residuos (matrix e=y-ygorro) Modelo estimado

En la ecuación que estimamos β1 es igual a 0.23 (PMC). ¿Qué tan confiable es esta estimación? Debido a las fluctuaciones muestrales es probable que una sola estimación difiera del valor verdadero Por lo tanto surge la pregunta de qué tan cerca o lejos estamos del verdadero valor de la población

b1 y b2 son una estimación de β1 y β2 pero también puede interpretársele como un estimador (o regla) que tiene una distribución de probabilidad con media y varianza porque es una variable aleatoria que es el resultado de las estimaciones de muchas muestras. De la distribución de probabilidad la media y la varianza del estimador nos dice que tan cerca o que tan lejano están las estimaciones b1 y b2 de β1 y β2

Sabemos que el método de mínimos cuadrados produce estimaciones de b1 y b2 que en promedio se acercan a los verdaderos parámetros. Sin embargo no sabemos que tan cerca o lejos estamos de los verdaderos parámetros para ello es necesario hacer algunas pruebas de hipótesis. Estas pruebas están basadas en las características de la distribución de los coeficientes estimados suponiendo que éstos son una variable aleatoria. De aquí la importancia de tomar en consideración las características de la distribución de los coeficientes estimados y sus propiedades.

PROPIEDADES DE LOS ESTIMADORES Insesgado Eficiente se busca que el estimador tenga la menor varianza comparada con la de cualquier otro estimador insesgado Menor error al cuadrado Muchas veces es deseable un estimador con poca varianza y un poco de sesgo que un insesgado con alta varianza. Por tanto es deseable un estimador que combine los dos criterios anteriores El criterio es el mínimo error al cuadrado:  (Sesgo)2 + Var   Consistencia El estimador se acerca al verdadero valor a medida que el tamaño de la muestra se incrementa.

b es un estimador insesgado de β poblacional Recordemos que Y = Xβ+e y estimamos b= (X’X)-1X’y Por lo tanto sustituyendo el valor de Y b= (X’X)-1X’(Xβ+e) haciendo la multiplicación (X’X)-1X’Xβ + (X’X)-1X’e = Iβ + (X’X)-1X’e = b= β + (X’X)-1X’e E(b) = E(β) + E((X’X)-1X’e) E(b) = β + (X’X)-1X’ E(e) = β + (X’X)-1X’ 0 = β es decir E(b) = β

La propiedad anterior muestra que la media de la distribución muestral de b está cerca del verdadero valor de β poblacional cuando esto no es así se dice que el estimador está sesgado. La insesgadez es una propiedad deseable pero no a todo costa Por ejemplo, podemos tener dos estimadores alternativos uno insesgado y otro sesgado. Si los valores que toma el estimador sesgado oscila menos alrededor de β que el insesgado, el primero tendría menos varianza que el segundo. Es decir a veces un pequeño sesgo se compensa con una menor varianza

VARIANZA DEL ESTIMADOR b La varianza es una medida de la precisión de las estimaciones. Se puede decir que un estimador es más preciso que otro si la varianza de la muestra es menor que la de otro estimador.

Por definición var (b0) = E[((b 0 - E(b 0))2] cov (b0 , b1) = E[{b 0 - E(b0)}{ (b1 - E(b1)}]

Caso de homoscedastidad y f(y|x) . E(y|x) = b0 + b1x . x1 x2

. . . Caso de heteroscedasticidad f(y|x) y x1 x2 x3 x E(y|x) = b0 + b1x . x1 x2 x3 x

Para calcular las varianzas y covarianzas tenemos que b= β + (X’X)-1X’e b - β = (X’X)-1X’e transponiendo de acuerdo con las propiedades de las matrices (b - β)’ = e’X(X’X)-1 var (b) = E{(b - β)(b - β)’} var (b) = E{(X’X)-1X’ee’X(X’X)-1} var (b) = (X’X)-1X’E(ee’) X(X’X)-1 como E(ee’) = σ2I entonces (se demuestra más adelante) var (b) = (X’X)-1X’ σ2I X(X’X)-1 = σ2I(X’X)-1X’ X(X’X)-1 = σ2I(X’X)-1I= σ2 (X’X)-1

σ 2 (X’X) -1 = ú û ù ê ë é var ) , b0 cov( b1 Por tanto b N ( b b1) b1 Recordemos que 1 2 . 210206 2792 40 - ú û ù ê ë é = å s t xi N 0000653 0045 35 En este caso σ2 es constante pero desconocida ¿cómo se calcula?

Distribución de los residuos Esperanza de los residuos es cero Y= Xβ +e Residuos de la estimación de una muestra e= Y-X b e= Y-X(X`X)-1X`Y sacando Y como factor común e = Y(1-X(X`X)-1X`)

(1-X(X`X)-1X`)= M Matriz proyección Simétrica M`=M y M`M = M La traza de M es la suma de los elementos de la diagonal principal La traza cumple con la propiedad de que E(tr(A))= tr(E(A)) Se va a demostrar que La traza de M = n-k

e = Y(1-X(X`X)-1X`)= MY e= M(X β +e) = M X β +Me M X β= (1-X(X`X)-1X`) X β= X β – X β= 0 e= Me Ahora de va a demostrar que un estimador de σ2 es la sumatoria de los errores al cuadrado Como var (e) = E[((e – E(e))2] E(e)= 0

Como e= Me la varianza de los errores sería e`e = e`M`M e Como M es simétrica e idempotente resulta que: = e`M e es un escalar E(e`e) = E(e`M e) Debido a las propiedades de M

E(tr(E(e`M e))= E(tr(Me`e)) como M es fijo Tr(M(Ee`e)) = tr(M σ2 I)= σ2 tr(M) La traza de M es tr(1-X(X`X)-1X`) = tr(1) – tr((X(X`X)-1X`) Tr(In) – tr(Ik) = n –K Por tanto E(e`e) = n-k σ2

Despejando para una muestra s2 = e`e /n-k Es un estimador insesgado de la varianza de los términos de error

En Stata para ver la matriz de varianzas escribir matrix list e(V) Calcular la matriz de varianzas y covarianzas en el modelo del consumo (tarea en la inversión) matrix etrans = e' matrix var = (e'*e)/38 matrix list var matrix varco= xtransxinver*46.852962 matrix list varco En Stata para ver la matriz de varianzas escribir matrix list e(V)

¿QUÉ SIGNIFICADO TIENEN LAS VARIANZAS Y LAS COVARIANZAS? En primer lugar entre mayor el valor de σ 2 mayor será el valor de las varianzas. Por la forma en que se calcula σ2 veremos que un valor grande de σ 2 implica grandes u y por tanto puntos alejados de la línea de regresión que estamos tratando de estimar y por tanto los estimadores son menos precisos. Es decir grandes varianza indican menor precisión en la estimación. Si la covarianza es negativa significa que si b1 esta sobrestimado b2 estará subestimado. Hacer la regresión en STATA