Regresión lineal múltiple

Slides:



Advertisements
Presentaciones similares
ANOVA DE UN FACTOR.
Advertisements

Regresión mínimo cuadrada (II)
MSP César Eduardo Luna Gurrola
Regresión mínimo cuadrada (I)
REGRESION LINEAL SIMPLE
Ejemplo Grafico.
Modelos de Variable Dependiente Binaria -Logit y Probit-
Pronósticos, Series de Tiempo y Regresión
UNIVERSIDAD AUTÓNOMA DEL CARIBE
KRIGING.
Modelado y simulación en Ingeniería Química. Manuel Rodríguez
PROPIEDADES ESTADÍSTICAS DE LOS ESTIMADORES
MODELO DE REGRESIÓN MÚLTIPLE
Regresión Lineal y Regresión Polinomial
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Econometria 2. Modelo de Regresión Lineal Simple
Modelo básico de regresión Lineal (MBRL)
Modelo básico de regresión Lineal
Estadística 2010 Clase 5 Maestría en Finanzas Universidad del CEMA
Regresión y correlación
Nombre: Israel Espinosa Jiménez Matricula: Carrera: TIC Cuatrimestre: 4 Página 1 de 5.
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Tema 1- Regresión lineal simple.
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Regresión Lineal Simple
9 Regresión Lineal Simple
Inferencia Estadística
PROBLEMAS ECONOMETRICOS
CONTRASTE Y VALIDACIÓN DE UN MODELO
BIOMETRIA II TEMA 2 El Modelo de Regresión.
Módulo 5 Análisis de Regresión y Series de Tiempo.
Pronósticos, Series de Tiempo y Regresión
Pronósticos, Series de Tiempo y Regresión
VARIABLE ALEATORIA Y DISTRIBUCION DE PROBABILIDAD
Tema 17: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
Modelo de regresión con dos variables: Estimación
Unidad V: Estimación de
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Departamento de Informática Universidad Técnica Federico Santa María
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
ANALISIS DE REGRESION MULTIPLE
Análisis de regresión MCO MELI.
Capítulo 1. Conceptos básicos de la Estadística
Regresión lineal simple
LA ESTADÍSTICA PROF.: EDMUNDO C.PARDO H. CARACAS,OCTUBRE DE 2014
Estadística Aplicada a las Ciencias Políticas
Tema 7: Introducción a la inferencia estadística
Pruebas de hipótesis.
Definición del Modelo de Regresión Simple Estimaciones por MCO Método de MCO Valores Esperados y Varianzas por MCO.
ANÁLISIS DE REGRESIÓN SIMPLE
Maestría en Transporte Regresamos... (el problema de la regresión lineal) Clase 5.
Estadística II Regresión Lineal.
Análisis de los Datos Cuantitativos
Capitulo 4 Análisis descriptivo inferencial: comparaciones múltiples
Regresión Lineal Simple
Regresión lineal simple Nazira Calleja
REGRESIÓN LINEAL SIMPLE
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
Clase 17 Introducción a la Estadística Universidad de la República Centro Universitario Regional del Este Pablo Inchausti Licenciatura en Gestión Ambiental.
Departamento de Informática Universidad Técnica Federico Santa María EconometríaEconometría Capitulo II.
REGRESIÓN LINEAL SIMPLE
RELACIÓN ENTRE UNA VARIABLE DEPENDIENTE Y UNA O MAS INDEPENDIENTES.
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
1 REGRESIÓN CON VARIABLES DICOTÓMICAS TEMA 1 (CONTINUACIÓN)
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
Bioestadistica II 2014 FACULTAD DE CIENCIAS EXACTAS, FÍSICAS Y NATURALES. UNIVERSIDAD NACIONAL DE CÓRDOBA.
Transcripción de la presentación:

Regresión lineal múltiple Tema 2 Regina Kaiser Depto. Estadística, Universidad Carlos III

Descripción breve del tema Introducción Hipótesis del modelo Linealidad, homogeneidad, homocedasticidad, independencia, normalidad, otras hipótesis Modelo en forma matricial Estimación de los parámetros Propiedades de los estimadores Inferencia y predicción Multicolinealidad y diagnosis Extensiones del modelo Regina Kaiser Depto. Estadística, Universidad Carlos III

Depto. Estadística, Universidad Carlos III Objetivos Formulación del modelo de regresión múltiple Métodos de estimación para dichos modelos Tomar decisiones acerca de los parámetros Aprendizaje de utilización de gráficos para detectar el tipo de relación entre las variables Cuantificación del grado de relación lineal Regina Kaiser Depto. Estadística, Universidad Carlos III

Descripción breve del tema Introducción Hipótesis del modelo Linealidad, homogeneidad, homocedasticidad, independencia, normalidad, otras hipótesis Modelo en forma matricial Estimación de los parámetros Propiedades de los estimadores Inferencia y predicción Multicolinealidad y diagnosis Extensiones del modelo Regina Kaiser Depto. Estadística, Universidad Carlos III

Depto. Estadística, Universidad Carlos III Introducción Estudio conjunto de varias variables (más de dos). Varias variables independientes xi se utilizan para explicar otra dependiente y Utilizamos toda la información disponible Regina Kaiser Depto. Estadística, Universidad Carlos III

El modelo de regresión múltiple n observaciones de la forma (xi1,…, xik,yi) Objetivo: aproximar y a partir de x1,…,xk x1,…,xk : variables independientes o explicativas y: variable dependiente o respuesta (a explicar) Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: semiconductores Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: semiconductores Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: semiconductores Regina Kaiser Depto. Estadística, Universidad Carlos III

Descripción breve del tema Introducción Hipótesis del modelo Linealidad, homogeneidad, homocedasticidad, independencia, normalidad, otras hipótesis Modelo en forma matricial Estimación de los parámetros Propiedades de los estimadores Inferencia y predicción Multicolinealidad y diagnosis Extensiones del modelo Regina Kaiser Depto. Estadística, Universidad Carlos III

Depto. Estadística, Universidad Carlos III Linealidad Los datos se ajustan aproximadamente a la ecuación: Con dos variables explicativas: Los datos están aproximadamente contenidos en un plano. En general, en un hiperplano. Regina Kaiser Depto. Estadística, Universidad Carlos III

Depto. Estadística, Universidad Carlos III Homogeneidad El valor promedio de la perturbación es cero, Regina Kaiser Depto. Estadística, Universidad Carlos III

Homocedasticidad: Var[ui]=s2 Varianza de perturbaciones constante Regina Kaiser Depto. Estadística, Universidad Carlos III

Depto. Estadística, Universidad Carlos III Independencia Perturbaciones ui independientes entre sí. En particular E[uiuj]= 0 para i ¹ j Regina Kaiser Depto. Estadística, Universidad Carlos III

Depto. Estadística, Universidad Carlos III Normalidad Las perturbaciones siguen distribución normal ui~N(0, s2) En consecuencia: Regina Kaiser Depto. Estadística, Universidad Carlos III

Depto. Estadística, Universidad Carlos III Otras hipótesis El número de datos n es mayor que k+1 Ninguna variable explicativa es combinación lineal de las demás (las xi son linealmente independientes) Regina Kaiser Depto. Estadística, Universidad Carlos III

Descripción breve del tema Introducción Hipótesis del modelo Linealidad, homogeneidad, homocedasticidad, independencia, normalidad, otras hipótesis Modelo en forma matricial Estimación de los parámetros Propiedades de los estimadores Inferencia y predicción Multicolinealidad y diagnosis Extensiones del modelo Regina Kaiser Depto. Estadística, Universidad Carlos III

Forma matricial del modelo Habitualmente escribimos el modelo como Y = Xb + U con: Regina Kaiser Depto. Estadística, Universidad Carlos III

Descripción breve del tema Introducción Hipótesis del modelo Linealidad, homogeneidad, homocedasticidad, independencia, normalidad, otras hipótesis Modelo en forma matricial Estimación de los parámetros Propiedades de los estimadores Inferencia y predicción Multicolinealidad y diagnosis Extensiones del modelo Regina Kaiser Depto. Estadística, Universidad Carlos III

Método de Mínimos Cuadrados Valor observado Dato (y) Valor observado Dato (y) Recta de regresión estimada Recta de regresión estimada Regina Kaiser Depto. Estadística, Universidad Carlos III

Depto. Estadística, Universidad Carlos III Mínimos Cuadrados Objetivo: Buscar los valores de b0,b1,…,bk que mejor ajustan nuestros datos. Ecuación: Residuo: Minimizar: Regina Kaiser Depto. Estadística, Universidad Carlos III

Depto. Estadística, Universidad Carlos III Mínimos Cuadrados Resultado en forma matricial: Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: semiconductores Regina Kaiser Depto. Estadística, Universidad Carlos III

Interpretación geométrica Hemos calculado: Tenemos: Definimos la matriz: H es idempotente, simétrica y del mismo rango que X, (k+1). Es una matriz de proyección. Regina Kaiser Depto. Estadística, Universidad Carlos III

Interpretación geométrica H simétrica (obvio) H idempotente Residuos ortogonales a valores ajustados Residuos ortogonales a matriz de diseño X Regina Kaiser Depto. Estadística, Universidad Carlos III

Interpretación geométrica Subespacio vectorial generado por las columnas de X Regina Kaiser Depto. Estadística, Universidad Carlos III

Depto. Estadística, Universidad Carlos III Varianza Para estimar s2 utilizamos la varianza residual Es insesgado como estimador de s2 y además Regina Kaiser Depto. Estadística, Universidad Carlos III

Descripción breve del tema Introducción Hipótesis del modelo Linealidad, homogeneidad, homocedasticidad, independencia, normalidad, otras hipótesis Modelo en forma matricial Estimación de los parámetros Propiedades de los estimadores Inferencia y predicción Multicolinealidad y diagnosis Extensiones del modelo Regina Kaiser Depto. Estadística, Universidad Carlos III

Propiedades de los estimadores Normalidad. Sabemos Y=Xb +U, de donde Y~N(Xb,s2I). Como también es normal. Esperanza. Varianza. Regina Kaiser Depto. Estadística, Universidad Carlos III

Propiedades de los estimadores Tenemos La varianza s2 suele ser desconocida y utilizamos el error estándar estimado Regina Kaiser Depto. Estadística, Universidad Carlos III

Descripción breve del tema Introducción Hipótesis del modelo Linealidad, homogeneidad, homocedasticidad, independencia, normalidad, otras hipótesis Modelo en forma matricial Estimación de los parámetros Propiedades de los estimadores Inferencia y predicción Multicolinealidad y diagnosis Extensiones del modelo Regina Kaiser Depto. Estadística, Universidad Carlos III

Inferencia. Contrastes para b Para averiguar si la variable xi afecta a la respuesta, debemos plantear el contraste Rechazamos la hipótesis nula si: Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: semiconductores Regina Kaiser Depto. Estadística, Universidad Carlos III

Inferencia. Int. de confianza para b Podemos construir un intervalo de confianza para b con nivel de confianza 1-a como Si n > 30 y a = 0.05, sabemos que tn-k-1,a/2 @ 2. Regina Kaiser Depto. Estadística, Universidad Carlos III

Inferencia. Contraste de regresión Igual que en la regresión simple VT=VE+VNE Regina Kaiser Depto. Estadística, Universidad Carlos III

Inferencia. Contraste de regresión Para averiguar si existe relación lineal entre la variable respuesta y las explicativas, realizamos Rechazamos la hipótesis nula si: Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: semiconductores Regina Kaiser Depto. Estadística, Universidad Carlos III

Coeficiente de determinación El coeficiente de determinación se define: El coeficiente de determinación ajustado es más interesante ya que sólo aumenta si disminuye la varianza residual Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: semiconductores Regina Kaiser Depto. Estadística, Universidad Carlos III

Predicción para la media Buscamos estimador puntual e I.C. para el valor medio de la respuesta cuando x=x0 Regina Kaiser Depto. Estadística, Universidad Carlos III

Predicción para la media El intervalo de confianza para la media que obtenemos es: Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: semiconductores ¿Cúal sería el I.C. para para la respuesta media si la longitud del cable es 8 y la altura de la estructura es 275? Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: semiconductores Regina Kaiser Depto. Estadística, Universidad Carlos III

Predicción para una nueva observación Intervalo de predicción Ejemplo: semiconductores (long. 8, altura 175) Regina Kaiser Depto. Estadística, Universidad Carlos III

Descripción breve del tema Introducción Hipótesis del modelo Linealidad, homogeneidad, homocedasticidad, independencia, normalidad, otras hipótesis Modelo en forma matricial Estimación de los parámetros Propiedades de los estimadores Inferencia y predicción Multicolinealidad y diagnosis Extensiones del modelo Regina Kaiser Depto. Estadística, Universidad Carlos III

Depto. Estadística, Universidad Carlos III Multicolinealidad Problema frecuente que se presenta cuando las variables explicativas son muy dependientes entre sí. No es un problema del modelo, sino de los datos, surge cuando det(XtX) próximo a cero. Las variables explicativas son significativas en el modelo simple, pero dejan de serlo en el múltiple. Regina Kaiser Depto. Estadística, Universidad Carlos III

Índice de condicionamiento Los autovalores de XtX son mayores o iguales que cero, para que haya multicolinealidad, alguno tiene que ser aproximadamente cero. Si 10 £ Ind.Cond. £ 30, multiolinealidad moderada Si Ind.Cond. > 30, multicolinealidad alta Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: Sabor del queso Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: sabor del queso Multicolinealidad moderada Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: sabor del queso Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: sabor del queso Regresión simple Láctico Antes 30.73 Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: sabor del queso Regresión simple Acético Antes 3.9 Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: sabor del queso Regresión simple: H2S Antes 1.2 Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: sabor del queso Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: sabor del queso Regresión múltiple: Acético y H2S Acético + H2S 64.5% Acético 50.61% H2S 57.11% Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: sabor del queso Regresión múltiple: Láctico y H2S Láctico + H2S 65.1% Láctico 49.59% H2S 57.11% Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: sabor del queso Regresión múltiple: Láctico y Acético Láctico + Acético 50.7% Acético Láctico 49.59% Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: sabor del queso Regina Kaiser Depto. Estadística, Universidad Carlos III

Ejemplo: sabor del queso Regresión múltiple: Láctico y H2S Láctico + H2S 65.1% Láctico 49.59% H2S 57.11% Regina Kaiser Depto. Estadística, Universidad Carlos III

Depto. Estadística, Universidad Carlos III Diagnosis Más compleja que en la regresión simple. Gráficos de residuos frente a valores previstos para detectar falta de linealidad y heterocedasticidad. Gráficos probabilísticos (pp-plots) para los residuos para detectar falta de normalidad. Análisis de datos influyentes. Regina Kaiser Depto. Estadística, Universidad Carlos III

Descripción breve del tema Introducción Hipótesis del modelo Linealidad, homogeneidad, homocedasticidad, independencia, normalidad, otras hipótesis Modelo en forma matricial Estimación de los parámetros Propiedades de los estimadores Inferencia y predicción Multicolinealidad y diagnosis Extensiones del modelo Regina Kaiser Depto. Estadística, Universidad Carlos III

Variables dicotómicas En un muestra pueden aparecer grupos de observaciones. Ejemplo: En una muestra de alumnos los grupos pueden venir dados por el sexo. Regina Kaiser Depto. Estadística, Universidad Carlos III

Variables dicotómicas Podemos introducir variables ficticias, dicotómicas o dummies del siguiente modo: Regina Kaiser Depto. Estadística, Universidad Carlos III

Variables dicotómicas Regina Kaiser Depto. Estadística, Universidad Carlos III

Variables politómicas En numerosas ocasiones las variables cualitativas toman valores en más de dos características. Si tenemos s categorías, introducimos s-1 variables dicotómicas zt Regina Kaiser Depto. Estadística, Universidad Carlos III