Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple
Temas Modelo de Regresión Lineal Estimaciones de Mínimos Cuadrados y Estimación Puntual y Predicción Error Cuadrático Medio y Error Estándar Utilidad del Modelo: R2, R2 Ajustada y la Prueba F Global Prueba de la Significancia de Una Variable Independiente Intervalos de Confianza Para Valores Esperados y de Predicción Temas Avanzados
Modelo de Regresión Lineal Se emplean más de una variable independiente. relaciona y con x1, x2, ..., xk modelo:
Modelo de Regresión Lineal Valor medio de y cuando los valores de las variables independientes son x1, x2, ..., xk : parámetros: β0, β1, β2, ..., βk término de error:
Modelo de Regresión Lineal Suposiciones del modelo de regresión lineal: En cualquier combinación dada de valores de x1, x2, ..., xk , la media de la población de los valores potenciales de = 0 Suposición de la varianza constante Suposición de normalidad Suposición de la independencia
Modelo de Regresión Lineal Interpretación de los parámetros de regresión β0, β1, β2, ..., βk Los parámetros relacionan la media de la variable dependiente con las variables independientes en un sentido global. β0 : ordenada al origen β1 : cambio en el consumo medio de combustible a la semana que se asocia con el incremento de un grado en la temperatura promedio cuando no cambia el índice de enfriamiento. β2 : cambio en el consumo medio de combustible a la semana que se asocia con el incremento de una unidad en el índice de enfriamiento cuando no cambia la temperatura horaria promedio.
Modelo de Regresión Lineal Interpretación geométrica del modelo de regresión región experimental: combinaciones de los valores observados de x1, x2, ..., xk plano de medias
Estimaciones de Mínimos Cuadrados y Estimación Puntual y Predicción Estimación puntual del valor medio y de un valor individual de la variable dependiente y cuando los valores de las variables independientes son x01, x02, ..., x0k . Se predice = 0 Esta ecuación se llama la ecuación de predicción de mínimos cuadrados
Error Cuadrático Medio y Error Estándar Una estimación puntual de σ2 es el error cuadrático medio: Una estimación puntual de σ es el error estándar:
Utilidad del Modelo: R2, R2 Ajustada y la Prueba F Global En el caso del modelo de regresión lineal múltiple, Variación total = Σ(yi-y)2 Variación explicada = Σ(yi-y)2 Variación inexplicada = Σ(yi-yi)2 Variación total = Variación explicada + Variación inexplicada El coeficiente de determinación múltiple es R2 = (variación explicada)/(variación total) El R2 es la proporción de la variación total en los n valores observados de la variable dependiente que explica el modelo de regresión global Coeficiente de correlación múltiple: R = √R2 0<r2<1
Utilidad del Modelo: R2, R2 Ajustada y la Prueba F Global donde R2 es el coeficiente de determinación múltiple n es la cantidad de observaciones y k es la cantidad de variables independientes en el modelo 0<r2<1
Utilidad del Modelo: R2, R2 Ajustada y la Prueba F Global H0: β0 = β1 = β2 =... = βk = 0 Ha: por lo menos uno de los β0, β1, β2, ..., βk ≠ 0 Estadística F global: 0<r2<1
Utilidad del Modelo: R2, R2 Ajustada y la Prueba F Global Se puede rechazar H0 y aceptar Ha en el nivel de significancia α si se mantiene alguna de las condiciones siguientes: Estadística F (modelo) > F[α] valor p < α donde el punto F[α] se basa en k grados de libertad pra el numerador y n-(k+1) para el denominador. 0<r2<1
Prueba de la Significancia de Una Variable Independiente Defina la estadística de una prueba y asuma que las suposiciones de regresión se mantienen.
Prueba de la Significancia de Una Variable Independiente Hipótesis alternativa Condición de punto de rechazo Valor p Ha : βj ≠ 0 2 (área bajo la curva t a la derecha de |t|) Ha : βj > 0 área bajo la curva t a la derecha de t Ha : βj < 0 área bajo la curva t a la izquierda de t
Prueba de la Significancia de Una Variable Independiente Si se cumplen las suposiciones de la regresión, un intervalo de confianza de 100(1-α)% para el parámetro de regresión βj es
Intervalos de Confianza Para Valores Esperados y de Predicción Para calcular el valor de distancia en un modelo de regresión múltiple, se requiere de álgegra de matrices. (Véase el Apéndice B.)
Intervalos de Confianza Para Valores Esperados y de Predicción Si se cumplen las suposiciones de la regresión, un intervalo de confianza de 100(1-α)% para el valor medio de y cuando los valores de las variables independientes son x01, x02, ..., x0k es
Intervalos de Confianza Para Valores Esperados y de Predicción Si se cumplen las suposiciones de la regresión, un intervalo de predicción 100(1-α)% para un valor individual de y cuando los valores de las variables independientes son x01, x02, ..., x0k es
Temas Avanzados Modelo de Regresión Cuadrática Interacción Uso de Variables Ficticias para Modelar Variables Independientes Cualitativas Prueba F Parcial: Prueba de la Significancia de una Parte de un Modelo de Regresión
Modelo de Regresión Cuadrática El modelo de regresión cuadrática que relaciona y con x es
Modelo de Regresión Cuadrática μy|x μy|x μy|x x x x μy|x μy|x μy|x x x x
Interacción Se introduce un término de interacción cuando se cree que una variable (xi) influye en la relación entre otra variable (xj) independiente y la variable dependiente, y.
Uso de Variables Ficticias para Modelar Variables Independientes Cualitativas Cuando se quiere incluir una variabla cualitativa, se pueden utilizar variables ficticias (variables indicadoras, dummies). Toman el valor de 1 o 0. En efecto, esta variable influye en el intercepto.
Uso de Variables Ficticias para Modelar Variables Independientes Cualitativas Ejemplo para comparar tres ubicaciones: