MEP- II
Conf. # 3.-Correlación y Regresión lineal simple El concepto de Ecuación de Regresión Fundamentos probabilísticos de la Ecuación de Regresión Estadística de la Regresión y la Correlación.
Bibliografía Walpole. “Probabilidad y estadística para ingenieros”. Cap. 11, epíg. 11.1 a 11.10 En la red.- “Correlación y regresión lineal simple”
Cierta fábrica va a lanzar un nuevo tipo de helados, y la subdirección comercial, decide hacer unas pruebas para evaluar el efecto del precio en la aceptación que reciban esos helados. Se experimentan cuatro precios de venta: $1,09; $1,19; 1,29 y $1,39, en 36 establecimientos geográficamente bien separados, que hasta ese momento tenían similares niveles de ventas de otros helados.
…continuación Se decidieron aleatoriamente los nueve establecimientos que utilizarían cada uno de los precios. Al final de la semana se registró la cantidad de pintas vendidas del nuevo helado para cada nivel de precio en cada tienda, dando los resultados que se muestran en la siguiente tabla.
¿ Hubo efectos debidos al precio? UNIDADES VENDIDAS 1,09 17 18 15 14 10 12 13 1,19 16 9 11 1,29 8 7 1,39 6 5
Volumen de Ventas contra Precio La dispersión dentro de los grupos es aproximadamente la misma
Efecto del precio sobre las ventas. Venta promedio cuando el precio es 1.29
¿ecuación de regresión? Una ecuación de regresión es una función que relaciona los valores de E(YX=x) con los valores de X.
Caso en que la curva de regresión de y dado x es lineal Para cualquier x dada la media de la distribución de las y está dada por 0 + 1x, esto es: Expresándose un valor específico de Y como: Siendo una variable aleatoria tal que su E() = 0
Elegir b0 y b1 tales que [yi – (b0 + b1xi)]2 sea mínimo ei b0+b1xi Yi
Fórmulas de los coeficientes. (pág. # 7)
Ecuación de Regresión Lineal de Primer Orden
Estadística de la Regresión y Correlación “Fitted Line Plot” Ŷ Pág. # 7
Estimaciones y dócimas en la regresión The regression equation is y = 37.3 - 20.6 x Predictor Coef StDev t P Constant 37.294 4.737 7.87 0.000 x -20.556 3.805 -5.40 0.000
Dócimas de cada coeficiente H0: 0 = 0 vs H1: 0 0 RC: siendo H0: 1 = 0 vs H1: 1 0 RC: siendo
Descomposición de la variabilidad (xi, yi) No explicada por X Variabilidad Total Explicada por X y Ŷ=b0+b1x
Puede demostrarse que:
Análisis de Varianza de la Regresión Analysis of Variance Source DF SS MS F P Regression 1 190.14 190.14 29.19 0.000 Error 34 221.50 6.51 Total 35 411.64 S=2.552 R-Sq=46.2% R-Sq(adj)= 44.6% Ho: B1= 0 Error estándar de estimación
Yj : Valor sobre la recta Descomposición de los residuos de la regresión en error puro y falta de ajuste. Yij error (residuo) de la regresión error puro falta de ajuste YMj : media del grupo j Yj : Valor sobre la recta ^ X j
Dócima del Error Puro o de la falta de ajuste. Ho: E(Y X) = B0 + B1 X Analysis of Variance Source DF SS MS F P Regression 1 190.14 190.14 29.19 0.000 Residual 34 221.50 6.51 Error Puro 32 216.67 6.77 Falta de Aj 2 4.83 2.42 0.36 0.703 Para este cálculo es necesario que exitan réplicas de “Y” para por lo menos uno de los valores de la variable independiente
Cálculo de SCEP Xk YKL Yk Ykl - Yk (Ykl - Yk)2 1.09 17; 18; 15; … 14.55 1.19 16; 16; 13; … 13.11 1.29 14; 11; 10; … 11.22 1.39 8; 9; 6; … 8.33 =
Tabla de Análisis de la Varianza para la Regresión Lineal Simple. (pág Fuente de variación Suma de cuadrados G. L. Cuadrado medio Total n - 1 Regresión 1 Residuos n - 2 Falta de Ajuste q - 2 Error Puro n - q
Análisis de los residuos de la regresión: Comprobación de los requisitos de las dócimas y de las estimaciones mediante intervalos: aleatoriedad normalidad y varianza constante*. Diagnóstico del ajuste del modelo*. Dentro de cada grupo *análisis gráfico
Uso de la Ecuación de Regresión Utilización “no aconsejable” de la ecuación de regresión Debe utilizarse dentro del rango de valores de X que le dio lugar
Trabajo independiente Estudiar los epígrafes orientados en la bibliografía. Resolver completamente el ejercicio # 5 página 364 incluyendo lo señalado en el ejercicio # 6 página 385.
Stat > Regression > Regression