La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Procedimiento completo de regresión múltiple

Presentaciones similares


Presentación del tema: "Procedimiento completo de regresión múltiple"— Transcripción de la presentación:

1 Procedimiento completo de regresión múltiple
MEP- II

2 Conferencia # 4. Regresión lineal múltiple.
Sumario: Introducción. El modelo de regresión lineal múltiple La ecuación de regresión lineal múltiple estimada. Inferencias de la regresión. Dócima de la regresión Múltiple. Dócima de la Falta de Ajuste. Variables cualitativas en la regresión.

3 Objetivos. Que los estudiantes conozcan las situaciones en las que es útil un análisis de regresión múltiple. Que conozcan como estimar la ecuación de regresión. Que sepan realizar e interpretar las dócimas de la Falta de ajuste y la regresión múltiple. Que conozcan las facilidades de Minitab para realizar un análisis de regresión múltiple y la interpretación de sus resultados.

4 Bibliografía. Ronald E. Walpole. Probabilidad y estadística para ingenieros. Sexta edición. Cap. 12; epíg. 12.1, 12.2, 12.5 y 12.6 Materiales en la red. Correlación y Regresión Múltiple Variables “dummy”

5 Regresión lineal múltiple.
Modelo de regresión que permite estimar el valor esperado de una variable Y (dependiente o respuesta) a partir del conocimiento de varias variables independientes Xj (regresoras o predictoras). E (Y/X1, X2, …Xk) = B0 + B1X1 + B2X2 + …. + BkXk donde: B1, B2, …Bk, son los coeficientes de regresión. Un valor particular de Y:

6 Estimación de los coeficientes de regresión
Muestra: (x1i , x2i , … , xki , yi ) i = 1, 2, … , n Modelo estimado:

7 Predicción del tiempo promedio para producir una pieza
Procedimiento completo de regresión múltiple Predicción del tiempo promedio para producir una pieza Y: tiempo empleado en la producción de una pieza X1: número de operaciones de maquinado a ejecutar X2: dureza del material a utilizar X3: área total de maquinado

8 DATOS Pieza Tiempo Operaciones Dureza Área 1 109,2 11 55 9 2 102,7 3
71 17 95,9 7 52 6 4 87,6 31 8 5 72,5 22 93,1 54 18 115,9 21 47 83,9 40 23 109,4 10 68 74,3 29 15 78,5 26 12 113,3 66 13 104,3 56

9 Matriz de correlaciones en minitab

10 Matriz de correlaciones en minitab (continuación)

11 Matriz de correlaciones
Procedimiento completo de regresión múltiple Matriz de correlaciones Correlations (Pearson) Tiempo Cant Ope Dureza Cant Ope Dureza Area multicolinealidad

12 Acerca de la multicolinealidad
Puede distorsionar el error estándar de estimación: conclusiones incorrectas sobre significación de variables independientes. Remedio usual: eliminar una de las v.i. que están fuertemente correlacionadas. Por lo general, correlaciones entre las v. i. entre y 0.70 no ocasionan dificultades.

13 Graph> Matrix Plot…

14 Diagramas de dispersión: Matrix Plot

15 Ajustando la ecuación y = 0 + 1 x 1 + 2 x 2 + 3 x 3 + 
Procedimiento completo de regresión múltiple Ajustando la ecuación y = 0 + 1 x 1 + 2 x 2 + 3 x 3 +  The regression equation is Tiempo = Cant Operac Dureza Area Predictor Coef StDev T P Constant Cant Ope Dureza Area S = 2.321* R-Sq = 98.2% R-Sq(adj) = 97.6%* Los valores calculados son de particular importancia en la regresión múltiple porque constituyen la forma principal de detectar la multicolinealidad. Si el analista no está seguro de incluir dos variables en la misma regre­sión debido a su alta interrelación, se corre la regresión y se verifican los valores t. Si son suficientemente gran­des, la correlación entre las dos variables predictoras no es un problema. *CALIDAD DEL AJUSTE

16 Análisis de varianza de la regresión múltiple
Source DF SS MS F P Regression Error Total Source DF Seq SS Cant Ope Dureza Area Ho: B1 = B2 = B3 = 0 H1: Al menos uno es  0 RC: F>F; 3; 9 No replicates. Cannot do pure error test.

17 Eliminando una variable que no hace un aporte significativo
Tiempo = Cant Operac Dureza Predictor Coef StDev T P Constant Cant Ope Dureza S =2.420* R-Sq =97.8% R-Sq(adj)=97.4%*

18 Tiempo = 52.6 + 1.47 Cant Operac + 0.662 Dureza
Analysis of Variance Source DF SS MS F P Regression Error Total Source DF Seq SS Cant Ope Dureza

19 Variables cualitativas en regresión
Meramente indica cuando un “sujeto” pertenece o no a una particular categoría o posee o no una particular cualidad. Su introducción no cambia el procedimiento de realización de la regresión. Su efecto práctico es el cambio del coeficiente b0.

20 Regresión con variables cualitativas (variables dummy)
Turno trabajo Variable cualitativa Variable dummy T1 T2 Primer turno 1 Segundo turno 2 Tercer turno 3 En este caso, el 3er turno ha sido seleccionada como categoría de referencia y no se incluye directamente en la ecuación de regresión. El coeficiente b3 es la diferencia en el valor predicho de Tiempo para el primer turno, respecto al que se obtendría en el tercer turno.

21 DATOS con la variable cualitativa turno
Pieza Tiempo Operaciones Dureza Área Turno T1 T2 1 109,2 11 55 9 2 102,7 3 71 17 95,9 7 52 6 4 87,6 31 8 5 72,5 22 93,1 54 18 115,9 21 47 83,9 40 23 109,4 10 68 74,3 29 15 78,5 26 12 113,3 66 13 104,3 56

22

23 PROCEDIMIENTOS Y HERRAMIENTAS PARA EJECUTARLOS
Selección preliminar de variables independientes Matriz de correlaciones Matriz de diagramas de dispersión Si es necesario, creación de nuevas variables mediante transformaciones. Ajuste mediante mínimos cuadrados Dócima de la ecuación y de los coeficientes de cada variable independiente.

24 Consideraciones o supuestos acerca de la correlación y regresión lineal
Las variables independientes y dependientes tienen una relación lineal. La variable dependiente es continua y al menos con escala de intervalo. La diferencia (y - ŷ) debe ser aproximadamente igual para todos los valores de ŷ. Presencia de Homocedasticidad. Los residuos, (y – ŷ), están distribuidos de forma normal con media igual a cero. Las observaciones sucesivas de la variable dependiente no están correlacionadas. No presencia de Autocorrelación

25 Trabajo independiente
Estudiar los epígrafes señalados en la bibliografía. Analizar y dar respuesta a los incisos del ejercicio # 8 página 458.

26 R2 ajustado A diferencia de R2, el R2 ajustado no varía apreciablemente cuando una variable que no aporta se adiciona al modelo

27 Interpretación de la multicolinealidad
V(y) explicada por X1 V(y) explicada tanto por X1 como por X2 (multicolinealidad) V(y) explicada por X2 V(y)


Descargar ppt "Procedimiento completo de regresión múltiple"

Presentaciones similares


Anuncios Google