La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Procedimiento completo de regresión múltiple

Presentaciones similares


Presentación del tema: "Procedimiento completo de regresión múltiple"— Transcripción de la presentación:

1 Procedimiento completo de regresión múltiple
MEP- II

2 Conferencia # 5. Análisis de los residuos de la regresión.
Sumario: Introducción. Los residuos en la regresión. Importancia y necesidad del análisis de los residuos. Herramientas para el análisis de los residuos.

3 Objetivos. Que los estudiantes conozcan qué es un residuo y sus características. Que conozcan los objetivos del análisis de los residuos y su importancia. Que conozcan las diferentes herramientas que incluye el análisis de los residuos y cómo aplicarlas e interpretarlas.

4 Bibliografía Probabilidad y estadística para ingenieros. Sexta edición. Ronald E. Walpole Cap. 12, epíg. 12.9 Materiales en la red. Correlación y Regresión Múltiple

5 Residuos o errores Los residuos o errores en el ajuste de regresión, llevan información que puede ser muy útil para el analista.

6 Residuos estandarizados
El residuo estandarizado es igual al valor de un residuo, ei, divido entre un estimado de su desviación estándar. Los residuos estandarizados mayores que 2 y menores que -2 usualmente son considerados grandes y Minitab etiqueta estas observaciones con una 'R'

7 Consideraciones o supuestos acerca de la correlación y regresión lineal
Las variables independientes y dependientes tienen una relación lineal. La variable dependiente es continua y al menos con escala de intervalo. La diferencia (y - ŷ) debe ser aproximadamente igual para todos los valores de ŷ. Presencia de Homocedasticidad. Los residuos, (y – ŷ), están distribuidos de forma normal con media igual a cero. Las observaciones sucesivas de la variable dependiente no están correlacionadas. No presencia de Autocorrelación

8 Mediante los residuos podremos:
Comprobar los supuestos de la regresión. Evaluar la calidad del ajuste del modelo.

9 El análisis de los residuos se basa fundamentalmente en gráficas

10 Histograma de residuos
Una herramienta exploratoria que muestra las características generales de los datos, incluyendo: - Valores típicos, dispersión y forma - Valores inusuales en los datos

11 Gráfica de probabilidad normal de los residuos
Los puntos de esta gráfica deben generalmente formar una línea recta si los residuos están normalmente distribuidos. Si los puntos en la gráfica se alejan de una línea recta, el supuesto de normalidad puede ser no válido.

12 Residuos versus ajustes
Esta gráfica debe mostrar un patrón aleatorio de residuos a ambos lados de 0. Si un punto se encuentra lejos de la mayoría de los puntos, puede ser un valor atípico . Además, no debería haber ningún patrón reconocible en la gráfica de residuos. una serie de puntos crecientes o decrecientes un predominio de residuos positivos o un predomio de residuos negativos patrones, tales como residuos crecientes, con ajustes crecientes

13 Residuos versus orden Esta es una gráfica de todos los residuos en el orden en el que se colectaron los datos y puede utilizarse para hallar errores no aleatorios, especialmente de efectos relacionados con el tiempo. Una correlación positiva es indicada por un conglomerado de residuos con el mismo signo. Una correlación negativa es indicada por los cambios rápidos en los signos de residuos consecutivos.

14 Prueba de Durbin-Watson
Mide el grado de correlación de un error ei con el anterior ei-1. Estadístico: donde 0  D  4 Si D  2 indica que no hay correlación entre los errores Si D  0 los errores están correlacionados positivamente Si D  4 los errores están correlacionados negativamente

15 Residuos versus otras variables
Graficas de los residuos con respecto a: Cada predictor para buscar curvatura o diferencias en la magnitud de los residuos. Variables importantes no tomadas en cuenta en el modelo, a fin de determinar si éstas ejercen efectos adicionales críticos en la respuesta.

16

17 Comprobación de supuestos
Aleatoriedad.- Dócima de las rachas a los residuos Normalidad.- Dócima K-S a los residuos o gráfico probabilístico normal Igualdad de Varianzas.- - Dócimas de igualdad de varianzas (si hay réplicas) ¿los residuos están formando una banda de límites aproximadamente paralelos? Residuos vs Ŷ Residuos vs Orden

18 Ploteo de residuos para verificar varianza constante
Entre líneas paralelas

19 Aleatoriedad de los residuos
Runs Test: RESI1 Runs test for RESI1 Runs above and below K = The observed number of runs = 8 The expected number of runs = 7 observations above K, 6 below * N is small, so the following approximation may be invalid. P-value = 0.754

20 Stat > Quality Tools > Run Chart

21 Evaluación de la calidad del ajuste
Dispersión respecto a la ecuación (Sŷ) Coeficiente de determinación (R2) Dócima de la Falta de Ajuste Gráficos de Residuos vs Ŷ Residuos vs Xi Residuos vs Orden ¿Buen ajuste? ¿los residuos están dispuestos de forma aproximadamente simétrica respecto a 0? ¿sin un patrón de comportamiento visible?

22

23 Dos Patrones de un mal ajuste
b) Varianza no constante: - transformación c) curvatura: - adicionar términos cuadráticos

24 Análisis de los residuos. Resumen
Ajuste del modelo: Gráficos de residuos vs Ŷ Residuos vs Xi Residuos vs Orden Verificación de supuestos: Aleatoriedad.- Dócima de las rachas a los residuos Residuos vs Orden Normalidad.- Dócima K-S a los residuos Gráfico probabilístico normal Varianzas iguales Residuos vs Ŷ

25 Trabajo independiente
Estudiar el epígrafe del Capítulo 12 señalado en la bibliografía y el documento en la red especificado. Hacer el análisis de los residuos del ejercicio 8 de la página 454.


Descargar ppt "Procedimiento completo de regresión múltiple"

Presentaciones similares


Anuncios Google