La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

REGRESIÓN Y CORRELACIÓN  REGRESIÓN Es un Proceso estadístico que consiste en predecir una variable a partir de otra utilizando datos anteriores. INGA.

Presentaciones similares


Presentación del tema: "REGRESIÓN Y CORRELACIÓN  REGRESIÓN Es un Proceso estadístico que consiste en predecir una variable a partir de otra utilizando datos anteriores. INGA."— Transcripción de la presentación:

1 REGRESIÓN Y CORRELACIÓN  REGRESIÓN Es un Proceso estadístico que consiste en predecir una variable a partir de otra utilizando datos anteriores. INGA. ASTRID MÉRIDA

2 DIAGRAMA DE DISPERSIÓN Es una gráfica en la que se traza cada uno de los puntos que representan un par de valores observados para las variables independiente y dependiente. INGA. ASTRID MÉRIDA

3 DIAGRAMAS DE DISPERSIÓN INGA. ASTRID MÉRIDA

4 REGRESIÓN LINEAL Se refiere a la relación entre dos variables para la predicción de una en base a la otra. Sostiene que a medida que x cambia, y cambia en una cantidad constante. INGA. ASTRID MÉRIDA

5 El método que comúnmente se utiliza para realizar este ajuste es el llamado método de mínimos cuadrados. Se llama así porque reduce al mínimo el cuadrado de las distancias verticales entre cada uno de los puntos y la recta ajustada. Cuando de manera manual se ajusta la recta al diagrama de dispersión, normalmente se intenta ubicarla lo mas centrada posible en la nube de puntos. Esta forma intuitiva de colocar la recta pretende minimizar la distancia vertical entre cada uno de los puntos y la recta. Es precisamente esto lo que se hace cuando se utiliza el método de mínimos cuadrados, sin embargo con este método, por ser un procedimiento numérico, se garantiza que la suma de los cuadrados de esas desviaciones es mínima. INGA. ASTRID MÉRIDA

6 Fórmulas Para obtener los valores de a y b ∑y = n a + b ∑x ∑ x y = a ∑x + b ∑ x 2 INGA. ASTRID MÉRIDA

7 MODELO DE REGRESIÓN Y SUS SUPUESTOS El modelo utilizado es: Se basa en la forma pendiente-ordenada al origen de una recta. Representa un modelo determinístico, ya que dado un valor de x se obtiene uno para y. Tiene la siguiente forma general: El modelo probabilístico que incluye el componente de error es: INGA. ASTRID MÉRIDA

8 En donde es el termino del error, la diferencia entre cada uno de los valores observados de la variable y; y los estimados para cada valor de x, de acuerdo con la ecuación de regresión de mínimos cuadrados La suma de todos los errores, cuando se construye una ecuación de regresión lineal, debe ser igual a cero. INGA. ASTRID MÉRIDA

9 ERROR ESTÁNDAR DE LA ESTIMACIÓN Es la desviación estándar de la dispersión vertical con respecto a la línea. Sirve para medir la confiabilidad de la ecuación de estimación. Formula Se = √ [ ∑ y2 - a ∑y - b ∑ xy ] / ( n – 2 ) INGA. ASTRID MÉRIDA

10 Ejemplo:  Para el siguiente conjunto de datos: a) graficar b) desarrollar la ecuación de estimación que mejor describa los datos, c) Calcular el error estándar de estimación d) Pronosticar Y para X = 15, 8, 20 x1346891114 y12445789 INGA. ASTRID MÉRIDA

11 a) Gráficar INGA. ASTRID MÉRIDA

12 ESTIMACIÓN DE INTERVALOS DE CONFIANZA Y PRUEBA DE HIPÓTESIS EN LA REGRESIÓN LINEAL INTERVALO DE CONFIANZA PARA LA PENDIENTE donde: t se trabaja con n-2 grados de libertad INGA. ASTRID MÉRIDA

13 PRUEBA DE HIPÓTESIS SOBRE LA PENDIENTE β1 Existen 2 maneras de probar la hipótesis nula, a través de la t de Student y utilizando la F de Fisher. El estadístico de prueba para la t de Student es: Donde: = valor de la pendiente en la ecuación estimada INGA. ASTRID MÉRIDA

14 INTERVALO DE CONFIANZA PARA (βo), LA INTERSECCIÓN DE LA LÍNEA DE REGRESIÓN Donde: t con n-2 grados de libertad. INGA. ASTRID MÉRIDA

15 DONDE: = = Pronóstico basado en el punto de análisis X= x INGA. ASTRID MÉRIDA

16 Ejemplo:  Para el siguiente conjunto de datos: a) calcular ecuación b) probar que no existe relación entre las 2 variables, es decir, que la pendiente de la recta de regresión es cero, con α = 0.01 c) Hacer una estimación por intervalo para β1 con un nivel de confianza de 99 por ciento. d) haga una estimación por intervalo para el valor de y, dado x=15, con un nivel de confianza de 95 por ciento. x1346891114 y12445789 INGA. ASTRID MÉRIDA

17 Solución: a) calcular ecuación Y est = 6/11 + 7/11 x b) probar que no existe relación entre las 2 variables, es decir, que la pendiente de la recta de regresión es cero, con α = 0.01 = 0.6513/ √ 132 S β1 = 0.0567 = [(7/11) - 0 ] / 0.0567 t = 11.22 t con α=0.01 y gl= n -2 t = 3.707 Se rechaza la hipótesis nula para concluir que si existe una relación entre las 2 variables, en otras palabras, β1 es diferente de cero. c) Hacer una estimación por intervalo para β1 con un nivel de confianza de 99 por ciento. S β1 = ( 0.6513 ) / √132 = 0.0567 = 7/11 ± 3.707 * 0.0567 0.4262 ≤ β1 ≤ 0.8466 Con una confianza de 99% de estar en lo correcto, se estima que la pendiente de la recta de regresión que relaciona x con y, se encuentra entre 0.4262 y 0.8466. INGA. ASTRID MÉRIDA

18 d) haga una estimación por intervalo para el valor de y, dado x=15, con un nivel de confianza de 95 por ciento. Primero realizar el pronóstico para x = 15 Y est = 6/11 + 7/11 (15) = = 10.09 = 10.09 ± (2.447* 0.6513) * √ [ (1/8) + ( 15 – 7)² / 132 ] = 10.09 ± ( 2.447 * 0.6513 * 0.7809) = 10.09 ± 1.2445 8.8455 ≤ ≤ 11.3345 Se estima, con una confianza de 95% de estar en lo correcto, que y para un x = 15 esta entre 8.8455 y 11.3345. INGA. ASTRID MÉRIDA


Descargar ppt "REGRESIÓN Y CORRELACIÓN  REGRESIÓN Es un Proceso estadístico que consiste en predecir una variable a partir de otra utilizando datos anteriores. INGA."

Presentaciones similares


Anuncios Google