La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

REGRECION LINEAL SIMPLE, MULTIPLE Y CORRELACION. REGRECION LINEAL SIMPLE.

Presentaciones similares


Presentación del tema: "REGRECION LINEAL SIMPLE, MULTIPLE Y CORRELACION. REGRECION LINEAL SIMPLE."— Transcripción de la presentación:

1 REGRECION LINEAL SIMPLE, MULTIPLE Y CORRELACION

2 REGRECION LINEAL SIMPLE

3 I NTRODUCCIÓN : La regresión y los análisis de correlación nos muestran como determinar tanto la naturaleza como la fuerza de una relación entre dos variables En el análisis de regresión desarrollaremos una ecuación de estimación, esto es, una formula matemática que relaciona las variables conocidas con la variable desconocida. Entonces podemos aplicar el análisis de correlación para determinar el grado de en el que están relacionadas las variables. El análisis de correlación, entonces, nos dice qué tan bien están relacionadas las variables. El análisis de correlación, entonces, nos dice que tan bien la ecuación de estimación realmente describe la relación.

4 A NÁLISIS E STADÍSTICO : En el estudio de la relación funcional entre dos variables poblacionales, una variable X, llamada independiente, explicativa o de predicción y una variable Y, llamada dependiente o variable respuesta, presenta la siguiente notación: Y = a + b X + ε Donde: a es el valor de la ordenada donde la línea de regresión se intercepta con el eje Y. b es el coeficiente de regresión poblacional (pendiente de la línea recta) ε es el error

5 S UPOSICIONES DE LA R EGRESIÓN L INEAL Los valores de la variable independiente X son fijos, medidos sin error. La variable Y es aleatoria Para cada valor de X, existe una distribución normal de valores de Y (subpoblaciones Y) Las variancias de las subpoblaciones Y son todas iguales. Todas las medias de las subpoblaciones de Y están sobre la recta. Los valores de Y están normalmente distribuidos y son estadísticamente independientes.

6 E STIMACIÓN DE LA E CUACIÓN Consiste en determinar los valores de "a" y "b " a partir de la muestra, es decir, encontrar los valores de a y b con los datos observados de la muestra. El método de estimación es el de Mínimos Cuadrados, mediante el cual se obtiene:

7 Luego, la ecuación de regresión muestral estimada es: Que se interpreta como: a es el estimador de α Es el valor estimado de la variable Y cuando la variable X = 0 b es el estimador de β, es el coeficiente de regresión Está expresado en las mismas unidades de Y por cada unidad de X. Indica el número de unidades en que varía Y cuando se produce un cambio, en una unidad, en X (pendiente de la recta de regresión).Un valor negativo de b sería interpretado como la magnitud del decremento en Y por cada unidad de aumento en X.

8 P ROBLEMA E JEMPLO : Los datos de la siguiente tabla representan las estaturas (X, cm) y los pesos (Y, kg) de una muestra de 12 hombres adultos. Para cada estatura fijada previamente se observó el peso de una persona seleccionada de entre el grupo con dicha estatura, resultando: Con estos datos vamos a plantear una ecuación de regresión simple que nos permita pronosticar los pesos conociendo las tallas. Utilizaremos a = 0.05, y contrastaremos nuestra hipótesis con la prueba F. X152155152155157152157165162178183178 Y 5061.554.557.563.559617266728482

9 D ESARROLLO DEL P ROBLEMA : Representación matemática y gráfica de los datos:

10 H IPÓTESIS : H O : No hay relación entre la variable peso y la variable estatura. H A : Hay relación entre la variable peso y la variable estatura. Se obtiene un valor F = 73.08 > 4.96, con lo cual se rechaza la hipótesis nula y aceptamos que la variable estatura está relacionada con la variable peso con un 95% de confianza. De acuerdo al desarrollo matemático hemos obtenido los siguientes cálculos: Lo que nos permite obtener los coeficientes a y b. b = 1223 / 1409.667 = 0.8676 a = 65.25 – (0.8676) (162.167) = -75.446 Fuente de Variación Grados de Libertad Suma de Cuadrados Cuadrados Medios Estadístico F Debido a la Regresión 11061.1 73.08 Error10145.214.5 Total111206.3

11 I NTERPRETACIÓN : La ecuación de regresión estimada es: Ŷ = -75.446+0.8676X Coeficiente de correlación: R= 0.9379 Coeficiente de determinación: R²=0.8796 El valor de b = 0.8676 indica el incremento del peso en kilogramos, en promedio, por cada centímetro de aumento en la estatura de los hombres adultos. El valor de a, no tiene interpretación práctica en el ejemplo, se interpretaría como el valor obtenido, en promedio, para el peso Y, cuando la estatura es 0. Utilizando la ecuación de regresión para estimar o predecir valores de la variable Y: Para una talla de 180 se obtiene un peso de 80.7 kg. ¿Cuánto se espera que pese (en promedio) una persona que mide 1.60 m? Sustituyendo el valor de interés en la ecuación: Ŷ = -75.446+0.8676X Se obtiene: Ŷ = -75.446+0.8676(160) = 63.37 kg

12 C ONCLUSIÓN : La ecuación de Regresión Lineal estimada para las variables estatura y peso muestran, de acuerdo a la prueba F, relación. Esta relación se ha estimado en un R = 93.7, que indica una fuerte relación positiva. Además si consideramos el coeficiente de determinación R² = 87.9 podemos indicar que el 87.9% de las variaciones que ocurren en el peso se explicarían por las variaciones en la variable estatura.

13 REGRECION LINEAL MULTIPLE

14 Este tipo se presenta cuando dos o más variables independientes influyen sobre una variable dependiente. Ejemplo: Y = f(x, w, z). Por ejemplo: Podría ser una regresión de tipo múltiple: Una Empresa de desarrollo de software establece relacionar sus Ventas en función del numero de pedidos de los tipos de software que desarrolla (Sistemas, Educativos y Automatizaciones Empresariales), para atender 10 proyectos en el presente año. En la Tabla representa Y (Ventas miles de S/.) e X (Nº pedidos de sistemas), W (Nº de pedidos de Aplicaciones Educativas) y Z (Nº de pedidos de Automatizaciones empresariales).

15 Objetivo : Se presentara primero el análisis de regresión múltiple al desarrollar y explicar el uso de la ecuación de regresión múltiple, así como el error estándar múltiple de estimación. Después se medirá la fuerza de la relación entre las variables independientes, utilizando los coeficientes múltiples de determinación. Y440455470510506480460500490450 X50403545515553483844 W10514011013012511510010311898 Z75687064677270736974

16 A NÁLISIS DE REGRESIÓN MÚLTIPLE : Dispone de una ecuación con dos variables independientes adicionales: Se puede ampliar para cualquier número "m" de variables independientes: Para poder resolver y obtener y en una ecuación de regresión múltiple el cálculo se presenta muy tediosa porque se tiene atender 3 ecuaciones que se generan por el método de mínimo de cuadrados:

17 E RROR ESTÁNDAR DE LA R EGRESIÓN MÚLTIPLE : Es una medida de dispersión la estimación se hace más precisa conforme el grado de dispersión alrededor del plano de regresión se hace mas pequeño. Para medirla se utiliza la formula: Y : Valores observados en la muestra Ŷ : Valores estimados a partir a partir de la ecuación de regresión n : Número de datos m : Número de variables independientes

18 A PLICACIÓN : Mediante el siguiente problema podremos ilustrar la aplicación de Regresión Multiple: En la Facultad de Ingeniería de Sistemas y Computo de la Universidad "Inca Garcilaso de la Vega" se quiere entender los factores de aprendizaje de los alumnos que cursan la asignatura de PHP, para lo cual se escoge al azar una muestra de 15 alumnos y ellos registran notas promedios en las asignaturas de Algoritmos, Base de Datos y Programación como se muestran en el siguiente cuadro.

19 AlumnoPHPAlgoritmosBase de Datos Programación 11315 13 2 141312 313161314 415201416 5 18 17 615161715 712131511 813161415 913151413 1013141310 11 12 10 1214161114 1315171615 1415191416 15 131510

20 Lo que buscamos es construir un modelo para determinar la dependencia que exista de aprendizaje reflejada en las notas de la asignatura de PHP, conociendo las notas de las asignaturas Algoritmos, Base de Datos y Programación. Se presentara la siguiente ecuación a resolver:

21 Utilizando las formulas de las ecuaciones normales a los datos obtendremos los coeficientes de regresión o utilizando Regresión de Análisis de datos, en la Hoja de Calculo de Excel podemos calcular también los coeficientes de regresión: Por lo tanto podemos construir la ecuación de regresión que buscamos:

22 C ONCLUSIONES : El 69.70% del aprendizaje del Curso de PHP puede ser explicado mediante las notas obtenidas por las asignaturas de Algoritmos, Base de Datos y Programación.

23 CORRELACION

24 A NÁLISIS DE CORRELACIÓN SIMPLE : Sirve para medir la bondad del ajuste de una recta de regresión a un conjunto de observaciones, en el caso de tener una variable dependiente y una independiente. Dicha medida nos la da el coeficiente de determinación R2, que verifica 0 ≤ R2 ≤ 1. Cuanto más cercano a uno sea su valor mejor será el ajuste, y tanto peor cuanto más cercano a cero. Se calcula como el cuadrado del coeficiente de correlación lineal de Pearson

25 El coeficiente de correlación lineal de Pearson (se denota r ó ρ) es una medida de asociación lineal entre dos variables aleatorias X e Y: r = ρ= Cov ( X, Y ) SxSy Se verifica que –1 ≤ r ≤ 1 y podemos decir que: " Si r = -1, existe una relación lineal negativa perfecta entre X e Y. " Si r = 1, existe una relación lineal positiva perfecta entre X e Y. " Si r = 0, no existe ninguna relación lineal entre X e Y (X e Y son independientes).

26 A NALISIS DE CORRELACIÓN MÚLTIPLE : Sirve para medir la adecuación del modelo hallado (bondad del ajuste de la recta de regresión al conjunto de observaciones), en el caso de tener una variable dependiente y varias independientes. Dicha medida nos la da el coeficiente de determinación R2, que verifica 0 ≤ R2 ≤ 1. Cuanto más cercano a uno sea su valor, mayor es el grado de asociación lineal que existe entre la variable dependiente y las independientes o predictoras. Nos mide la proporción de la variación total de las observaciones que se explican mediante la ecuación (recta) de regresión

27 R EFERENCIAS : http://www.uhu.es/89050/ficherosdatos/guia10.P DF Ezequiel Uriel, “Análisis de datos: Series temporales y análisis multivariante”. Editorial AC. Juan Etxeberría, “Regresión Múltiple”. Cuadernos de Estadística. Editorial La Muralla. http://www.monografias.com/trabajos30/regresion -multiple/regresion-multiple.shtml

28 G RACIAS !!!


Descargar ppt "REGRECION LINEAL SIMPLE, MULTIPLE Y CORRELACION. REGRECION LINEAL SIMPLE."

Presentaciones similares


Anuncios Google