Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porManuelita Quijada Modificado hace 11 años
1
ANÁLISIS DE REGRESIÓN Y CORRELACIÓN Lic. Oscar Noé López Cordón
ESTADÍSTICA I ANÁLISIS DE REGRESIÓN Y CORRELACIÓN Lic. Oscar Noé López Cordón
2
Algunos Ejemplos de Variables y su relación
¿Existe alguna relación entre la cantidad que Healthtex gasta por mes en publicidad y sus ventas mensuales? Con base en el costo de calefacción de una casa en el mes de enero. ¿Es posible estimar el área de la casa? ¿Hay alguna relación entre las millas por galón que rinde una camioneta grande y el tamaño del motor? ¿Hay alguna relación entre el número de horas que estudiaron los alumnos para un examen y la calificación que obtuvieron?
3
CLASIFICACIÓN DE MOVIMIENTOS, VARIACIONES O PATRONES DE LAS SERIES
Movimientos Seculares o de Larga Duración (Tendencia Lineal) Movimientos Cíclicos Movimientos Estacionales Movimientos Irregulares o al Azar
4
TENDENCIA LINEAL Es la que puede señalarse en una línea recta o curva suave, y puede ser ascendente o descendente.
5
REGRESIÓN Y CORRELACIÓN
Los análisis de Regresión y de Correlación están basados en la relación o asociación, entre 2 o más variables: Una variable conocida llamada Variable Independiente. La variable que se está tratando de predecir es la Variable Dependiente. La regresión y los análisis de correlación muestran como determinar tanto la naturaleza como la fuerza de una relación entre dos variables.
6
REGRESIÓN Y CORRELACIÓN
La Regresión y la correlación son dos técnicas estadísticas que se pueden utilizar para solucionar problemas comunes en los negocios. Muchos estudios se basan en la creencia de que es posible identificar y cuantificar alguna Relación Funcional entre dos o más variables, donde una variable depende de la otra variable. Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera en un modelo de Regresión Simple.
7
Métodos para obtener una línea recta y su ecuación:
Método Gráfico, de Mano Alzada o Mano Libre, Método de Semipromedios, Método de Promedios Móviles y Método de Mínimos Cuadrados.
8
Método de Mínimos Cuadrados:
Para el ajuste de la línea se utiliza el Método de Mínimos Cuadrados, con la Ecuación de la Línea Recta: Y = a + bx Y cuando se usa para describir la tendencia es escrita así: Yc = a + bx
9
ANALISIS DE REGRESIÓN Es la técnica mas usada en investigación económica y comercial para buscar una relación entre 2 o mas variables ligadas de un modo causal. Consiste en general en: una función a partir de datos o información conocida para hacer estimaciones .
10
TIPOS ANÁLISIS DE REGRESIÓN
a) REGRESION LINEAL SIMPLE Se refiere al análisis de 2 variables. b) REGRESION MÚLTIPLE Cuando se relacionan 3 o mas variables.
11
Regresión Lineal Simple
En el análisis de regresión se desarrolla una ecuación de estimación, esto es, una fórmula matemática que relaciona las variables conocidas con la variable desconocida.
12
Modelo de Regresión En el Modelo de Regresión es muy importante identificar cuál es la variable dependiente y cuál es la variable independiente. En el Modelo de Regresión Simple se establece que “Y” es una función de sólo una variable independiente, razón por la cual se le denomina también Regresión Divariada porque sólo hay dos variables, una dependiente y otra independiente y se representa así: 12
13
Modelo de Regresión La variable dependiente es la variable que se desea explicar, predecir. También se le llama REGRESANDO ó VARIABLE DE RESPUESTA. La variable Independiente «X» se le denomina VARIABLE EXPLICATIVA ó REGRESOR y se le utiliza para EXPLICAR «Y» 13
14
Técnicas más utilizadas en el análisis de regresión lineal simple
1) Ordenamiento y análisis de la información original 2) Diagrama de dispersión e interpretación El primer paso para determinar si existe o no una relación entre dos variables es analizar la gráfica de datos observados. 14
15
Técnicas más utilizadas en el análisis de regresión lineal simple
La gráfica se llama Diagrama de Dispersión y es un diagrama que nos puede dar dos tipos de información: (visualmente) patrones que nos indiquen que las variables están relacionadas Entonces (si esto sucede), podemos ver que tipo de línea, o ecuación de estimación, describe esta relación.
16
Diagrama de Dispersión
Es una gráfica con datos muestrales apareados (x, y) en un sistema de ejes rectangular, y cada par ordenado representa un solo punto. Sirve más para visualizar la asociación entre las variables que las gráficas de barras de los hechos aislados, que nos muestran tendencias al estar ordenados en una secuencia temporal. Al observar una gráfica debemos “ver” Existe un patrón? Que dirección tiene? Si una variable se incrementa, que sucede con la otra? Existen datos distantes? 16
17
Diagramas de Dispersión
17
18
Tipos de relaciones lineales:
RELACION LINEAL ASCEDENTE RELACION LINEAS DESCENDENTE RELACION LINEAL CURVILÍNEA RELACION LINEAL CONSTANTE
19
REGRESIÓN LINEAL SIMPLE
Para este análisis es necesario ajustar los datos a una línea recta, para poder estimar una variable con relación a otra. Para esto utilizamos la ecuación de la línea recta: Y = a+ bx === yc = a+ bx = Ecuación de Regresión
20
Donde: Yc = Variable estimada o calculada. a y b = Coeficientes de regresión. X = Variable que sirve para estimar la otra variable. Predictor en base a ella se estima el predictando. (Variable Independiente). Y = Constituye la Variable a estimar y recibe el nombre de Predictando. (Variable Dependiente).
21
ECUACIONES NORMALES: y = n.a X b Xy = X a + X^2b
22
FÓRMULAS PARA ENCONTRAR "a" y "b":
a = x^2 (y xxy n(x ^2) - x^2 b = n(xy) xy n(x ^2) - x^2
23
ERROR ESTANDAR DE REGRESIÓN: (SÍMBOLO Syx)
Mide el grado de error de las estimaciones alrededor de la línea de regresión; si este es igual a cero ( 0 ) se dirá que existe una estimación perfecta.
24
Propiedades de Syx; Yc, +, - Syx = Agrupa aproximadamente al
68.26% de los datos. Yc , +, - 2 (Syx)= Agrupa aproximadamente al 95.46% de los datos. Yc , +, - 3 (Syx) = Agrupa aproximadamente al 99.72% de los datos.
25
Hay dos formas de calcularlo:
1.) VARIANZA NO EXPLICADA (VE) ___________ Syx = (y- yc)^2 n-2 2.) FORMULA GENERAL Syx = y^ y a - XY b INTERVALO DE CONFIANZA: Yc +- Z. Syx
26
Análisis de Correlación
el análisis de correlación se APLICA para determinar el grado en el que están relacionadas las variables. El análisis de correlación, INDICA qué tan bien están relacionadas las variables. El análisis de correlación, MUESTRA que tan bien la ecuación de estimación realmente describe la relación 26
27
ANALISIS DE CORRELACIÓN :
Mide el grado de asociación de dos o más variables. La correlación también se puede usar por si misma para medir el grado de asociación de dos variables. SÍMBOLO " r "
28
Coeficiente de Correlación Lineal “r”
Mide la fuerza de la relación lineal entre dos valores cualitativos apareados, en una muestra. También se llama “Coeficiente de correlación producto momento de Pearson.”.
29
Si r es igual a 0 = no existe correlación
Si r mayor que = correlación positiva Si r menor que = correlación negativa Si r es igual a menos 1 = correlación perfecta negativa Si r es igual a uno = correlación perfecta positiva. Los límites o extremos del coeficiente de correlación son –1 y 1.
30
Coefifiente de Correlación - Interpretación
31
Mapa de Dispersión Correlación perfecta positiva r = 1
32
Mapa de Dispersión Correlación perfecta negativa r = -1
33
Mapa de Dispersión No hay correlación r = 0
34
COEFICIENTE DE DETERMINACIÓN:
Es la forma primaria por la cual se puede medir la extensión o fuerza, de la asociación que existe entre 2 variables X y Y. r^2= a (y) + b (xy) - n ( y )^2 y - n ( y ) ^2 Dónde y = x/n
35
COEFICIENTE DE CORRELACIÓN:
Sirve para medir la relación entre dos variables. Es la segunda medida que se pueda usar para describir lo bien que una variable se explica por otra. Cuando se está tratando de muestras, el coeficiente de correlación se denota por “1” y es la raíz cuadrada del coeficiente de determinación muestral .
36
Fórmula r = r^2 R = a (y) + b (xy) - n ( y )^2 y - n ( y ) ^2
37
APLICACIÓN: Al tabular los costos Unitarios y la producción de una empresa industrial durante el año anterior, se encontró el siguiente comportamiento: Estadística I COSTO POR PROD EN MILES UNIDAD DE UNIDADES Q Q Q Q Q
38
1.) Con los datos tabulados de la contabilidad de la empresa se pide: Elaborar la representación gráfica sabiendo que la empresa desea estimar su producción. Estadística I
39
DATOS N = 5 x = 15 y = 65 x = 55 y = 939 xy = 165 DESARROLLO: x y
Estadística I x y xy 1 20 400 2 15 4 225 30 3 12 9 144 36 11 16 121 44 5 7 25 49 35 65 55 939 165 DATOS N = 5 x = 15 y = 65 x = 55 y = 939 xy = 165
40
2). Encuentre la Ecuación de Regresión del comportamiento de la producción en función de los costos unitarios Estadística I 65 = a + 15b 165 = 15 a + 55b 15/5 = 3 al cual se le cambia signo a negativo (-) y se usa como factor que multiplica a toda la ecuación de la siguiente forma: -195 = - 15 a b (-3) Factor que multiplica a la Ec. 165 = a + 55b -30 = b b = = b= -3 10
41
Encontrar "a": 65 = 5 a + 15 (-3) Valor de “b” 65 = 5 a - 45
Estadística I 65 = 5 a + 15 (-3) Valor de “b” 65 = 5 a - 45 = 5 a 110 = 5a a = = a = 22 5 La Ecuación de regresión de la Producción en función de los costos = Yc = 22 – 3x
42
3.) OBTENER "a" y "b" por Fórmula:
Estadística I OBTENER “a” a = (x ) (y) – (x) (xy) n( x) (x) a = ( 55 ) (65) – (15) (165) = – = (55) - (15) a = 22
43
OBTENER “b” b = n xy - (x) (y) n( x ) - (x)
Estadística I OBTENER “b” b = n xy (x) (y) n( x ) (x) b = (165) – (15) (65) = – = 5 (55) - (15) – b = -3
44
4.)El Departamento de Ventas de la empresa solicita le indique qué número de unidades puede producir el presente año, si según estudios se considera que su costo unitario será igual a Q.3.75 Estadística I Y = a + bx Yc = – 3 (3.75) Yc = – = 10.75
45
5.) CALCULAR EN ERROR ESTANDAR DE REGRESION;
Estadística I Syx = y - y.a - xy.b N Syx = – ( 65) 22 –165 (-3) 5 Syx = – = 5 5 Syx =
46
Explicación del Cálculo de la columna Yc
Estadística I Yc Yc=22-3x (y-Yc) 19 (1) 1 16 (2) -1 13 (3) 10 (4) 7 (5) 65 xxxx 4
47
Otra forma: ___________ Syx = (y- yc) N Syx = 4 5 Syx = 0.894427191
Estadística I ___________ Syx = (y- yc) N Syx = 5 Syx =
48
Fórmula r = r o bien: r = a (y) + b (xy) - n ( y promedio)
Estadística I r = r o bien: r = a (y) + b (xy) - n ( y promedio) y - n (y promedio)
49
APLICACIÓN: Con los datos del ejemplo que se ha desarrollado en el Análisis de Regresión, calcular la forma en que primariamente se relacionan las variables: Estadística I r = a (y) + b (xy) - n ( y promedio) y - n (y promedio) r = (22) (-3) ( 13) (13) r =
50
A continuación calcular el grado de asociación entre las dos variables, (la fuerza o extensión en que se asocian las variables): Estadística I r = r = Por ser “r” mayor que cero se dice que la correlación es positiva.
51
Ejemplo de Regresión El gerente de ventas de Copier Sales of America que tiene una fuerza de ventas muy grande en Estados Unidos y Canadá, desea determinar si hay alguna relación entre el número de llamadas de ventas en un mes y el número de copiadoras vendidas en ese mes. El gerente selecciona una muestra aleatoria de 10 representantes de ventas y determina el número de llamadas de ventas que cada uno hizo el mes pasado y el número de copiadoras vendidas. La información muestral aparece a continuación:
52
Diagrama de Dispersión
53
Coeficiente de Correlación – Ejemplo en Excel
54
Coeficiente de Correlación - Ejemplo
55
Coeficiente de Correlación - Ejemplo
¿Cómo se interpreta una correlación de 0.759? Es positiva, por lo que se observa una relación directa Entre el número de llamadas de ventas y el número de copiadoras Vendidas.
56
Coeficiente de Correlación – Ejemplo con Excel
No. Llamadas realizadas No. De Copiadoras Vendidas x y 20 30 40 60 10 50 70 Promedios 22 45
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.