ANÁLISIS DE REGRESIÓN Y CORRELACIÓN Lic. Oscar Noé López Cordón

Slides:



Advertisements
Presentaciones similares
Exp. Renán Quispe LLanos
Advertisements

Tema 6: Regresión lineal.
CAPÍTULO 2 Elaboración y utilización de gráficas
REGRESION Y CORRELACION
UNIDAD No. 6 SERIES CRONOLÓGICAS, HISTÓRICAS O SERIES DE TIEMPO
Lic. Cristian R. Arroyo López
Regresión lineal simple
Lic. Cristian R. Arroyo López
REGRESION LINEAL SIMPLE
Descripción de los datos: medidas de ubicación
Descripción de los datos: medidas de dispersión
Error Estándar de la Media
Unidad de competencia II Estadística descriptiva:
Unidad de competencia II Estadística descriptiva:
Capítulo 3 Descripción de datos, medidas de tendencia central
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
MÉTODOS DE MEDICIÓN DE COSTOS.
Estadística Administrativa I
Pronósticos, Series de Tiempo y Regresión
Estadística: -Correlación y regresión
Ingeniería Industrial II CicloEducativo 2011
CAPÍTULO 2 Elaboración y utilización de gráficas
REGRESION & CORRELACION
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Econometria 2. Modelo de Regresión Lineal Simple
Modelo básico de regresión Lineal
Regresión y correlación
Estadística Administrativa II
Estadística Administrativa II
REGRESIÓN Y CORRELACIÓN
Estadística Descriptiva: 4. Correlación y Regresión Lineal
بسم الله الرحمن الرحيم.
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Regresión Lineal Simple
1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar VARIABLE ESTADÍSTICA UNIDIMENSIONAL Población:
9 Regresión Lineal Simple
MEDIDAS DE DISPERSIÓN:
Análisis de Correlación y de Regresión lineal simple
UNIVERSIDAD AUTONOMA DEL PERÚ
Distribuciones bidimensionales. Tablas de contingencia
REGRESION Y CORRELACION
BIOMETRIA II TEMA 2 El Modelo de Regresión.
Pronósticos, Series de Tiempo y Regresión
Regresión Lineal Simple Lic. César Octavio Contreras.
ANALISIS DE FRECUENCIA EN HIDROLOGIA (2)
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
Estadística bidimensional
LA RECTA DE REGRESIÓN CONTENIDOS:
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
Definición del Modelo de Regresión Simple Estimaciones por MCO Método de MCO Valores Esperados y Varianzas por MCO.
Análisis de los Datos Cuantitativos
Regresión Lineal Simple
Aplicaciones Estadísticas a las Finanzas Clase 1
Método de mínimos cuadrados
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Correlación Decimos que dos variables, X e Y, están correlacionadas cuando hay una relación cuantitativa entre ellas. X suele ser la variable independiente.
Construcción de modelos con regresión y correlación
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Variables estadísticas bidimensionales
Regresión lineal simple Nazira Calleja
Unidad 4 Análisis de los Datos.
TEMA : ANALISIS DE REGRESION
REGRESIÓN LINEAL SIMPLE
RELACIÓN ENTRE UNA VARIABLE DEPENDIENTE Y UNA O MAS INDEPENDIENTES.
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
METODO DEL PUNTO ALTO Y DEL PUNTO BAJO
Transcripción de la presentación:

ANÁLISIS DE REGRESIÓN Y CORRELACIÓN Lic. Oscar Noé López Cordón ESTADÍSTICA I ANÁLISIS DE REGRESIÓN Y CORRELACIÓN Lic. Oscar Noé López Cordón oscarnoe@lopezcordon.net

Algunos Ejemplos de Variables y su relación ¿Existe alguna relación entre la cantidad que Healthtex gasta por mes en publicidad y sus ventas mensuales? Con base en el costo de calefacción de una casa en el mes de enero. ¿Es posible estimar el área de la casa? ¿Hay alguna relación entre las millas por galón que rinde una camioneta grande y el tamaño del motor? ¿Hay alguna relación entre el número de horas que estudiaron los alumnos para un examen y la calificación que obtuvieron?

CLASIFICACIÓN DE MOVIMIENTOS, VARIACIONES O PATRONES DE LAS SERIES Movimientos Seculares o de Larga Duración (Tendencia Lineal) Movimientos Cíclicos Movimientos Estacionales Movimientos Irregulares o al Azar

TENDENCIA LINEAL Es la que puede señalarse en una línea recta o curva suave, y puede ser ascendente o descendente.

REGRESIÓN Y CORRELACIÓN Los análisis de Regresión y de Correlación están basados en la relación o asociación, entre 2 o más variables: Una variable conocida llamada Variable Independiente. La variable que se está tratando de predecir es la Variable Dependiente. La regresión y los análisis de correlación muestran como determinar tanto la naturaleza como la fuerza de una relación entre dos variables.

REGRESIÓN Y CORRELACIÓN La Regresión y la correlación son dos técnicas estadísticas que se pueden utilizar para solucionar problemas comunes en los negocios. Muchos estudios se basan en la creencia de que es posible identificar y cuantificar alguna Relación Funcional entre dos o más variables, donde una variable depende de la otra variable. Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera en un modelo de Regresión Simple.

Métodos para obtener una línea recta y su ecuación: Método Gráfico, de Mano Alzada o Mano Libre, Método de Semipromedios, Método de Promedios Móviles y Método de Mínimos Cuadrados.

Método de Mínimos Cuadrados: Para el ajuste de la línea se utiliza el Método de Mínimos Cuadrados, con la Ecuación de la Línea Recta: Y = a + bx Y cuando se usa para describir la tendencia es escrita así: Yc = a + bx

ANALISIS DE REGRESIÓN Es la técnica mas usada en investigación económica y comercial para buscar una relación entre 2 o mas variables ligadas de un modo causal. Consiste en general en: una función a partir de datos o información conocida para hacer estimaciones .

TIPOS ANÁLISIS DE REGRESIÓN a) REGRESION LINEAL SIMPLE Se refiere al análisis de 2 variables. b) REGRESION MÚLTIPLE Cuando se relacionan 3 o mas variables.

Regresión Lineal Simple En el análisis de regresión se desarrolla una ecuación de estimación, esto es, una fórmula matemática que relaciona las variables conocidas con la variable desconocida.

Modelo de Regresión   En el Modelo de Regresión es muy importante identificar cuál es la variable dependiente y cuál es la variable independiente. En el Modelo de Regresión Simple se establece que “Y” es una función de sólo una variable independiente, razón por la cual se le denomina también Regresión Divariada porque sólo hay dos variables, una dependiente y otra independiente y se representa así: 12

Modelo de Regresión La variable dependiente es la variable que se desea explicar, predecir. También se le llama REGRESANDO ó VARIABLE DE RESPUESTA. La variable Independiente «X» se le denomina VARIABLE EXPLICATIVA ó REGRESOR y se le utiliza para EXPLICAR «Y»  13

Técnicas más utilizadas en el análisis de regresión lineal simple 1) Ordenamiento y análisis de la información original 2) Diagrama de dispersión e interpretación El primer paso para determinar si existe o no una relación entre dos variables es analizar la gráfica de datos observados. 14

Técnicas más utilizadas en el análisis de regresión lineal simple La gráfica se llama Diagrama de Dispersión y es un diagrama que nos puede dar dos tipos de información: (visualmente) patrones que nos indiquen que las variables están relacionadas Entonces (si esto sucede), podemos ver que tipo de línea, o ecuación de estimación, describe esta relación.

Diagrama de Dispersión Es una gráfica con datos muestrales apareados (x, y) en un sistema de ejes rectangular, y cada par ordenado representa un solo punto. Sirve más para visualizar la asociación entre las variables que las gráficas de barras de los hechos aislados, que nos muestran tendencias al estar ordenados en una secuencia temporal. Al observar una gráfica debemos “ver” Existe un patrón? Que dirección tiene? Si una variable se incrementa, que sucede con la otra? Existen datos distantes? 16

Diagramas de Dispersión   17

Tipos de relaciones lineales: RELACION LINEAL ASCEDENTE RELACION LINEAS DESCENDENTE RELACION LINEAL CURVILÍNEA RELACION LINEAL CONSTANTE

REGRESIÓN LINEAL SIMPLE Para este análisis es necesario ajustar los datos a una línea recta, para poder estimar una variable con relación a otra. Para esto utilizamos la ecuación de la línea recta: Y = a+ bx === yc = a+ bx = Ecuación de Regresión

Donde: Yc = Variable estimada o calculada. a y b = Coeficientes de regresión. X = Variable que sirve para estimar la otra variable. Predictor en base a ella se estima el predictando. (Variable Independiente). Y = Constituye la Variable a estimar y recibe el nombre de Predictando. (Variable Dependiente).

ECUACIONES NORMALES: y = n.a +  X b  Xy =  X a +  X^2b

FÓRMULAS PARA ENCONTRAR "a" y "b": a = x^2 (y - xxy n(x ^2) - x^2 b = n(xy) - xy n(x ^2) - x^2

ERROR ESTANDAR DE REGRESIÓN: (SÍMBOLO Syx) Mide el grado de error de las estimaciones alrededor de la línea de regresión; si este es igual a cero ( 0 ) se dirá que existe una estimación perfecta.

Propiedades de Syx; Yc, +, - Syx = Agrupa aproximadamente al 68.26% de los datos. Yc , +, - 2 (Syx)= Agrupa aproximadamente al 95.46% de los datos. Yc , +, - 3 (Syx) = Agrupa aproximadamente al 99.72% de los datos.

Hay dos formas de calcularlo: 1.) VARIANZA NO EXPLICADA (VE) ___________ Syx =  (y- yc)^2 n-2 2.) FORMULA GENERAL Syx =  y^2 - y a - XY b INTERVALO DE CONFIANZA: Yc +- Z. Syx

Análisis de Correlación el análisis de correlación se APLICA para determinar el grado en el que están relacionadas las variables. El análisis de correlación, INDICA qué tan bien están relacionadas las variables. El análisis de correlación, MUESTRA que tan bien la ecuación de estimación realmente describe la relación 26

ANALISIS DE CORRELACIÓN : Mide el grado de asociación de dos o más variables. La correlación también se puede usar por si misma para medir el grado de asociación de dos variables. SÍMBOLO " r "

Coeficiente de Correlación Lineal “r” Mide la fuerza de la relación lineal entre dos valores cualitativos apareados, en una muestra. También se llama “Coeficiente de correlación producto momento de Pearson.”.

Si r es igual a 0 = no existe correlación Si r mayor que 0 = correlación positiva Si r menor que 0 = correlación negativa Si r es igual a menos 1 = correlación perfecta negativa Si r es igual a uno = correlación perfecta positiva. Los límites o extremos del coeficiente de correlación son –1 y 1.

Coefifiente de Correlación - Interpretación

Mapa de Dispersión Correlación perfecta positiva r = 1

Mapa de Dispersión Correlación perfecta negativa r = -1

Mapa de Dispersión No hay correlación r = 0

COEFICIENTE DE DETERMINACIÓN: Es la forma primaria por la cual se puede medir la extensión o fuerza, de la asociación que existe entre 2 variables X y Y. r^2= a (y) + b (xy) - n ( y )^2 y - n ( y ) ^2 Dónde y = x/n

COEFICIENTE DE CORRELACIÓN: Sirve para medir la relación entre dos variables. Es la segunda medida que se pueda usar para describir lo bien que una variable se explica por otra. Cuando se está tratando de muestras, el coeficiente de correlación se denota por “1” y es la raíz cuadrada del coeficiente de determinación muestral .

Fórmula r = r^2 R = a (y) + b (xy) - n ( y )^2 y - n ( y ) ^2

APLICACIÓN: Al tabular los costos Unitarios y la producción de una empresa industrial durante el año anterior, se encontró el siguiente comportamiento: Estadística I COSTO POR PROD EN MILES UNIDAD DE UNIDADES Q 1.00 20 Q. 2.00 15 Q 3.00 12 Q. 4.00 11 Q. 5.00 7

1.) Con los datos tabulados de la contabilidad de la empresa se pide: Elaborar la representación gráfica sabiendo que la empresa desea estimar su producción. Estadística I

DATOS N = 5 x = 15 y = 65 x = 55 y = 939 xy = 165 DESARROLLO: x y Estadística I x y xy 1 20 400 2 15 4 225 30 3 12 9 144 36 11 16 121 44 5 7 25 49 35 65 55 939 165 DATOS N = 5 x = 15 y = 65 x = 55 y = 939 xy = 165

2). Encuentre la Ecuación de Regresión del comportamiento de la producción en función de los costos unitarios Estadística I 65 = 5 a + 15b 165 = 15 a + 55b 15/5 = 3 al cual se le cambia signo a negativo (-) y se usa como factor que multiplica a toda la ecuación de la siguiente forma: -195 = - 15 a - 45b (-3) Factor que multiplica a la Ec. 165 = 15 a + 55b -30 = 10b b = -30 = b= -3 10

Encontrar "a": 65 = 5 a + 15 (-3) Valor de “b” 65 = 5 a - 45 Estadística I 65 = 5 a + 15 (-3) Valor de “b” 65 = 5 a - 45 65 + 45 = 5 a 110 = 5a a = 110 = a = 22 5 La Ecuación de regresión de la Producción en función de los costos = Yc = 22 – 3x

3.) OBTENER "a" y "b" por Fórmula: Estadística I OBTENER “a” a = (x ) (y) – (x) (xy) n( x) - (x) a = ( 55 ) (65) – (15) (165) = 3575 – 2475 = 1100 5 (55) - (15) 275 - 225 50 a = 22

OBTENER “b” b = n xy - (x) (y) n( x ) - (x) Estadística I OBTENER “b” b = n xy - (x) (y) n( x ) - (x) b = 5 (165) – (15) (65) = 825 – 975 = -150 5 (55) - (15) 275 – 225 50 b = -3

4.)El Departamento de Ventas de la empresa solicita le indique qué número de unidades puede producir el presente año, si según estudios se considera que su costo unitario será igual a Q.3.75 Estadística I Y = a + bx Yc = 22 – 3 (3.75) Yc = 22 – 11.25 = 10.75

5.) CALCULAR EN ERROR ESTANDAR DE REGRESION; Estadística I Syx =  y - y.a - xy.b N Syx = 939 – ( 65) 22 –165 (-3) 5 Syx = 939 – 1430 + 495 = 4 5 5 Syx = 0.894427191

Explicación del Cálculo de la columna Yc Estadística I Yc Yc=22-3x (y-Yc) 19 22 - 3 (1) 1 16 22 - 3 (2) -1 13 22 - 3 (3) 10 22 - 3 (4) 7 22 - 3 (5) 65 xxxx 4

Otra forma: ___________ Syx =  (y- yc) N Syx = 4 5 Syx = 0.894427191 Estadística I ___________ Syx =  (y- yc) N Syx = 4 5 Syx = 0.894427191

Fórmula r = r o bien: r = a (y) + b (xy) - n ( y promedio) Estadística I r = r o bien: r = a (y) + b (xy) - n ( y promedio) y - n (y promedio)

APLICACIÓN: Con los datos del ejemplo que se ha desarrollado en el Análisis de Regresión, calcular la forma en que primariamente se relacionan las variables: Estadística I r = a (y) + b (xy) - n ( y promedio) y - n (y promedio) r = (22) 65 + (-3) 165 - 5 ( 13) 939 - 5 (13) r = 0.957447

A continuación calcular el grado de asociación entre las dos variables, (la fuerza o extensión en que se asocian las variables): Estadística I r = 0.957447 r = 0.978492 Por ser “r” mayor que cero se dice que la correlación es positiva.

Ejemplo de Regresión El gerente de ventas de Copier Sales of America que tiene una fuerza de ventas muy grande en Estados Unidos y Canadá, desea determinar si hay alguna relación entre el número de llamadas de ventas en un mes y el número de copiadoras vendidas en ese mes. El gerente selecciona una muestra aleatoria de 10 representantes de ventas y determina el número de llamadas de ventas que cada uno hizo el mes pasado y el número de copiadoras vendidas. La información muestral aparece a continuación:

Diagrama de Dispersión

Coeficiente de Correlación – Ejemplo en Excel

Coeficiente de Correlación - Ejemplo

Coeficiente de Correlación - Ejemplo ¿Cómo se interpreta una correlación de 0.759? Es positiva, por lo que se observa una relación directa Entre el número de llamadas de ventas y el número de copiadoras Vendidas.

Coeficiente de Correlación – Ejemplo con Excel No. Llamadas realizadas No. De Copiadoras Vendidas x y 20 30 40 60 10 50 70 Promedios 22 45