Descargar la presentación
La descarga está en progreso. Por favor, espere
1
Estadística Administrativa II
USAP Estadística Administrativa II 2016-1 Correlación
2
Regresión lineal simple
Conjunto de técnicas para hacer análisis de la relación entre dos variables
3
Regresión lineal simple
Diagrama de dispersión Análisis de correlación Análisis de regresión
4
Diagrama de dispersión
Técnica empírica para observar el comportamiento relacionado de dos variables.
5
Diagrama de dispersión
Es la presentación gráfica que muestra la relación de dos variables. Al estar involucradas dos variables, una de ellas se considera la independiente y la otra la dependiente.
6
Ejemplo . . . La Empresa MOTORSI da mantenimiento preventivo a vehículos turismo. Se tomó una muestra para evaluar si el valor del pago tiene alguna relación con la antigüedad de los clientes. Se tomó una muestra de 9 clientes que visitaron MOTORSI la semana pasada y a través de un diagrama de dispersión evaluar su comportamiento
7
. . .Ejemplo 𝑋 𝑌
8
Comando en Excel
9
Análisis de correlación
Es el estudio de la relación entre variables numéricas. Es la presentación numérica del diagrama de dispersión
10
Fases Coeficiente de correlación Coeficiente de determinación
Prueba de la importancia del coeficiente de correlación
11
Coeficiente de correlación
𝑟−𝑃𝑒𝑎𝑟𝑠𝑜𝑛 𝑟 Coeficiente de correlación “Medida de la fuerza de la relación lineal entre dos variables.” (Lind |Marchal |Wathen, 2008, p.462).
12
Características −1 , 1 𝑟=1 Correlación perfecta positiva
𝑟=−1 Correlación perfecta negativa 𝑟=0 No hay correlación 𝑟<0 Correlación negativa 𝑟> 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎
13
Tendencia Correlación positiva Correlación negativa
14
Fortaleza de la relación entre variables
15
Coeficiente de correlación
𝑟= 𝑋 𝑖 − 𝑋 𝑌 𝑖 − 𝑌 𝑛−1 𝑠 𝑋 𝑠 𝑌 𝑋 : Cada observación de la variable independiente. 𝑌 : Cada observación de la variable dependiente 𝑋 : Media aritmética muestral de variable independiente 𝑌 : Media aritmética muestral de variable dependiente 𝑠 𝑋 : Desviación estándar de variable independiente 𝑠 𝑌 : Desviación estándar de variable dependiente 𝑛 : Tamaño de la muestra
16
Ejemplo . . . En la empresa Sara se venden unidades de aire acondicionado; se ha observado que a mayor cantidad de llamadas de los vendedores durante el mes, mayor cantidad de compra de unidades de aire acondicionado. Se tomó una muestra de las ventas realizadas por 6 de los vendedores de planta y se quiere comparar la cantidad de llamadas realizadas durante el mes y las ventas facturadas.
17
. . . Ejemplo Trazar el diagrama de dispersión
Calcular el coeficiente de correlación Interpretar el resultado
18
. . . Ejemplo Diagrama de dispersión (20,30) está 2 veces
19
. . . Ejemplo Coeficiente de correlación (r) 𝑋 𝑙𝑙𝑎𝑚𝑎𝑑𝑎𝑠 = 140 6 =23.0
Media aritmética 𝑋 𝑙𝑙𝑎𝑚𝑎𝑑𝑎𝑠 = =23.0 𝑌 𝑣𝑒𝑛𝑡𝑎𝑠 = =45.0
20
. . . Ejemplo 𝑋 =23 𝑌 =45 Coeficiente de correlación (r)
Desviación estándar - variación
21
. . . Ejemplo Coeficiente de correlación (r)
Desviación estándar – variación cuadrada
22
. . . Ejemplo Coeficiente de correlación (r) 𝑋 𝑖 − 𝑋 2 =534
𝑋 𝑖 − 𝑋 2 =534 𝑌 𝑖 − 𝑌 2 =950 Coeficiente de correlación (r) Desviación estándar 𝑠 𝑋 = −1 = =10.3 𝑠 𝑌 = −1 = =13.8
23
. . . Ejemplo 𝑠 𝑋 =10.3 𝑠 𝑌 =13.8 Coeficiente de correlación (r)
𝑛=6 𝑟= 𝑋− 𝑋 𝑌− 𝑌 𝑛−1 𝑠 𝑋 𝑠 𝑌 𝑟= − 𝑟= 𝑟=0.702
24
La correlación entre ambas variables es positiva y fuerte.
. . . Ejemplo Coeficiente de correlación (r) 𝑟=0.702 La correlación entre ambas variables es positiva y fuerte. El hacer llamadas telefónicas a los posibles clientes nos llevó a un incremento en las ventas.
25
Coeficiente de determinación
“Proporción de la variación total en la variable dependiente Y que se explica, o contabiliza, por la variación en la variable independiente X.” (Lind |Marchal |Wathen, 2008, p.465).
26
Coeficiente de determinación
Resultado de elevar al cuadrado el coeficiente de correlación. Resultado interpretado en base a 100%. 𝑟 2
27
Existe una correlación del 49% entre ambas variables
Ejemplo . . . Calcular el coeficiente de determinación de una muestra de dos variables, cuyos coeficiente de correlación es 0.702 𝑟=0.702 𝑟 2 = 𝑟 2 =0.4928 Existe una correlación del 49% entre ambas variables
28
Prueba de la importancia del coeficiente de correlación
𝑟,𝑡 Prueba de la importancia del coeficiente de correlación Aunque un coeficiente de determinación sea alto, el resultado hace referencia a una muestra; para inferir sobre los resultados de la población, se recurre a la prueba de hipótesis; es decir, se somete el coeficiente de correlación a una prueba con el estadístico t
29
Estadístico de prueba t-student
𝑡= 𝑟 𝑛−2 1− 𝑟 2 𝑡 ≡𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑡−𝑆𝑡𝑢𝑑𝑒𝑛𝑡 𝑟≡𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑛≡𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
30
Objetivo Concluir que el coeficiente de correlación de la población es 0. 𝐻 0 :𝜌=0 𝐻 𝑎 :𝜌≠0 Con n-2 grados de libertad
31
Ejemplo . . . En la empresa Sara se venden unidades de aire acondicionado; se ha observado que a mayor cantidad de llamadas de los vendedores durante el mes, mayor cantidad de compra de unidades de aire acondicionado. Se tomó una muestra de las ventas realizadas por 6 de los vendedores de planta y se quiere comparar la cantidad de llamadas realizadas durante el mes y las ventas facturadas. El coeficiente de correlación obtenido fue de Se va a probar si existe relación entre las variables con un nivel de confianza del 95%.
32
. . . Ejemplo PASO 1: Hipótesis nula y alternativa 𝐻 0 :𝜌=0 𝐻 𝑎 :𝜌≠0 PASO 2: Nivel de significancia 𝛼=0.05 PASO 3: Estadístico de prueba 𝑡= 𝑟 𝑛−2 1− 𝑟 2
33
. . . Ejemplo 𝐻 0 :𝜌=0 2 𝑐𝑜𝑙𝑎𝑠 𝛼=0.05 𝑛=6 𝑔𝑙=6−2=4 𝑡=2.776
PASO 4: Regla de decisión 𝐻 0 :𝜌=0 2 𝑐𝑜𝑙𝑎𝑠 𝛼=0.05 𝑛=6 𝑔𝑙=6−2=4 𝑡=2.776
34
. . . Ejemplo 𝑡=2.776 PASO 5: Toma de decisión 𝑟=0.702 𝑛=6
𝑡= 𝑟 𝑛−2 1− 𝑟 2 𝑡= −2 1− 𝑡= La hipótesis nula se rechaza La correlación de la población no es 0 Sí existe relación entre las variables 𝑡=3.96
35
Prácticas Correlación
36
Práctica # 1 El departamento de producción de Celltronics International desea explorar la relación entre el número de empleados que trabajan en una línea de ensamble parcial y el número de unidades producido. Como experimento, se asignó a dos empleados al ensamble parcial. Su desempeño fue de 15 productos durante un periodo de una hora. Después, cuatro empleados hicieron los ensambles y su número fue de 25 durante un periodo de una hora. El conjunto completo de observaciones pareadas se muestra a continuación. Trazar diagrama de dispersión Calcular coeficiente de correlación Calcular coeficiente de determinación Probar la importancia del coeficiente de correlación. Nivel de confianza de 95%
37
Desarrollo práctica # 1 Diagrama de dispersión
38
Desarrollo práctica # 1 Coeficiente de correlación
𝑟= 𝑋 𝑖 − 𝑋 𝑌 𝑖 − 𝑌 𝑛−1 𝑠 𝑋 𝑠 𝑌 - Determinar las variables involucradas en el proceso
39
Desarrollo práctica # 1 Coeficiente de correlación
𝑟= 𝑋 𝑖 − 𝑋 𝑌 𝑖 − 𝑌 𝑛−1 𝑠 𝑋 𝑠 𝑌 - Calcular las medias aritméticas (n=5) 𝑋 = 15 5 =3 𝑌 = =24
40
Desarrollo práctica # 1 Coeficiente de correlación 𝑋 =3
𝑟= 𝑋 𝑖 − 𝑋 𝑌 𝑖 − 𝑌 𝑛−1 𝑠 𝑋 𝑠 𝑌 𝑌 =24 - Calcular las variaciones
41
Desarrollo práctica # 1 Coeficiente de correlación 𝑋 =3
𝑟= 𝑋 𝑖 − 𝑋 𝑌 𝑖 − 𝑌 𝑛−1 𝑠 𝑋 𝑠 𝑌 𝑌 =24 - Calcular las variaciones cuadradas d2
42
Desarrollo práctica # 1 Coeficiente de correlación 𝑋 =3
𝑟= 𝑋 𝑖 − 𝑋 𝑌 𝑖 − 𝑌 𝑛−1 𝑠 𝑋 𝑠 𝑌 𝑌 =24 - Calcular las variaciones cuadradas d2
43
Desarrollo práctica # 1 Coeficiente de correlación 𝑋 =3
𝑟= 𝑋 𝑖 − 𝑋 𝑌 𝑖 − 𝑌 𝑛−1 𝑠 𝑋 𝑠 𝑌 𝑌 =24 - Calcular las variaciones cuadradas d2
44
Desarrollo práctica # 1 Coeficiente de correlación 𝑋 =3
𝑟= − 𝑋 𝑌− 𝑌 𝑛−1 𝑠 𝑋 𝑠 𝑌 𝑌 =24 - Calcular las variaciones cuadradas d2
45
Desarrollo práctica # 1 Coeficiente de correlación
𝑟= 𝑋 𝑖 − 𝑋 𝑌 𝑖 − 𝑌 𝑛−1 𝑠 𝑋 𝑠 𝑌 - Calcular las desviaciones estándar (s) 𝑋 𝑖 −3 𝑌 𝑖 −24 =70 𝑠 𝑋 = 𝑋 𝑖 − 𝑛−1 = =1.6 𝑠 𝑋 = 𝑌 𝑖 − 𝑛−1 = =11.9
46
Desarrollo práctica # 1 Coeficiente de correlación
𝑋 𝑖 −3 𝑌 𝑖 −24 =70 𝑟= 𝑋 𝑖 − 𝑋 𝑌 𝑖 − 𝑌 𝑛−1 𝑠 𝑋 𝑠 𝑌 𝑠 𝑋 =1.6 𝑠 𝑋 =11.9 𝑟= 70 5− n=5 𝑟=0.9272 Hay una correlación positiva fuerte entre ambas variables
47
Parece que existe una correlación del 86% entre ambas variables
Desarrollo práctica # 1 Coeficiente de Determinación (r2) 𝑟=0.9272 𝑟 2 =0.8597 Parece que existe una correlación del 86% entre ambas variables
48
Desarrollo práctica # 1 Probar la importancia del coeficiente de correlación. Nivel de confianza de 95% Paso 1. Hipótesis nula y alternativa 𝐻 0 :𝜌=0 𝐻 𝑎 :𝜌≠0 Paso 2. Nivel de significancia 𝛼=0.05 Paso 3: Estadístico de prueba 𝑡= 𝑟 𝑛−2 1− 𝑟 2
49
Desarrollo práctica # 1 𝐻 0 :𝜌=0 2 𝑐𝑜𝑙𝑎𝑠 𝛼=0.05 𝑛=5 𝑔𝑙=5−2=3 𝑡=3.182
Paso 4: Regla de decisión 𝐻 0 :𝜌=0 2 𝑐𝑜𝑙𝑎𝑠 𝛼=0.05 𝑛=5 𝑔𝑙=5−2=3 𝑡=3.182
50
Desarrollo práctica # 1 𝑡=2.776 PASO 5: Toma de decisión 𝑟=0.9272 𝑛=5
𝑡= 𝑟 𝑛−2 1− 𝑟 2 𝑡= −2 1− 𝑡= La hipótesis nula se rechaza La correlación de la población no es 0 Sí existe relación entre las variables 𝑡=9.705
51
Práctica # 2 Un economista del Banco Central está preparando un estudio sobre el comportamiento del consumidor. Recolectó datos para determinar si existe una relación entre el ingreso del consumidor y sus niveles de consumo. Los resultados fueron los siguientes: Trazar diagrama de dispersión Calcular coeficiente de correlación Calcular coeficiente de determinación Probar la importancia del coeficiente de correlación. Nivel de confianza de 95%
52
Desarrollo práctica # 2 Diagrama de dispersión
53
Desarrollo práctica # 2 Coeficiente de correlación
𝑟= 𝑋 𝑖 − 𝑋 𝑌 𝑖 − 𝑌 𝑛−1 𝑠 𝑋 𝑠 𝑌 Determinar las variables involucradas en el proceso
54
Desarrollo práctica # 2 Coeficiente de correlación
Calcular las medias aritméticas 𝑟= 𝑋 𝑖 − 𝑋 𝑌 𝑖 − 𝑌 𝑛−1 𝑠 𝑋 𝑠 𝑌 𝑋 = =19.9=20 𝑌 = =12.9=13
55
Desarrollo práctica # 2 Coeficiente de correlación 𝑋 =20 𝑌 =13
- Calcular las variaciones
56
Desarrollo práctica # 2 Coeficiente de correlación
- Calcular las variaciones cuadradas d2
57
Desarrollo práctica # 2 Coeficiente de correlación
- Calcular las variaciones cuadradas d2
58
Desarrollo práctica # 2 Coeficiente de correlación
- Calcular las variaciones cuadradas d2
59
Desarrollo práctica # 2 Coeficiente de correlación
- Resumen de variaciones cuadradas d2
60
Desarrollo práctica # 2 Coeficiente de correlación 𝑋 =20
𝑟= 𝑋 𝑖 − 𝑋 𝑌 𝑖 − 𝑌 𝑛−1 𝑠 𝑋 𝑠 𝑌 𝑌 =13 - Calcular las desviaciones estándar (s) 𝑋 𝑖 −20 𝑌 𝑖 −13 =468.1 𝑠 𝑋 = 𝑋 𝑖 − 𝑛−1 = =9.7 𝑠 𝑋 = 𝑌 𝑖 − 𝑛−1 = =5.9
61
Desarrollo práctica # 2 Coeficiente de correlación
𝑋 𝑖 −20 𝑌 𝑖 −13 =468.1 𝑟= 𝑋 𝑖 − 𝑋 𝑌 𝑖 − 𝑌 𝑛−1 𝑠 𝑋 𝑠 𝑌 𝑠 𝑋 =9.7 𝑠 𝑋 =5.9 𝑟= − n=10 𝑟=0.9174 Hay una correlación positiva fuerte entre ambas variables
62
Parece que existe una correlación del 84% entre ambas variables
Desarrollo práctica # 2 Coeficiente de Determinación (r2) 𝑟=0.9174 𝑟 2 =0.8417 Parece que existe una correlación del 84% entre ambas variables
63
Desarrollo práctica # 2 Probar la importancia del coeficiente de correlación. Nivel de confianza de 95% Paso 1. Hipótesis nula y alternativa 𝐻 0 :𝜌=0 𝐻 𝑎 :𝜌≠0 Paso 2. Nivel de significancia 𝛼=0.05 Paso 3: Estadístico de prueba 𝑡= 𝑟 𝑛−2 1− 𝑟 2
64
Desarrollo práctica # 2 𝐻 0 :𝜌=0 2 𝑐𝑜𝑙𝑎𝑠 𝛼=0.05 𝑛=10 𝑔𝑙=10−2=8 𝑡=2.306
Paso 4: Regla de decisión 𝐻 0 :𝜌=0 2 𝑐𝑜𝑙𝑎𝑠 𝛼=0.05 𝑛=10 𝑔𝑙=10−2=8 𝑡=2.306
65
Desarrollo práctica # 2 𝑡=2.306 Paso 5: Toma de decisión 𝑟=0.9174 𝑛=10
𝑡= 𝑟 𝑛−2 1− 𝑟 2 𝑡= −2 1− 𝑡= La hipótesis nula se rechaza La correlación de la población no es 0 Sí existe relación entre las variables 𝑡=18.446
66
Fin de la presentación Muchas gracias
Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadística Aplicada a los Negocios y la Economía. México: McGrawHill David M. Levine, Timothy C. Krehbiel, Mark L. Berenson Estadística para Administración. (4° edición). Naucalpan de Juárez, México.: Pearson Prentice Hall
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.