La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Regresión lineal y correlación DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN 2.

Presentaciones similares


Presentación del tema: "Regresión lineal y correlación DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN 2."— Transcripción de la presentación:

1

2 Regresión lineal y correlación

3 DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN 2

4 Introducción Si sobre una población de niños entre 0 y 6 años, estudiamos las variables peso y estatura, esperamos que en general ocurra que a mayor estatura también encontremos mayor peso, aunque es posible que en algunos pocos casos no ocurra así. Vemos que existe una relación entre las dos variables, aunque no es funcional, o sea, no puedo determinar con exactitud el peso que corresponderá a cada talla. En este tema trataremos de describir y medir este tipo de relaciones, que aparecen en gran cantidad de problemas. 3

5 DISTRIBUCIONES BIDIMENSIONALES Cuando sobre una población estudiamos simultáneamente los valores de dos variables estadísticas, el conjunto de los pares de valores correspondientes a cada individuo se denomina distribución bidimensional. 4

6 Ejemplo 1: Las notas de 10 alumnos en Matemáticas y en Lengua vienen dadas en la siguiente tabla: 5

7 6

8 7

9 Análisis de correlación El análisis de correlación es un grupo de técnicas estadísticas usadas para medir la fuerza de la asociación entre dos variables. Un diagrama de dispersión es una gráfica que representa la relación entre dos variables. La variable dependiente es la variable que se predice o calcula. La variable independiente proporciona las bases para el cálculo. Es la variable de predicción.

10 El coeficiente de correlación, r El coeficiente de correlación (r) es una medida de la intensidad de la relación lineal entre dos variables. Requiere datos de nivel de razón. Puede tomar cualquier valor de -1.00 a 1.00. Los valores de -1.00 o 1.00 indican la correlación perfecta y fuerte. Los valores cerca de 0.0 indican la correlación débil. Los valores negativos indican una relación inversa y los valores positivos indican una relación directa.

11 Correlación negativa perfecta 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 X Y

12 Correlación positiva perfecta 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 X Y

13 Correlación cero 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 Y X

14 Correlación positiva fuerte Y X 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10

15 Fórmula para r (Coeficiente de Correlación) -1 -0.75 - 0.5 0 0.5 0.75 1 Perfecta Fuerte Moderada Nula Moderada Fuerte Perfecta inversa directa

16 Fórmula para r Calculamos el coeficiente de correlación de las fórmulas siguientes.

17 Características de la Correlación El coeficiente de correlación (r) es una medida de la intensidad de la relación entre dos variables. (puntos versus salario) Requiere datos con escala de intervalo o de razón (variables). Puede tomar valores entre -1.00 y 1.00. (-100% y 100%) Valores de -1.00 o 1.00 indican correlación fuerte y perfecta. Valores cercanos a 0 indican correlación débil. Valores negativos indican una relación inversa y valores positivos indican una relación directa. Interpretación Este coeficiente de correlación nos indica la medida en que están relacionados las variables. Si es muy cercano a 100% la relación es lineal, fuerte y directa. Es decir que a medida que aumenta una también aumenta la otra Si es cercana a 0, no significa ausencia de relación, sino que podría existir otro tipo de relación distinta a la lineal ( parabólica, exponencial, logarítmica)

18 Coeficiente de determinación El coeficiente de determinación (r 2 ) es la proporción de la variación total en la variable dependiente (y) que se explica por la variación en la variable independiente (x). Es el cuadrado del coeficiente de correlación. Su rango es de 0 a 1. No da ninguna información sobre la dirección de la relación entre las variables.

19 Ejemplo 1 Juan Escobedo, presidente de la sociedad de alumnos de la Universidad de Toledo, se ocupa de estudiar el costo de los libros de texto. Él cree que hay una relación entre el número de páginas en el texto y el precio de venta del libro. Para proporcionar una prueba, selecciona una muestra de ocho libros de texto actualmente en venta en la librería. Dibuje un diagrama de dispersión. Compruebe el coeficiente de correlación.

20 Libro Páginas Precio ($) Intr. a la Historia50084 Álgebra70075 Intr.a la Psicología80099 Intr. a la Sociología60072 Mercadotecnia40069 Intr. a la Biología50081 Fund. de Jazz60063 Intr.a la Enfermería80093 Ejemplo 1 (Continuación)

21

22 Libro Páginas Precio ($) X Y XY X 2 Y 2 Intr. a la Historia500 84 42,000 250,000 7,056 Álgebra700 75 52,500 490,000 5,625 Intr. a la Psicología800 99 79,200 640,000 9,801 Intr. a la Sociología600 72 43,200 360,000 5,184 Mercadotecnia400 69 27,600 160,000 4,761 Intr. a la Biología500 81 40,500 250,000 6,561 Fund. de Jazz600 63 37,800 360,000 3,969 Intr. a la Enfermería800 93 74,400 640,000 8,649 Total 4,900 636 397,200 3,150,000 51,606 Ejemplo 1 (Continuación)

23

24 La correlación entre el número de páginas y el precio de venta del libro es 0.614. Esto indica una asociación moderada entre las variables. Pruebe la hipótesis de que no hay correlación en la población. Utilice un nivel de la significancia del.02. Paso 1: H 0 : La correlación en la población es cero. H 1 : La correlación en la población no es cero. Paso 2: H 0 es rechazada si t>3.143 o si t<-3.143. Hay 6 grados de libertad, encontrados cerca. n – 2 = 8 – 2 = 6. Ejemplo 1 (Continuación)

25 Paso 3: Para encontrar el valor del estadístico de prueba, utilizamos: Paso 4: H 0 no se rechaza. No podemos rechazar la hipótesis de que no hay correlación en la población. La cantidad de asociación puede ser debido al azar. Ejemplo 1 (Continuación)

26 Análisis de regresión En análisis de regresión utilizamos la variable independiente (X) para estimar la variable dependiente (Y). La relación entre las variables es lineal. Ambas variables deben ser por lo menos escala del intervalo. El criterio de mínimos cuadrados se utiliza para determinar la ecuación. Este es el término (Y – Y') 2

27 Análisis de regresión La ecuación de regresión es: Y' = a + bX, donde: Y' es el valor pronosticado de la variable Y para un valor seleccionado de X. a es la ordenada de la intersección con el eje Y cuando X = 0. Es el valor estimado de Y cuando X=0 b es la pendiente de la recta, o el cambio promedio en Y' para cada cambio de una unidad en X. el principio de mínimos cuadrados se utiliza para obtener a y b.

28 Análisis de regresión El principio de mínimos cuadrados se utiliza para obtener a y b. Las ecuaciones para determinar a y b son:

29 Desarrolle una ecuación de regresión para la información dada en el Ejemplo 1 que se puede utilizar para estimar el precio de venta basado en el número de páginas. Ejemplo 2 (Continuación)

30 La ecuación de regresión es: Y' = 48.0 +.05143X La ecuación cruza al eje Y en $48. Un libro sin las páginas costaría $48. La pendiente de la línea es.05143. El costo de cada página adicional es de cinco céntimos. El signo del valor de b y el signo del valor de r serán siempre iguales. Ejemplo 2 (Continuación)

31 Podemos utilizar la ecuación de regresión para estimar valores de Y. El precio de venta estimado de un libro de 800 páginas es $89.14, encontrado por Ejemplo 2 (Continuación)

32 El error estándar de estimación El error estándar de estimación mide la dispersión de los valores observados alrededor de la línea de regresión. Las fórmulas que se utilizan para comprobar el error estándar son:

33 Encuentre el error estándar de estimación para el problema que implica el número de páginas en un libro y el precio de venta. Ejemplo 3

34 Suposiciones subyacentes en el análisis de regresión lineal Para cada valor de X, hay un grupo de valores de Y, y estos valores de Y se distribuyen normalmente. Las medias de estas distribuciones normales de valores Y, caen todas en la recta de regresión. Las desviaciones estándar de estas distribuciones normales son iguales. Los valores de Y son estadísticamente independendientes. Esto significa que en la selección de una muestra, los valores de Y elegidos para un valor particular de X no dependen de los valores de Y de ningún otro valor de X.

35 Intervalo de confianza El intervalo de confianza para el valor medio de Y para un valor dado de X está dado por:

36 Intervalo de predicción El intervalo de predicción para un valor individual de Y para un valor dado de X se da por:

37 Resumir los resultados: El precio de venta estimado para un libro con 800 páginas es $89.14. El error estándar de estimación es $10.41. El intervalo de confianza de 95% para todos los libros con 800 páginas es $89.14+-$15.31. Esto significa que los límites están entre $73.83 y $104.45. El intervalo de predicción de 95% para un libro particular con 800 páginas es $89.14+-$29.72. Esto significa que los límites están entre $59.42 y $118.86. Estos resultados aparecen en la siguiente salida de MINITAB. Ejemplo 3 (Continuación)

38 Regression Analysis: Price versus Pages The regression equation is Price = 48.0 + 0.0514 Pages Predictor Coef SE Coef T P Constant 48.00 16.94 2.83 0.030 Pages 0.05143 0.02700 1.90 0.105 S = 10.41 R-Sq = 37.7% R-Sq(adj) = 27.3% Analysis of Variance Source DF SS MS F P Regression 1 393.4 393.4 3.63 0.105 Residual Error 6 650.6 108.4 Total 7 1044.0 Predicted Values for New Observations New Obs Fit SE Fit 95.0% CI 95.0% PI 1 89.14 6.26 ( 73.82, 104.46) ( 59.41, 118.88) Ejemplo 3 (Continuación)

39 Análisis de Correlación y Regresión Lineal Simple.

40 Dibujar un diagrama de dispersión. Entender e interpretar los términos variable dependiente y variable independiente. Calcular e interpretar el coeficiente de correlación, el coeficiente de determinación y el error estándar de la estimación. Realizar una prueba de hipótesis para determinar si existe una diferencia entre las medias de bloques. Calcular la recta de regresión de mínimo cuadrados e interpretar la pendiente y las intercepciones. Construir e interpretar intervalos de confianza e intervalos de predicción para la variable independiente. Establecer e interpretar una tabla de ANOVA Objetivos del Curso

41 Método Estadístico de Correlación y Regresión lineal simple Pasos: 1) Elaborar el diagrama de dispersión. 2) Calcular el coeficiente de correlación. 3) Realizar el Análisis de Regresión. 4) Verificar la línea de tendencia. Se determina el valor de la recta y = a + bx, calculada mediante la fórmula de los mínimos cuadrados obteniendo la línea que mejor se ajuste a la nube de puntos que representa dos variables: una dependiente y una independiente.

42 Generalidades del Análisis Análisis de correlación: se usa un grupo de técnicas estadísticas para medir la fuerza de la relación (correlación) entre dos variables. Diagrama de dispersión: gráfica que describe la relación entre las dos variables de interés. Variable dependiente: la variable que se pronostica o estima. Variable independiente: la variable que proporciona la base para la estimación. Es la variable predictora.

43 Fórmula para r (Coeficiente de Correlación) -1 -0.75 - 0.5 0 0.5 0.75 1 Perfecta Fuerte Moderada Nula Moderada Fuerte Perfecta inversa directa

44 Características de la Correlación El coeficiente de correlación (r) es una medida de la intensidad de la relación entre dos variables. (puntos versus salario) Requiere datos con escala de intervalo o de razón (variables). Puede tomar valores entre -1.00 y 1.00. (-100% y 100%) Valores de -1.00 o 1.00 indican correlación fuerte y perfecta. Valores cercanos a 0 indican correlación débil. Valores negativos indican una relación inversa y valores positivos indican una relación directa. Interpretación Este coeficiente de correlación nos indica la medida en que están relacionados las variables. Si es muy cercano a 100% la relación es lineal, fuerte y directa. Es decir que a medida que aumenta una también aumenta la otra Si es cercana a 0, no significa ausencia de relación, sino que podría existir otro tipo de relación distinta a la lineal ( parabólica, exponencial, logarítmica)

45 Correlación Negativa Perfecta 0 1 2 3 4 5 6 7 8 9 10 10 9 8 7 6 5 4 3 2 1 0 X Y

46 Correlación Positiva Perfecta 0 1 2 3 4 5 6 7 8 9 10 10 9 8 7 6 5 4 3 2 1 0 X Y

47 Correlación Cero 0 1 2 3 4 5 6 7 8 9 10 10 9 8 7 6 5 4 3 2 1 0 X Y

48 Correlación Positiva Fuerte 0 1 2 3 4 5 6 7 8 9 10 10 9 8 7 6 5 4 3 2 1 0 X Y

49 Coeficiente de Determinación R= r 2 El coeficiente de determinación, r 2 es la proporción de la variación total en la variable dependiente Y que está explicada por, o se debe a la variación en la variable independiente X. El coeficiente de determinación es el cuadrado del coeficiente de correlación, y toma valores de 0 a 1. (0% a 100%) Mientras más alto más explicativa es la variable independiente.

50 Ejemplo 1 Dibujar el diagrama de dispersión El diagrama de dispersión nos indica que existe una relación lineal directa y fuerte entre los puntajes y los salarios.

51 9 (1,419,810.5) – (3,305)(3,688.5) 9 (1,337,969) - (3,305) 2 9 (1,549,584.25) - (3,688.5) 2 r = = 0.95 Tabla 2.

52 Ejemplo 2 José, presidente de la sociedad de estudiantes de la Facultad de Economía de la Universidad de Panamá, está preocupado por el costo de los libros. Para tener un panorama del problema elige una muestra de 8 libros de venta en la librería. Decide estudiar la relación entre el número de páginas del libro y el costo. Calcule el coeficiente de correlación. 12-11

53 Ejemplo 2 continuación 12-12

54 Ejemplo 2 PRUEBA DE CORRELACION POBLACIONAL r =.614 (verifique) Pruebe la hipótesis de que no existe correlación en la población. Use.02 de nivel de significancia. H 0 la correlación en la población es cero. H 1 la correlación en la población es distinta de cero. H 0 se rechaza si tc > 3.143 o si tc < -3.143, gl = 6,  =.02 12-13

55 Ejemplo 2 PRUEBA DE CORRELACION POBLACIONAL El estadístico de prueba es tc = 1.9055, calculado por: con (n - 2) grados de libertad H 0 no se rechaza 12-14

56 Example

57 Correlation Coefficient - Example

58 Excel Example

59 How do we interpret a correlation of 0.759? First, it is positive, so we see there is a direct relationship between the number of sales calls and the number of copiers sold. The value of 0.759 is fairly close to 1.00, so we conclude that the association is strong. Example

60 Coefficient of Determination (r 2 ) - Example The coefficient of determination r 2, is 0.576, found by (0.759) 2 This is a proportion or a percent; we can say that 57.6 percent of the variation in the number of copiers sold is explained, or accounted for, by the variation in the number of sales calls.

61 Significancia del Coeficiente de Correlación Prueba H 0 :  = 0 (La correlación en la población es 0) H 1 :  ≠ 0 (La correlación en la población no es 0) Rechazo H 0 si: t > t  /2,n-2 o t < -t  /2,n-2

62 H 0 :  = 0 ( La correlación en la población es 0) H 1 :  ≠ 0 ( La correlación en la población no es 0 ) Rechazo H 0 si: t > t  /2,n-2 o t < -t  /2,n-2 t > t 0.025,8 o t < -t 0.025,8 t > 2.306 o t < -2.306

63 El valor calculado de t (3.297) está en la región de rechazo de la hipótesis nula por lo que se rechaza que no hay relación entre las llamadas y las ventas realizadas.

64 El Análisis de Regresión Propósito: determinar la ecuación de regresión; se usa para predecir el valor de la variable dependiente (Y) basado en la variable independiente (X). Procedimiento: seleccionar una muestra de la población y enumerar los datos por pares para cada observación; dibujar un diagrama de dispersión para visualizar la relación; determinar la ecuación de regresión.

65 Supuestos Básicos de la Regresión Lineal Para cada valor de X, existe un grupo de valores de Y que tienen una distribución normal. Las medias de estas distribuciones normales de valores de Y deben estar sobre la recta de regresión. Las desviaciones estándar de estas distribuciones normales son iguales. Los valores de Y son estadísticamente independientes. Es decir, que en la selección de una muestra, los valores elegidos de Y para un valor particular de X no depende de los valores de Y para otro valor de X.

66 Análisis de Regresión Lineal La ecuación de regresión: Y i ’= a + b X i donde: Y i ’ es el valor promedio pronosticado de Y para cualquier valor de X i. a es la intercepción en Y, o el valor estimado de Y cuando X = 0 b es la pendiente de la recta, o cambio promedio en Y’ por cada cambio de una unidad en X. (cambio promedio en salario por cada unidad de cambio en puntos) Se usa el principio de mínimos cuadrados para obtener los parámetros a y b:

67 Del Ejemplo 1 9 (1,419,810.5) – (3,305)(3,688.5) 587,802 9 (1,337,969) - (3,305) 2 1,118,696 b = = = 0.5254 (3,688.5) - 0.5254 (3,305) 9 9 a.= Utilizando las fórmulas para los parámetros y reemplazando los valores obtenidos en la tabla 2. Calculamos: = 216.89 La ecuación de regresión: Y i ’= a + b X i Salario = 216.89 + 0.52 Puntos Sirve de base referencial para estimar el salario en función del puntaje del puesto de trabajo para este grupo en específico.

68 Para el Ejemplo 2 Desarrollar una ecuación de regresión para la información dada en el Ejemplo 2 que pueda usarse para estimar el precio de venta basado en el número de páginas. Por el principio de mínimos cuadrados, b = 0.01714 y a = 16.00175 Y’ = 16.00175 + 0.01714X 12-17

69 Error Estándar de la Estimación El error estándar de la estimación mide la dispersión de los valores observados alrededor de la recta de regresión. Fórmulas usadas para calcular el error estándar:

70 Intervalo de Confianza El intervalo de confianza para el valor medio de Y para un valor dado de X está definido por: 12-20

71 Intervalo de predicción El intervalo de predicción para un valor individual de Y para un valor dado de X se define por: 12-21

72 Ejemplo Use la información del Ejemplo 2: calcule el error estándar de la estimación: desarrolle un intervalo de confianza de 95% para los libros de 650 páginas: [24.03, 30.25]. Verifique desarrolle un intervalo de predicción de 95% para un libro de 650 páginas: [18.09, 36.19] Verifique 12-22

73 Principio de los Mínimos Cuadrados Ordinarios

74 Regression Equation - Example Recall the example involving Copier Sales of America. The sales manager gathered information on the number of sales calls made and the number of copiers sold for a random sample of 10 sales representatives. Use the least squares method to determine a linear equation to express the relationship between the two variables. What is the expected number of copiers sold by a representative who made 20 calls?

75 Finding the Regression Equation - Example

76 Computing the Estimates of Y Step 1 – Using the regression equation, substitute the value of each X to solve for the estimated sales

77 Plotting the Estimated and the Actual Y’s

78 The Standard Error of Estimate The standard error of estimate measures the scatter, or dispersion, of the observed values around the line of regression The formulas that are used to compute the standard error:

79 Standard Error of the Estimate - Example Recall the example involving Copier Sales of America. The sales manager determined the least squares regression equation is given below. Determine the standard error of estimate as a measure of how well the values fit the regression line.

80 Differences between Actual Y – Estimated Y

81 Standard Error of the Estimate - Excel

82 Confidence Interval and Prediction Interval Estimates of Y A confidence interval reports the mean value of Y for a given X. A prediction interval reports the range of values of Y for a particular value of X.

83 Confidence Interval Estimate - Example Determine a 95 percent confidence interval for all sales representatives who make 25 calls.

84 Step 1 – Compute the point estimate of Y In other words, determine the number of copiers we expect a sales representative to sell if he or she makes 25 calls. Confidence Interval Estimate - Example

85 Step 2 – Find the value of t To find the t value, we need to first know the number of degrees of freedom. In this case the degrees of freedom is n - 2 = 10 – 2 = 8. We set the confidence level at 95 percent. To find the value of t, move down the left-hand column of Appendix B.2 to 8 degrees of freedom, then move across to the column with the 95 percent level of confidence. The value of t is 2.306. Confidence Interval Estimate - Example

86

87 Step 4 – Use the formula above by substituting the numbers computed in previous slides Thus, the 95 percent confidence interval for the average sales of all sales representatives who make 25 calls is from 40.9170 up to 56.1882 copiers.

88 Prediction Interval Estimate - Example Determine a 95 percent prediction interval for Sheila Baker, a West Coast sales representative who made 25 calls.

89 Step 1 – Compute the point estimate of Y In other words, determine the number of copiers we expect a sales representative to sell if he or she makes 25 calls. Prediction Interval Estimate - Example

90 Step 2 – Using the information computed earlier in the confidence interval estimation example, use the formula above. Prediction Interval Estimate - Example If Sheila Baker makes 25 sales calls, the number of copiers she will sell will be between about 24 and 73 copiers.

91 Transforming Data The coefficient of correlation describes the strength of the linear relationship between two variables. It could be that two variables are closely related, but there relationship is not linear. Be cautious when you are interpreting the coefficient of correlation. A value of r may indicate there is no linear relationship, but it could be there is a relationship of some other nonlinear or curvilinear form.

92 Transforming Data - Example On the right is a listing of 22 professional golfers, the number of events in which they participated, the amount of their winnings, and their mean score for the 2004 season. In golf, the objective is to play 18 holes in the least number of strokes. So, we would expect that those golfers with the lower mean scores would have the larger winnings. To put it another way, score and winnings should be inversely related. In 2004 Tiger Woods played in 19 events, earned $5,365,472, and had a mean score per round of 69.04. Fred Couples played in 16 events, earned $1,396,109, and had a mean score per round of 70.92. The data for the 22 golfersollows.

93 Scatterplot of Golf Data The correlation between the variables Winnings and Score is 0.782. This is a fairly strong inverse relationship. However, when we plot the data on a scatter diagram the relationship does not appear to be linear; it does not seem to follow a straight line.

94 What can we do to explore other (nonlinear) relationships? One possibility is to transform one of the variables. For example, instead of using Y as the dependent variable, we might use its log, reciprocal, square, or square root. Another possibility is to transform the independent variable in the same way. There are other transformations, but these are the most common.

95 In the golf winnings example, changing the scale of the dependent variable is effective. We determine the log of each golfer’s winnings and then find the correlation between the log of winnings and score. That is, we find the log to the base 10 of Tiger Woods’ earnings of $5,365,472, which is 6.72961. Transforming Data - Example

96 Scatter Plot of Transformed Y

97 Linear Regression Using the Transformed Y

98 Using the Transformed Equation for Estimation Based on the regression equation, a golfer with a mean score of 70 could expect to earn: The value 6.4372 is the log to the base 10 of winnings. The antilog of 6.4372 is 2.736 So a golfer that had a mean score of 70 could expect to earn $2,736,528.

99 Taller Aplicación de herramientas en Excel para el análisis de regresión y correlación lineal.

100 EJEMPLO DE REGRESIÓN LINEAL SIMPLE CO3314 – ESTADÍSTICA II ZORAIDA MARTÍNEZ

101 OBJETIVOS  HALLAR PARÁMETROS PARA ESTIMACIÓN DEL MODELO  CONJUNTO DE DATOS  FÓRMULAS DE MODELOS Y ESTIMACÓN DE PARÁMETROS  CÁLCULO DE PARÁMETRÓS

102 PROBLEMA

103 DATOS

104 MODELO

105 PARÁMETROS

106 CUENTAS 1

107 CUENTAS 2

108 CUENTAS 3

109 CUENTAS 4

110 MODELO ESTIMADO

111 Introducción Estudiaremos dicho grado de relación entre dos variables en lo que llamaremos análisis de correlación. Para representar esta relación utilizaremos una representación gráfica llamada diagrama de dispersión y, finalmente, estudiaremos un modelo matemático para estimar el valor de una variable basándonos en el valor de otra, en lo que llamaremos análisis de regresión.

112 Objetivos de Estudio Aprender a calcular la correlación entre dos variables Saber dibujar un diagrama de dispersión Representar la recta que define la relación lineal entre dos variables Saber estimar la recta de regresión por el método de mínimos cuadrados e interpretar su ajuste

113 Objetivos de Estudio Realizar inferencia sobre los parámetros de la recta de regresión Construir e interpretar intervalos de confianza e intervalos de predicción para la variable dependiente Realizar una prueba de hipótesis para determinar si el coeficiente de correlación es distinto de cero CONOCIMIENTOS PREVIOS

114 Definición El análisis de correlación es el estudio de la relación entre variables. Grupo de técnicas para medir la asociación entre dos variables

115 Ejemplo

116 Gasto de PublicidadVentas en Millones 30200 50400 50800 601200 60900

117 Ejercicios Cinco niños de 2, 3, 5, 7 y 8 años de edad pesan, respectivamente, 14, 20, 32, 42 y 44 kilos. Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son: A partir de los siguientes datos referentes a horas trabajadas en un taller (X), y a unidades producidas (Y), determinar la recta de regresión de Y sobre X, el coeficiente de correlación lineal e interpretarlo.

118 Tipos de Correlación


Descargar ppt "Regresión lineal y correlación DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN 2."

Presentaciones similares


Anuncios Google