La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

CORRELACIÓN CAP 8 DE Peña y Romo.

Presentaciones similares


Presentación del tema: "CORRELACIÓN CAP 8 DE Peña y Romo."— Transcripción de la presentación:

1 CORRELACIÓN CAP 8 DE Peña y Romo

2 Objetivo: es estudiar la relación entre dos variables continuas
Nos proponemos estudiar el grado de dependencia lineal entre ellas mediante el coeficiente de correlación. Distribución conjunta de dos variables continuas. Variable bidimensional: Es cuando en cada elemento de una población se miden dos variables distintas.

3 Objetivo: es estudiar la relación entre dos variables continuas
hijos padres menor a 160 160 a 164 165 a 169 170 a 174 175 a 179 180 a 184 185 a 189 190 o mas menor 160 4 1 9 2 7 10 3 22 20 25 61 18 26 30 19 98 17 66 5 15 8 47 6 51 76 77 64 16 312

4 Distribución conjunta
Unidad de análisis: la familia Variable x = estatura de los padres Variable y= estatura de los hijos N = cantidad de pares de datos (x1, y1), (x2, y2), …, (xn,yn) Distinguimos: distribución conjunta (absoluta o relativa), marginales (de x e y) y condicionales.

5 Distribución conjunta absoluta y relativa
hijos padres menor a 160 160 a 164 165 a 169 170 a 174 175 a 179 180 a 184 185 a 189 190 o mas menor 160 4 1 9 2 7 10 3 22 20 25 61 18 26 30 19 98 17 66 5 15 8 47 6 51 76 77 64 16 312 hijos padres menor a 160 160 a 164 165 a 169 170 a 174 175 a 179 180 a 184 185 a 189 190 o mas menor 160 0,01 0,00 0,03 0,02 0,07 0,06 0,08 0,20 0,10 0,31 0,05 0,21 0,15 0,16 0,24 0,25 1

6 Distribución condicionada
Ej: La distribución de la estatura de los jóvenes condicionada a que la estatura de los padres esta entre 165 y 169 cm. Hay 61 jóvenes que cumplen esa condición: menor a 160 160 a 164 165 a 169 170 a 174 175 a 179 180 a 184 185 a 189 190 o mas total 3 20 25 9 4 61 0,049 0,328 0,41 0,148 0,066 1

7 Gráficas: diagramas de dispersión
Este diagrama se construye representando cada elemento observado por un punto en el plano de manera que sus coordenadas sobre los dos ejes cartesianos sean los valores que toman las dos variables en ese elemento. Padre 1,7 1,77 1,68 1,75 1,8 1,69 1,72 1,71 1,73 Hijo 1,74 1,78 1,76

8 DIAGRAMA DE DISPERSIÓN
ESTATURA HIJOS ESTATURA DE LOS PADRES

9 COVARIANZA La relación entre dos variables puede expresarse numéricamente usando la covarianza: “Es una medida de asociación lineal entre dos variables que resume la información existente en un diagrama de dispersión”

10

11 Interpretación de la covarianza
Si Sxy > 0 hay dependencia directa (positiva), es decir, a grandes valores de x corresponden grandes valores de y. Si Sxy = 0 Una covarianza 0 se interpreta como la no existencia de una relación lineal entre las dos variables estudiadas. Si Sxy < 0 hay dependencia inversa o negativa, es decir, a grandes valores de x corresponden pequeños valores de y. En otras palabras la covarianza trata de explicar que tan relacionadas se encuentran dos variables entre sí, que tanto se mueve una cuando la otra se mueve otro tanto. Ejemplo, si la variable X se mueve 1, supongamos que la variable Y se mueve 2, entonces podemos decir que la variable Y se mueve positivamente el doble de lo que se movería la variable X.

12 Coeficiente de correlación
La covarianza depende de las unidades de medida de las variables, por lo tanto si modificamos las unidades de medida de las variables la covarianza cambiará. Esto nos impide comparar la relación entre distintos pares de variables medidas en diferentes unidades. Para ello se dividió la covarianza por el producto de los desvíos (desviaciones típicas). El coeficiente de correlación de Pearson es independiente de la escala de medida de las variables.

13 Coeficiente de correlación
r = Cov(x,y)/ SX . SY donde CovXY es la covarianza de (X,Y) y SX y SY las desviaciones típicas de las distribuciones marginales.

14 INTERPRETACIÓN COEFICIENTE DE CORRELACIÓN
El valor del índice de correlación varía en el intervalo [-1, +1]: Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante. Si 0 < r < 1, existe una correlación positiva. Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables. Si -1 < r < 0, existe una correlación negativa. Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción constante.

15 r(ax+b, cy+d)=r(x,y) con a y c de igual signo
Otras propiedades: El Coeficiente no depende del orden en que se consideran las variables, es decir: r(x,y) = r(y,x) No se altera por transformaciones lineales de las variables: r(ax+b, cy+d)=r(x,y) con a y c de igual signo

16 Tener en cuenta: Al estudiar la relación entre dos variables hay que tener en cuenta: Datos atípicos que pueden modificar el signo de la relación El coeficiente tiene que ser consistente con el gráfico del diagrama de dispersión. La existencia de una relación entre las dos variables no implica relación de causa y efecto (hay que observaciones posibles correlaciones espurias o sea. al efecto de otra variable)


Descargar ppt "CORRELACIÓN CAP 8 DE Peña y Romo."

Presentaciones similares


Anuncios Google