La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Bloque III. Caracterización de la relación entre variables Tema.8. Medidas de relación o asociación. Concepto. Distribución conjunta de frecuencias y representación.

Presentaciones similares


Presentación del tema: "Bloque III. Caracterización de la relación entre variables Tema.8. Medidas de relación o asociación. Concepto. Distribución conjunta de frecuencias y representación."— Transcripción de la presentación:

1 Bloque III. Caracterización de la relación entre variables Tema.8. Medidas de relación o asociación. Concepto. Distribución conjunta de frecuencias y representación gráfica. Covarianza y coeficiente de correlación de Pearson. Otros coeficientes. Tratamiento de la relación no lineal. Introducción a la correlación múltiple.

2 Concepto Hasta ahora nos hemos centrado en medidas de tendencia central, variabilidad, asimetría y curtosis de una única variable. No obstante, en la práctica es común examinar dos o más variables conjuntamente (v.g., relación entre inteligencia y rendimiento, etc.) En este tema nos centraremos en la relación entre 2 variables (a partir de n observaciones apareadas) y calcularemos un índice que nos dará el grado de relación/asociación entre ambas variables: el coeficiente de correlación lineal (de Pearson)

3 Representación gráfica de una relación inteligencia rendimiento inteligencia Relación lineal positiva Relación lineal negativa Sin relación Nota: El coeficiente de correlación de Pearson mide relación LINEAL.

4 Representación gráfica de una relación (2) rendimiento inteligencia Relación lineal Relación no lineal Nota: El coeficiente de correlación de Pearson mide relación LINEAL.

5 Representación gráfica de una relación (3) inteligencia rendimiento inteligencia Relación lineal perfecta (casi perfecta) Relación lineal débil Relación lineal fuerte/moderada Ahora necesitamos un índice que nos informe tanto del grado en que X e Y están relacionadas, y si la relación es positiva o negativa

6 Covarianza e índice de correlación de Pearson rendimiento inteligencia Observad que cuando la relación lineal es positiva, cuando las puntuaciones diferenciales de X son positivas, las puntuaciones diferenciales de Y suelen ser positivas. inteligencia rendimiento Observad que cuando la relación lineal es negativa, cuando las puntuaciones diferenciales de X son positivas, las puntuaciones diferenciales de Y suelen ser negativas. Caso 1 Caso 2

7 Covarianza La covarianza aprovecha esta característica señalada en la transparencia anterior (al emplear el producto de las puntuaciones diferencias de X e Y). He aquí la fórmula: En el caso 1, la covarianza será un valor positivo, y en el caso 2, la covarianza será un valor negativo. Por tanto la covarianza nos da una idea de si la relación entre X e Y es positiva o negativa. Problema: la covarianza no en un índice acotado (v.g., cómo interpretar una covarianza de 6 en términos del grado de asociación), y no tiene en cuenta la variabilidad de las variables. Por eso se emplea el siguiente índice....

8 Coeficiente de correlación (lineal) de Pearson El coeficiente de correlación de Pearson parte de la covarianza: Ahora veremos varias propiedades del índice...

9 Coeficiente de correlación (lineal) de Pearson Propiedad 1. El índice de correlación de Pearson no puede valer menos de -1 ni más de +1. Un índice de correlación de Pearson de -1 indica una relación lineal negativa perfecta Un índice de correlación de Pearson de +1 indica una relación lineal positiva perfecta. Un índice de correlación de Pearson de 0 indica ausencia de relación lineal. (Observad que un valor cercano a 0 del índice no implica que no haya algún tipo de relación no lineal: el índice de Pearson mide relación lineal.)

10 Coeficiente de correlación (lineal) de Pearson Propiedad 2. El índice de correlación de Pearson (en valor absoluto) no varía cuando se transforman linealmente las variables. Por ejemplo, la correlación de Pearson entre la temperatura (en grados celsius) y el nivel de depresión es la misma que la correlación entre la temperatura (medida en grados Fahrenheit) y el nivel de depresión. Evidentemente, el índice de correlación de Pearson es el mismo entre las puntaciones directas de X e Y, o entre las puntuaciones diferenciales de X e Y, o entre las puntuaciones típicas de X e Y. (Recordad que las puntuaciones diferenciales y las puntuaciones típicas son transformaciones lineales de las puntuaciones directas.)

11 Coeficiente de correlación (lineal) de Pearson Interpretación Hemos de tener en cuenta qué es lo que estamos midiendo para poder interpretar cuán grande es la relación entre las variables bajo estudio. En muchos casos, depende del área bajo estudio. rendimiento inteligencia En todo caso, es muy importante efectuar el diagrama de dispersión. Por ejemplo, en el caso de la izquierda, es claro que no hay relación entre inteligencia y rendimiento. Sin embargo, si calculamos el índice de correlación de Pearson nos dará un valor muy elevado, causado por la puntuación atípica en la esquina superior derecha.

12 Coeficiente de correlación (lineal) de Pearson Interpretación (2) Es importante indicar que CORRELACIÓN NO IMPLICA CAUSACIÓN. El que dos variables estén altamente correlaciones no implica que X causa Y ni que Y causa X. (Esa es una de las razones empleadas por las tabaqueras en el tema de la correlación entre cáncer de pulmón y el hecho de fumar.)

13 Coeficiente de correlación (lineal) de Pearson Interpretación (3) Es importante indicar que el coeficiente de correlación de Pearson puede verse afectado por la influencia de terceras variables. Por ejemplo, si fuéramos a un colegio y medimos la estatura y pasamos una prueba de habilidad verbal, saldrá que los más altos también tienen más habilidad verbal...claro, que eso puede ser debido simplemente a que en el colegio los niños más altos serán mayores en edad que los más bajos. Habilidad numérica Estatura 6 años 8 a 10 a 12 a 14 a Si se parcializa esta tercera variable (mediante correlación parcial, que ya veremos más adelante), difícilmente habrá una relación de importancia entre estatura y habilidad numérica. Hay muchos casos en que es la tercera variable la causante de una alta relación entre X e Y (y ello muchas veces es difícil de identificar)

14 Coeficiente de correlación (lineal) de Pearson Interpretación (3) Por otra parte, el valor del coeficiente de Pearson depende en parte de la variabilidad del grupo. Rendimiento inteligencia CI bajoCI alto Si efectuamos el coeficiente de Pearson entre inteligencia y rendimiento con todos los sujetos, el valor del coeficiente de Pearson será bastante elevado. Sin embargo, si empleamos únicamente los individuos con CI bajo (o CI alto) y calculamos la correlación con Rendimiendo, el valor del coeficiente de Pearson será claramente menor. Un grupo heterogéneo daría pues un mayor grado de relación entre variables que un grupo homogéneo.

15 Otros coeficientes (variables no cuantitativas) Claro está, es posible obtener medidas del grado de relación de variables cuando éstas no sean cuantitativas. Volveremos a este punto una vez visto el tema siguiente (predicción y estimación que está muy relacionado con lo que llevamos visto en el tema). En todo caso, veamos varios ejemplos. 1. El caso en que las variables X e Y sean ordinales Recordad, cuando tenemos variables con escala ordinal, podemos establecer el orden entre los valores, pero no sabemos las distancias entre los valores. (Si supiéramos la distancia entre los valores ya estaríamos al menos en una escala de intervalo) Podemos calcular el coeficiente de correlación de Spearman o el coeficiente de correlación de Kendall. (Veremos el primero.)

16 Coeficiente de correlación de Spearman Lo que tenemos ahora son 2 sucesiones de valores ordinales. El coeficiente de Spearman es un caso especial del coeficiente de correlación de Pearson aplicada a dos series de los n primeros números naturales (cuando no hay empates; si hay –muchos- empates hay otra fórmula es la diferencia entre el valor ordinal en X y el valor ordinal en Y del sujeto i

17 Coeficiente de correlación de Spearman (propiedades) Primera. Se encuentra acotado, como el coeficiente de Pearson entre -1 y +1. Un coeficiente de Spearman de +1 quiere decir que el que es primero en X es primero en Y, el que es segundo en X es segundo en I, etc Un coeficiente de Sperman de -1 quiere decir que el que es primero en X es último en Y, el segundo en X es el penúltimo en Y, etc. Segunda. Su cálculo es muy sencillo (más que el del coeficiente de correlación de Pearson). No obstante, con los ordenadores y un programa estadístico, esto es irrelevante estos días...

18 Introducción a la correlación múltiple En este caso, se estudian conjuntamente 3 o más variables. Veremos ahora dos casos: El análisis de la correlación de una de las variables con las otras dos consideradas conjuntamente (correlación múltiple) y La correlación existente entre dos variables, eliminando el influjo de la tercera variable (correlación parcial)

19 Introducción a la correlación múltiple (2) El coeficiente de correlación múltiple es un índice que mide la relación existente entre una variable X 1 y otras variables, X 2, X 3,...., consideradas éstas conjuntamente. Para simplificar veremos el caso de tres variables. Es decir, el coeficiente de correlación múltiple medirá la relación entre X 1 y las variables X 2 y X 3 consideradas conjuntamente. (hay otras fórmulas)

20 Introducción a la correlación múltiple (3) El coeficiente de correlación múltiple es aceptado como positivo; no obstante, no tiene sentido hablar de sentido (positivo/negativo), dado que es función de varias correlaciones, algunas de las cuales pueden ser positivas y otras negativas. Su valor está entre 0 y 1. El valor del coeficiente de correlación múltiple tiende a aumentar cuando aumentan y, y disminuye

21 Introducción a la correlación múltiple (4). Ejemplo Datos (N=5) X 1 X 2 X 3 Rendim Ansied Neurot

22 Introducción a la correlación múltiple (5) Datos (N=5) Rendim Ansied Neurot Observad que este coeficiente es sólo un poco mayor que el que había entre las variables X 1 y X 2

23 Introducción a la correlación múltiple (6) Nuevo Conjunto Datos (N=5) Rendim Ansied Extrov Observad que ahora la correlación entre X 1 y X 3 es de menor grado que antes; pero veremos que se compensa por el hecho de que la correlación de X 2 y X 3 es también menor.

24 Introducción a la correlación múltiple (7) Nuevo Conjunto Datos (N=5) Rendim Ansied Extrov Podéis ver que ahora el coeficiente de correlación múltiple es (ligeramente) mayor que en el caso anterior. Veremos más sobre todo esto en el tema siguiente (apartado de regresión múltiple)

25 Correlación Parcial Ya vimos antes que efectuar la correlación de Pearson entre la estatura y la habilidad numérica en un grupo de niños podía estar influida por la edad (es decir, al aumentar la edad aumenta la estatura y aumenta la habilidad numérica). ¿Cómo controlamos el efecto de la edad en tal caso? Primera posibilidad (eliminación empírica) Se trataría de formar subgrupos de edad, en el que cada uno de ellos la edad fuera similar y se calcular el coeficiente de Pearson para cada subgrupo. Esto es correcto, pero quizás ahora cada uno de estos coeficientes se calcule con pocos individuo, lo que puede restar cierta estabilidad.

26 Correlación Parcial (2) Segunda posibilidad (eliminación estadística) Se trataría de utilizar los datos del grupo completo y se elimina la influencia de la tercera variable de manera estadística. Evidentemente, el valor de este índice estará entre -1 y +1, y la interpretación es análoga al coeficiente de correlación de Pearson.

27 Correlación Parcial (3). Ejemplo Datos (N=5) Rendim Ansied Neurot Queremos calcular la correlación de Pearson entre Rendimiento y Ansiedad, manteniendo constante la influencia de la variable neuroticismo Es un valor muy parecido al que teníamos sin controlar el neuroticismo

28 Correlación Parcial (4). Ejemplo P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S Controlling for.. NEURO RENDIM ANSIE RENDIM ( 0) ( 2) P=. P=.155 ANSIE ( 2) ( 0) P=.155 P=. (Coefficient / (D.F.) / 2-tailed Significance) ". " is printed if a coefficient cannot be computed


Descargar ppt "Bloque III. Caracterización de la relación entre variables Tema.8. Medidas de relación o asociación. Concepto. Distribución conjunta de frecuencias y representación."

Presentaciones similares


Anuncios Google