TEMA 11. DESCRIPCIÓN CONJUNTA DE DOS VARIABLES: CORRELACIÓN.

TEMA 11. DESCRIPCIÓN CONJUNTA DE DOS VARIABLES: CORRELACIÓN

1. INTRODUCCIÓN 2. REPRESENTACIÓN GRÁFICA DE UNA RELACIÓN 4. CUANTIFICACIÓN DE UNA RELACIÓN LINEAL 4.1. COVARIANZA (S xy ) 4.2. COEFICIENTE DE CORRELACIÓN DE PEARSON (r xy ) 4.2.1. CÁLCULO DE r xy 4.2.2. INTERPRETACIÓN Y PROPIEDADES DE r xy 4.2.3. VALORACIÓN E INTERPRETACIÓN DE r xy

Amón, J. (1991). Estadística para psicólogos. Vol I. Estadística Descriptiva. Madrid: Pirámide. Botella, J.; León, O.; San Martín, R., y Barriopedro, M.I. (2001). Análisis de Datos en Psicología I. Teoría y Ejercicios. Madrid: Pirámide. De la Fuente, E.I. y García, J. (1998). Análisis de datos en Psicología. Ejercicios de estadística descriptiva. Granada: Urbano. Escobar, M. (1999). Análisis gráfico/exploratorio. Cuadernos de Estadística nº 2. Madrid: Muralla-Hespérides. Freixa, M., Salafranca, L., Guardia, J., Ferrer, R. y Turbany, J. (1992). Análisis Exploratorio de Datos: nuevas técnicas estadísticas. Barcelona: PPU. McRae, S. (1995). Modelos y métodos para las Ciencias del Comportamiento. Barcelona: Ariel.

Merino, J.M; Moreno, E; Padilla, M; Rodríguez-Miñón, P; Villarino, A. (2001). Análisis de Datos en Psicología I. Madrid: UNED. Palmer, A. (1995). El análisis exploratorio de datos. Madrid: Eudema Pérez, F.J., Manzano, V. y Fazeli, H. (1998). Problemas resueltos de Análisis de Datos. Madrid: Pirámide. Pérez, F.J., Manzano, V. y Fazeli, H. (1999). Análisis de Datos en Psicología. Madrid: Pirámide. San Martín, R., Espinosa, L. y Fernández, L. (1987). Psicoestadística Descriptiva. Madrid: Pirámide. Stenberg, R.J. (1993). Investigar en Psicología. Barcelona: Paidós.

Objetivo Intentaremos medir la posible relación entre dos variables. Estudiaremos bajo título “correlación” los problemas referentes a la variación conjunta de dos variables, su intensidad y su sentido (positivo o negativo)

1. INTRODUCCIÓN Uno de los objetivos principales de la ciencia consiste en descubrir las relaciones entre variables, y la estadística ha desarrollado instrumentos para ello En el campo de la Psicología podemos preguntarnos si el rendimiento laboral en un determinado tipo de trabajo guarda relación con la personalidad del trabajador, si el fracaso escolar es mas probable en niños con determinadas circunstancias familiares y personales, si hay tareas en que la práctica masiva facilita más el aprendizaje que la práctica distribuido o si determinados rasgos de personalidad están asociados a una mayor propensión al suicidio. La observación de relaciones claras y estables entre variables ayuda a comprender los fenómenos y a a encontrar explicaciones de los mismos e indica las vías probablemente mas eficaces para intervenir sobre las situaciones

Desde el punto de vista matemático las relaciones entre variables pueden ser de muchos tipos (Y=1+2·X; Y=X 2 ; Y=8 2 ; Y=1/X). Estas funciones son conceptos matemáticos y, por tanto, teóricos e ideales. Son habitualmente útiles en las ciencias exactas, en las que las variables guardan una relación determinista o funcional. Pero en las ciencias sociales, incluida la psicología nunca se encuentran relaciones deterministas, sino mas bien conjuntos de observaciones que manifiestan una configuración concreta, y nos preguntaremos si esa configuración (que refleja la relación entre variables) se parece a alguno de los modelos teóricos; en caso afirmativo diremos que ese modelo explica bien la relación. Nosotros nos centraremos en el estudio de las relaciones lineales, que son las más sencillas.

Esto es, lo que vamos a exponer en el tema son las formas más habituales de observar y cuantificar las relaciones lineales entre variables Advertimos por tanto que aunque en el tema hablemos sobre relaciones o correlaciones entre variables, estrictamente hablando deberíamos utilizar la expresión relación lineal y si no lo hacemos será únicamente por economía de espacio. Igualmente los índices que vamos a describir son aplicables exclusivamente a las variables al menos de intervalo. La asociación entre variables con otros niveles de medida (nominales u ordinales) se pueden evaluar por otros procedimientos que exceden los objetivos del temario.

2. REPRESENTACIÓN GRÁFICA DE UNA RELACIÓN Los procedimientos para determinar la existencia y grado de relación lineal entre dos variables deben ser también capaces de discriminar entre los tres tipos de relación lineal que hay. Supongamos las variables X e Y: Relación lineal positiva o directa: cuando los valores altos en Y tienden a emparejarse con valores altos en X, los valores intermedios en Y tienden a emparejarse con valores intermedios en X y los valores bajos en Y tienden a emparejarse con valores bajos en X Ejemplo: motivacion y rendimiento Relación lineal negativa o inversa: cuando los valores altos en Y tienden a emparejarse con valores bajos en X, los valores intermedios en Y tienden a emparejarse con valores intermedios en X y los valores bajos en Y tienden a emparejarse con valores altos en X Ejemplo: Tiempo de realización de una tarea y número de errores

Relación nula: cuando no hay un emparejamiento sistemático entre ellas en función de sus valores Ejemplo: estatura y rendimiento Importante: Una correlación nula no indica ausencia de relación, sino ausencia de relación lineal. En otras palabras, indica que el modelo lineal no se ajusta al comportamiento de esas variables, pero puede haber algún tipo de relación entre ellas (ejemplo de la activación y el rendimiento)

SUJ MOTIV (X) RENDIM(Y) 1234567891011121314159126979597310611413551422133142525SUJ TIEMPO (X) ERROR ES (Y) 1234567891011121314157115569138496101197424544125332123SUJ ESTATU. (X) INTELI. (Y) 123456789101112131415785128976699610108313324443232245 Veamos los siguientes conjuntos de datos que representan las relaciones anteriores

La representaciones gráficas conjunta de dos variables permite observar visualmente este tipo de relaciones. Estas representaciones gráficas se denominan diagramas de dispersión, que constituyen nubes de puntos donde representamos los pares de valores de X e Y para cada uno de los sujetos y los representamos en un eje de coordenadas

Relación lineal positiva. Motivación y rendimiento Relación lineal negativa. Tiempo en una tarea y numero de errores Ausencia de relación lineal. Estatura e Inteligencia

Destaquemos que este tipo de relación, bien positiva o negativa en que los puntos forman una línea perfecta son situaciones que no se dan nunca en relaciones reales entre variables psicológicas; sólo podemos considerarlo como un modelo ideal.

4. CUANTIFICACIÓN DE UNA RELACIÓN LINEAL 4.1. COVARIANZA (S xy ) Desarrollaremos procedimientos precisos capaces de distinguir entre los tres tipos de relación descritos y cuantificar el grado de relación Un primer procedimientos consistiría en hallar el promedio de los productos cruzados de las puntuaciones diferenciales Al hablar de productos cruzados nos referimos al producto para cada sujeto o caso de sus puntuaciones diferenciales en ambas variables

Es lo que se denomina covarianza y se representa S xy a) Datos no agrupados b) Datos agrupados

Interpretación: S xy positivo: covarianza positiva S xy negativo: covarianza negativa S xy cero: ausencia de covariación Propiedades 1. El índice es capaz de discriminar entre los tres tipos de relación lineal 2. Problemas en la interpretación: a) Depende de las unidades de medida de las variables (no permite comparar) b) Es un valor no acotado (carece de máximos y mínimos estables) con lo cual no tenemos información sobre su cuantía y es difícil su interpretación Solución: Coeficiente de correlación de Pearson (Rxy)

Ejemplo: Obtención de la covarianza entre cinco pares de puntuaciones para los mismos sujetos en ansiedad y depresión medidos en dos cuestionarios diferentes (X, Y) y (V,W) Ans(X) Depr(Y) XY Ans(V) Depr(W) VW 1,71 78 133,38 5,61 171,96 964,70 1,60 65 104 5,25 143,30 752,33 1,57 63 98,91 5,15 138,89 715,28 1,66 74 122,84 5,45 163,14 889,11 1,67 73 121,91 5,48 160,94 881,95 8,21 353 581,04 26,94 778,23 4203,37

4.2. COEFICIENTE DE CORRELACIÓN DE PEARSON (R xy ) Un segundo índice de asociación lineal consistirá en hallar también un promedio de productos cruzados, pero no de las puntuaciones diferenciales, sino de las puntuaciones típicas. Este índice se denomina coeficiente de correlación de Pearson y se representa por la letra r (a veces puede aparecer en mayúsculas). Así, en teoría las correlación de Pearson entre X e Y será:

La correlación no es, por tanto, más que una covarianza hallada sobre las puntuaciones tipificadas; por eso a veces se dice que la correlación es una covarianza estandarizada o que es una covarianza adimensional. La formula anterior no resulta muy práctica a la hora de hacer cálculos, pues exige la tipificación de cada puntuación, y para ello hay que hallar previamente las medias y desviaciones típicas de cada variable. Para facilitar el cálculo se han derivado otras fórmulas alternativas equivalentes que en la mayoría de casos resultan más prácticas:

1. Datos no agrupados 4.2.1. CÁLCULO DE r xy

2. Datos agrupados Donde: n x : observaciones o frecuencias marginales de X n y : observaciones o frecuencias marginales de Y N xy : observaciones dentro de las casillas interiores de la tabla de frecuencias. Es decir, el número de observaciones que pertenecen a un cierto intervalo de la variable X y a otro de la variable Y

4.2.2. INTERPRETACIÓN Y PROPIEDADES DE R xy 1. El coeficiente de correlación de Pearson no puede valer menos que -1 y mas que 1, esto es -1≤ 0 ≤ 1 Cercano a -1: correlación lineal negativa Cercano a 0: ausencia de correlación lineal Cercano a 1: correlación lineal positiva 2. Es un valor adimensional, es invariante frente a cualquier unidad de medida –permite comparar diferentes variables o la misma variable medida en diferentes grupos-

3. Si hacemos transformaciones lineales de una o de las dos variables, en que las constantes multiplicadoras son positivas, el coeficiente de correlación de Pearson no se altera Si U= a·X+b y V= c·Y+d siendo (a y c >0) entonces R uv =R xy

XY X2X2X2X2 Y2Y2Y2Y2X·Y912697959731061141355142213314252581144368149812581499100361211616925251164419911642542545606361418527213401255865 120451078169415 Ejemplo 1: Covarianza y Correlación entre inteligencia y rendimiento

XY X2X2X2X2 Y2Y2Y2Y2X·Y71155691384961011974245441253321234912125253681169641681361001218149164162516161425994149282220252436131620271820111821 120451054159319 Ejemplo 2: Covarianza y correlación entre tiempo y número de errores

XY X2X2X2X2 Y2Y2Y2Y2X·Y7851289766996101083133244432322454964251446481493636818136100100649199416161694944162521815361636282418182712204040 120451010151359 Ejemplo 3: Covarianza y Correlación entre estatura e inteligencia

XY X2X2X2X2 Y2Y2Y2Y2X·Y8106142124342605164100361964144169164360251244012840604 562156091224 Ejemplo 4: Covarianza y correlación en un ejemplo de relación lineal perfecta

4.2.3. VALORACIÓN E INTERPRETACIÓN DE r xy En la interpretación de R xy hay que separar dos aspectos distintos: su cuantía y su sentido. La cuantía se refiere al grado en que la relación entre dos variables queda bien definida con un índice de asociación lineal como R. Mientras que el sentido se refiere al tipo de relación lineal: positiva, negativa o nula. La interpretación de la correlación depende del campo de estudio. Por ejemplo si estudiamos Fiabilidad en cualquier test; Test- retest<0.80, no sería adecuado mientras que en un test de Personalidad; = 0.30 resulta muy importante. En cada área de estudio se va desarrollando un conocimiento que permite valorar los coeficientes de correlación en términos muy relativos. Esta es la razón por la que no se pueden proponer categorías generales de valoración. Los coeficientes de correlación deben valorarse comparándolos unos con otros o comparándolos con los valores que típicamente se suelen encontrar en el campo de estudio del que se trate.

Una correlación nula no indica ausencia de relación, sino ausencia de relación lineal. En otras palabras, indica que el modelo lineal no se ajusta al comportamiento de esas variables, pero puede haber algún tipo de relación entre ellas (ejemplo de la activación y el rendimiento) Una relación de tipo lineal entre las variables no implica relación de tipo causal (X no tiene por qué causar a Y, aunque estén relacionadas linealmente). Por ejemplo, puede existir relación lineal directa entre el número de coches por cada mil habitantes y el nivel cultural medio de los habitantes de un país, pero no por eso si regalamos coches a esos habitantes se incrementará el nivel cultural. Está claro que existe otras variables que están actuando conjuntamente con estas dos (nivel económico, por ejemplo).

A veces se establecen entre las variables lo que se denominan correlaciones espurias. Esto es, parece existir una relación entre dos variables y se deben al efecto de otras variables que al tener una relación con las otras primeras dos crea esta falsa relación. Ejemplo, correlación positiva entre el presupuesto en educación en España y el número de salidas al extranjero de los españoles. Esto no quiere decir que al aumentar la educación los españoles se vayan al extranjero, sino que hay otras variables, como el aumento de la renta que puede estar provocando la correlación entre las variables anteriores.

Ejemplos del cálculo de r xy

Ejemplo 1 Supongamos que queremos ver si existe correlación lineal entre el nivel de puntuación obtenida por 5 pacientes en un test de ansiedad social (X) y el número de evitaciones semanales ante situaciones que implican contacto social (Y) XY 354719120186

XY X2X2X2X2 Y2Y2Y2Y2X·Y 3547191201869251649181144032436276001266 2045100585219

Ejemplo 2 Relación entre medidas neuroanatómicas e inteligencia en gemelos monocigóticos. Los gemelos monocigóticos comparten varios rasgos físicos, psicológicos y patológicos. El tratamiento de imágenes del cerebro permite, mediante resonancia magnética y análisis computerizados, cuantificar determinadas medidas y parámetros neuroanatómicos. Se diseña un estudio utilizando estas técnicas para establecer si dichas características tienen alguna relación con el cociente intelectual y si existe alguna relación entre estas medidas. Utilizando estas técnicas se obtuvieron el área de la superficie del córtex cerebral, el área del corpus callosum sagital y el volumen de la cabeza, medido en diferentes pares de gemelos monocigóticos. Además, se obtuvieron medidas del peso corporal, el cociente intelectual y la circunferencia de la cabeza. En este estudio se desea establecer si existe relación en las medidas neuroanatómicas entre gemelos monocigóticos y si existe relación entre el cociente intelectual y las medidas neuroanatómicas.

La siguiente tabla muestra la relación entre el cociente intelectual y el área del córtex cerebral de 20 pares de gemelos.XY91068105874117768511596107276596860587065548364666166578159716275

XY X2X2X2X2 Y2Y2Y2Y2XY 9106810587411776851159610727659686058706554836466616657815971627581100366410025644916121494936642512125813610051845776348146243600336449004225291668894096435637214356324965613481504138445625648760354544600290560455216913448462366528285891295639372750 152132712428928910376

TEMA 11. DESCRIPCIÓN CONJUNTA DE DOS VARIABLES: CORRELACIÓN.

Presentaciones similares

Presentación del tema: "TEMA 11. DESCRIPCIÓN CONJUNTA DE DOS VARIABLES: CORRELACIÓN."— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback

Iniciar la sesión

Autorizarse a través de una red social:

TEMA 11. DESCRIPCIÓN CONJUNTA DE DOS VARIABLES: CORRELACIÓN.

Presentaciones similares

Presentación del tema: "TEMA 11. DESCRIPCIÓN CONJUNTA DE DOS VARIABLES: CORRELACIÓN."— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback