TEMA 11. DESCRIPCIÓN CONJUNTA DE DOS VARIABLES: CORRELACIÓN.

Slides:



Advertisements
Presentaciones similares
Tema 6: Regresión lineal.
Advertisements

Tema 5: Asociación. 1. Introducción. 2. Tablas y gráficas bivariadas.
Bloque III. Caracterización de la relación entre variables Tema. 8
*Estadística: La estadística es una herramienta básica para la investigación empírica que ayuda a conocer la realidad de manera “objetiva”. En la disciplina.
Capítulo 4: Medidas de dispersión
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Variable Aleatoria Continua. Principales Distribuciones
¿Qué alcances puede tener el proceso de investigación cuantitativa:
Estadística: -Correlación y regresión
TEMA 2.4. MEDIDAS DE VARIABILIDAD
Regresión y correlación
El método científico Ing. Nelson Velásquez.
Medidas de Dispersión Estadística E.S.O.
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Tema 1- Regresión lineal simple.
CURSO DE ESTADÍSTICA BÁSICA
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar VARIABLE ESTADÍSTICA UNIDIMENSIONAL Población:
Tema 2: Métodos de ajuste
Estadística bidimensional
MEDIDAS DE DISPERSIÓN:
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
ESTUDIOS CORRELACIONALES
Facultad: Turismo Y Hotelería
ANÁLISIS DE MERCADO: DEMANDA, OFERTA Y ELASTICIDADES
Introducción a Funciones de una variable
Tema 7: Regresión Simple y Múltiple. EJEMPLO: Aproxima bien el número de préstamos que efectúa una biblioteca a lo largo de su primer año de vida. Nos.
Investigación en procesos de Aprendizaje Abordaje desde el AEC
TEMA 2.5 PUNTUACIONES TIPICAS Y ESCALAS DERIVADAS.
MEDICION Medir es tipificar o caracterizar un propiedad en un elemento de estudio. Previamente se debe conceptualizar la propiedad por medirse y obtener.
ESTADÍSTICAS DESCRIPTIVA
Métodos de calibración: regresión y correlación
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
Estadística bidimensional
Función Densidad Continua (o distribución de probabilidad continua)
Tratamiento de datos y azar
D. BIDIMENSIONALES DÍA 53 * 1º BAD CT
Variables estadísticas bidimensionales
Pruebas de hipótesis.
coeficientes de correlación de
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
BLOQUE III. ESTADÍSTICA DESCRIPTIVA CON DOS O MÁS VARIABLES. 3. 1
 Relación matemática que existe entre las dimensiones reales y las del dibujo que representa la realidad sobre un plano o un mapa.  Expresión de relaciones.
Estimación y contraste de hipótesis
Estadística II Regresión Lineal.
Análisis de los Datos Cuantitativos
INTRODUCCION Es un elemento fundamental en todo proceso de investigación Viene después del problema, y el investigador la enuncia Esto orienta el proceso.
Aplicaciones Estadísticas a las Finanzas Clase 1
El efecto de las actividades extracurriculares en el optimismo de estudiantes en Nuevo León. En esta investigación nos enfocaremos en uno de sus factores.
ESTIMACIÓN DE PARÁMETROS
Variables estadísticas bidimensionales
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Correlación Decimos que dos variables, X e Y, están correlacionadas cuando hay una relación cuantitativa entre ellas. X suele ser la variable independiente.
MEDIDAS DE TENDENCIA CENTRAL
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Variables estadísticas bidimensionales
ANÁLISIS DE LA INFORMACIÓN La relación entre variables.
Mini-video 2 de 5 Materia: Límites de funciones Continuidad de funciones Prácticas con Introducción a Funciones de una variable.
REGRESIÓN LINEAL SIMPLE
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
Estudio técnico del instrumento
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
1 ANÁLISIS DE CORRELACIÓN, REGRESIÓN Y CONTRASTE.
Definición del alcance de la investigación a realizar: exploratorio, descriptiva, correlacional o explicativa. Karla Dempwolff Vera Fabiola Naan Escalante.
4. Métodos psicofísicos de medida en clínica
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
CAPITULO 9 Recopilación de datos primarios. Tipos de datos primarios  Características demográficas/socioeconómicas  Características psicológicas/del.
Transcripción de la presentación:

TEMA 11. DESCRIPCIÓN CONJUNTA DE DOS VARIABLES: CORRELACIÓN

1. INTRODUCCIÓN 2. REPRESENTACIÓN GRÁFICA DE UNA RELACIÓN 4. CUANTIFICACIÓN DE UNA RELACIÓN LINEAL 4.1. COVARIANZA (S xy ) 4.2. COEFICIENTE DE CORRELACIÓN DE PEARSON (r xy ) CÁLCULO DE r xy INTERPRETACIÓN Y PROPIEDADES DE r xy VALORACIÓN E INTERPRETACIÓN DE r xy

Amón, J. (1991). Estadística para psicólogos. Vol I. Estadística Descriptiva. Madrid: Pirámide. Botella, J.; León, O.; San Martín, R., y Barriopedro, M.I. (2001). Análisis de Datos en Psicología I. Teoría y Ejercicios. Madrid: Pirámide. De la Fuente, E.I. y García, J. (1998). Análisis de datos en Psicología. Ejercicios de estadística descriptiva. Granada: Urbano. Escobar, M. (1999). Análisis gráfico/exploratorio. Cuadernos de Estadística nº 2. Madrid: Muralla-Hespérides. Freixa, M., Salafranca, L., Guardia, J., Ferrer, R. y Turbany, J. (1992). Análisis Exploratorio de Datos: nuevas técnicas estadísticas. Barcelona: PPU. McRae, S. (1995). Modelos y métodos para las Ciencias del Comportamiento. Barcelona: Ariel.

Merino, J.M; Moreno, E; Padilla, M; Rodríguez-Miñón, P; Villarino, A. (2001). Análisis de Datos en Psicología I. Madrid: UNED. Palmer, A. (1995). El análisis exploratorio de datos. Madrid: Eudema Pérez, F.J., Manzano, V. y Fazeli, H. (1998). Problemas resueltos de Análisis de Datos. Madrid: Pirámide. Pérez, F.J., Manzano, V. y Fazeli, H. (1999). Análisis de Datos en Psicología. Madrid: Pirámide. San Martín, R., Espinosa, L. y Fernández, L. (1987). Psicoestadística Descriptiva. Madrid: Pirámide. Stenberg, R.J. (1993). Investigar en Psicología. Barcelona: Paidós.

Objetivo Intentaremos medir la posible relación entre dos variables. Estudiaremos bajo título “correlación” los problemas referentes a la variación conjunta de dos variables, su intensidad y su sentido (positivo o negativo)

1. INTRODUCCIÓN Uno de los objetivos principales de la ciencia consiste en descubrir las relaciones entre variables, y la estadística ha desarrollado instrumentos para ello En el campo de la Psicología podemos preguntarnos si el rendimiento laboral en un determinado tipo de trabajo guarda relación con la personalidad del trabajador, si el fracaso escolar es mas probable en niños con determinadas circunstancias familiares y personales, si hay tareas en que la práctica masiva facilita más el aprendizaje que la práctica distribuido o si determinados rasgos de personalidad están asociados a una mayor propensión al suicidio. La observación de relaciones claras y estables entre variables ayuda a comprender los fenómenos y a a encontrar explicaciones de los mismos e indica las vías probablemente mas eficaces para intervenir sobre las situaciones

Desde el punto de vista matemático las relaciones entre variables pueden ser de muchos tipos (Y=1+2·X; Y=X 2 ; Y=8 2 ; Y=1/X). Estas funciones son conceptos matemáticos y, por tanto, teóricos e ideales. Son habitualmente útiles en las ciencias exactas, en las que las variables guardan una relación determinista o funcional. Pero en las ciencias sociales, incluida la psicología nunca se encuentran relaciones deterministas, sino mas bien conjuntos de observaciones que manifiestan una configuración concreta, y nos preguntaremos si esa configuración (que refleja la relación entre variables) se parece a alguno de los modelos teóricos; en caso afirmativo diremos que ese modelo explica bien la relación. Nosotros nos centraremos en el estudio de las relaciones lineales, que son las más sencillas.

Esto es, lo que vamos a exponer en el tema son las formas más habituales de observar y cuantificar las relaciones lineales entre variables Advertimos por tanto que aunque en el tema hablemos sobre relaciones o correlaciones entre variables, estrictamente hablando deberíamos utilizar la expresión relación lineal y si no lo hacemos será únicamente por economía de espacio. Igualmente los índices que vamos a describir son aplicables exclusivamente a las variables al menos de intervalo. La asociación entre variables con otros niveles de medida (nominales u ordinales) se pueden evaluar por otros procedimientos que exceden los objetivos del temario.

2. REPRESENTACIÓN GRÁFICA DE UNA RELACIÓN Los procedimientos para determinar la existencia y grado de relación lineal entre dos variables deben ser también capaces de discriminar entre los tres tipos de relación lineal que hay. Supongamos las variables X e Y: Relación lineal positiva o directa: cuando los valores altos en Y tienden a emparejarse con valores altos en X, los valores intermedios en Y tienden a emparejarse con valores intermedios en X y los valores bajos en Y tienden a emparejarse con valores bajos en X Ejemplo: motivacion y rendimiento Relación lineal negativa o inversa: cuando los valores altos en Y tienden a emparejarse con valores bajos en X, los valores intermedios en Y tienden a emparejarse con valores intermedios en X y los valores bajos en Y tienden a emparejarse con valores altos en X Ejemplo: Tiempo de realización de una tarea y número de errores

Relación nula: cuando no hay un emparejamiento sistemático entre ellas en función de sus valores Ejemplo: estatura y rendimiento Importante: Una correlación nula no indica ausencia de relación, sino ausencia de relación lineal. En otras palabras, indica que el modelo lineal no se ajusta al comportamiento de esas variables, pero puede haber algún tipo de relación entre ellas (ejemplo de la activación y el rendimiento)

SUJ MOTIV (X) RENDIM(Y) SUJ TIEMPO (X) ERROR ES (Y) SUJ ESTATU. (X) INTELI. (Y) Veamos los siguientes conjuntos de datos que representan las relaciones anteriores

La representaciones gráficas conjunta de dos variables permite observar visualmente este tipo de relaciones. Estas representaciones gráficas se denominan diagramas de dispersión, que constituyen nubes de puntos donde representamos los pares de valores de X e Y para cada uno de los sujetos y los representamos en un eje de coordenadas

Relación lineal positiva. Motivación y rendimiento Relación lineal negativa. Tiempo en una tarea y numero de errores Ausencia de relación lineal. Estatura e Inteligencia

Destaquemos que este tipo de relación, bien positiva o negativa en que los puntos forman una línea perfecta son situaciones que no se dan nunca en relaciones reales entre variables psicológicas; sólo podemos considerarlo como un modelo ideal.

4. CUANTIFICACIÓN DE UNA RELACIÓN LINEAL 4.1. COVARIANZA (S xy ) Desarrollaremos procedimientos precisos capaces de distinguir entre los tres tipos de relación descritos y cuantificar el grado de relación Un primer procedimientos consistiría en hallar el promedio de los productos cruzados de las puntuaciones diferenciales Al hablar de productos cruzados nos referimos al producto para cada sujeto o caso de sus puntuaciones diferenciales en ambas variables

Es lo que se denomina covarianza y se representa S xy a) Datos no agrupados b) Datos agrupados

Interpretación: S xy positivo: covarianza positiva S xy negativo: covarianza negativa S xy cero: ausencia de covariación Propiedades 1. El índice es capaz de discriminar entre los tres tipos de relación lineal 2. Problemas en la interpretación: a) Depende de las unidades de medida de las variables (no permite comparar) b) Es un valor no acotado (carece de máximos y mínimos estables) con lo cual no tenemos información sobre su cuantía y es difícil su interpretación Solución: Coeficiente de correlación de Pearson (Rxy)

Ejemplo: Obtención de la covarianza entre cinco pares de puntuaciones para los mismos sujetos en ansiedad y depresión medidos en dos cuestionarios diferentes (X, Y) y (V,W) Ans(X) Depr(Y) XY Ans(V) Depr(W) VW 1, ,38 5,61 171,96 964,70 1, ,25 143,30 752,33 1, ,91 5,15 138,89 715,28 1, ,84 5,45 163,14 889,11 1, ,91 5,48 160,94 881,95 8, ,04 26,94 778, ,37

4.2. COEFICIENTE DE CORRELACIÓN DE PEARSON (R xy ) Un segundo índice de asociación lineal consistirá en hallar también un promedio de productos cruzados, pero no de las puntuaciones diferenciales, sino de las puntuaciones típicas. Este índice se denomina coeficiente de correlación de Pearson y se representa por la letra r (a veces puede aparecer en mayúsculas). Así, en teoría las correlación de Pearson entre X e Y será:

La correlación no es, por tanto, más que una covarianza hallada sobre las puntuaciones tipificadas; por eso a veces se dice que la correlación es una covarianza estandarizada o que es una covarianza adimensional. La formula anterior no resulta muy práctica a la hora de hacer cálculos, pues exige la tipificación de cada puntuación, y para ello hay que hallar previamente las medias y desviaciones típicas de cada variable. Para facilitar el cálculo se han derivado otras fórmulas alternativas equivalentes que en la mayoría de casos resultan más prácticas:

1. Datos no agrupados CÁLCULO DE r xy

2. Datos agrupados Donde: n x : observaciones o frecuencias marginales de X n y : observaciones o frecuencias marginales de Y N xy : observaciones dentro de las casillas interiores de la tabla de frecuencias. Es decir, el número de observaciones que pertenecen a un cierto intervalo de la variable X y a otro de la variable Y

INTERPRETACIÓN Y PROPIEDADES DE R xy 1. El coeficiente de correlación de Pearson no puede valer menos que -1 y mas que 1, esto es -1≤ 0 ≤ 1 Cercano a -1: correlación lineal negativa Cercano a 0: ausencia de correlación lineal Cercano a 1: correlación lineal positiva 2. Es un valor adimensional, es invariante frente a cualquier unidad de medida –permite comparar diferentes variables o la misma variable medida en diferentes grupos-

3. Si hacemos transformaciones lineales de una o de las dos variables, en que las constantes multiplicadoras son positivas, el coeficiente de correlación de Pearson no se altera Si U= a·X+b y V= c·Y+d siendo (a y c >0) entonces R uv =R xy

XY X2X2X2X2 Y2Y2Y2Y2X·Y Ejemplo 1: Covarianza y Correlación entre inteligencia y rendimiento

XY X2X2X2X2 Y2Y2Y2Y2X·Y Ejemplo 2: Covarianza y correlación entre tiempo y número de errores

XY X2X2X2X2 Y2Y2Y2Y2X·Y Ejemplo 3: Covarianza y Correlación entre estatura e inteligencia

XY X2X2X2X2 Y2Y2Y2Y2X·Y Ejemplo 4: Covarianza y correlación en un ejemplo de relación lineal perfecta

VALORACIÓN E INTERPRETACIÓN DE r xy En la interpretación de R xy hay que separar dos aspectos distintos: su cuantía y su sentido. La cuantía se refiere al grado en que la relación entre dos variables queda bien definida con un índice de asociación lineal como R. Mientras que el sentido se refiere al tipo de relación lineal: positiva, negativa o nula. La interpretación de la correlación depende del campo de estudio. Por ejemplo si estudiamos Fiabilidad en cualquier test; Test- retest<0.80, no sería adecuado mientras que en un test de Personalidad; = 0.30 resulta muy importante. En cada área de estudio se va desarrollando un conocimiento que permite valorar los coeficientes de correlación en términos muy relativos. Esta es la razón por la que no se pueden proponer categorías generales de valoración. Los coeficientes de correlación deben valorarse comparándolos unos con otros o comparándolos con los valores que típicamente se suelen encontrar en el campo de estudio del que se trate.

Una correlación nula no indica ausencia de relación, sino ausencia de relación lineal. En otras palabras, indica que el modelo lineal no se ajusta al comportamiento de esas variables, pero puede haber algún tipo de relación entre ellas (ejemplo de la activación y el rendimiento) Una relación de tipo lineal entre las variables no implica relación de tipo causal (X no tiene por qué causar a Y, aunque estén relacionadas linealmente). Por ejemplo, puede existir relación lineal directa entre el número de coches por cada mil habitantes y el nivel cultural medio de los habitantes de un país, pero no por eso si regalamos coches a esos habitantes se incrementará el nivel cultural. Está claro que existe otras variables que están actuando conjuntamente con estas dos (nivel económico, por ejemplo).

A veces se establecen entre las variables lo que se denominan correlaciones espurias. Esto es, parece existir una relación entre dos variables y se deben al efecto de otras variables que al tener una relación con las otras primeras dos crea esta falsa relación. Ejemplo, correlación positiva entre el presupuesto en educación en España y el número de salidas al extranjero de los españoles. Esto no quiere decir que al aumentar la educación los españoles se vayan al extranjero, sino que hay otras variables, como el aumento de la renta que puede estar provocando la correlación entre las variables anteriores.

Ejemplos del cálculo de r xy

Ejemplo 1 Supongamos que queremos ver si existe correlación lineal entre el nivel de puntuación obtenida por 5 pacientes en un test de ansiedad social (X) y el número de evitaciones semanales ante situaciones que implican contacto social (Y) XY

XY X2X2X2X2 Y2Y2Y2Y2X·Y

Ejemplo 2 Relación entre medidas neuroanatómicas e inteligencia en gemelos monocigóticos. Los gemelos monocigóticos comparten varios rasgos físicos, psicológicos y patológicos. El tratamiento de imágenes del cerebro permite, mediante resonancia magnética y análisis computerizados, cuantificar determinadas medidas y parámetros neuroanatómicos. Se diseña un estudio utilizando estas técnicas para establecer si dichas características tienen alguna relación con el cociente intelectual y si existe alguna relación entre estas medidas. Utilizando estas técnicas se obtuvieron el área de la superficie del córtex cerebral, el área del corpus callosum sagital y el volumen de la cabeza, medido en diferentes pares de gemelos monocigóticos. Además, se obtuvieron medidas del peso corporal, el cociente intelectual y la circunferencia de la cabeza. En este estudio se desea establecer si existe relación en las medidas neuroanatómicas entre gemelos monocigóticos y si existe relación entre el cociente intelectual y las medidas neuroanatómicas.

La siguiente tabla muestra la relación entre el cociente intelectual y el área del córtex cerebral de 20 pares de gemelos.XY

XY X2X2X2X2 Y2Y2Y2Y2XY