Correlación ρ (rho) r.

Slides:



Advertisements
Presentaciones similares
ANALISIS PARAMÉTRICOS
Advertisements

Tema 5: Asociación. 1. Introducción. 2. Tablas y gráficas bivariadas.
Bloque III. Caracterización de la relación entre variables Tema. 8
Tema 22: Análisis de tablas de contingencia Prueba c2 como medida de asociación y como prueba de contraste. Coeficientes derivados de c2. Interpretación.
Correlaciones bivariadas y correlaciones parciales
Técnicas para el análisis de datos en el enfoque cuantitativo
ESTADISTICA INFERENCIAL
Estadísticas Inferenciales Capítulo 10
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Estadística: -Correlación y regresión
Ingeniería Industrial II CicloEducativo 2011
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Regresión y correlación
Correlación 1.
Estadística Administrativa II
Bioestadística Aplicada I
Distribuciones de frecuencias bidimensionales
Estadística Descriptiva: 4. Correlación y Regresión Lineal
بسم الله الرحمن الرحيم.
EL COEFICIENTE DE CORRELACION DE RANGOS DE SPEARMAN
COEFICIENTE DE CORRELACIÓN PRODUCTO-MOMENTO DE PEARSON
Clase 7. Pruebas de hipótesis sobre asociaciones entre variables
CONFIABILIDAD DEL INSTRUMENTO
CURSO DE ESTADÍSTICA BÁSICA
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar VARIABLE ESTADÍSTICA UNIDIMENSIONAL Población:
9 Regresión Lineal Simple
Regresión Linear Correlación de Pearson, r Regresión Múltiple Regresión Logística Regresión de Poisson.
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Clases 5 Pruebas de Hipótesis
MEDIDAS DE CORRELACIÓN
Facultad: Turismo Y Hotelería
Análisis no paramétricos
TIPOS DE MODELOS DE REGRESIÓN Y SUPUESTOS PARA EL MODELO A
ANALISIS DE DATOS CATEGORICOS
Pronósticos, Series de Tiempo y Regresión
Vectores Aleatorios 1 Distribución conjunta de un vector aleatorio
ESTADISTICA. Liney Niño Carvajal Astrid Viviana Montaña Bello.
Titular: Agustín Salvia
Primerasdefiniciones y conceptos de la regresión El análisis de la regresión es una técnica estadística que se utiliza para estudiar la relación entre.
RELACIÓN ENTRE VARIABLES
Análisis de Datos en Economía
“Tablas de Contingencia y medidas de asociación”
Distribuciones de probabilidad bidimensionales o conjuntas
REGRESION LINEAL II Mario Briones L. MV, MSc
coeficientes de correlación de
PRUEBAS ESTADISTICAS NO PARAMETRICAS
ACTIVIDAD DE PORTAFOLIOS 3
Estadística II Regresión Lineal.
Análisis de los Datos Cuantitativos
Aplicaciones Estadísticas a las Finanzas Clase 1
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Correlación Decimos que dos variables, X e Y, están correlacionadas cuando hay una relación cuantitativa entre ellas. X suele ser la variable independiente.
REPASO DE ESTADISTICA Supóngase que aplicamos un cuestionario de nueve preguntas a un grupo de 30 alumnos y que sus resultados fueran los siguientes: 4.
3. Diferencias individuales y correlaciones
Construcción de modelos con regresión y correlación
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Correlación Capítulo 5 Capítulo 5: Ciso 3155.
Regresión lineal simple Nazira Calleja
Diferencias individuales y correlaciones
Unidad 4 Análisis de los Datos.
Probabilidades y Estadísticas. Conceptos trabajados en años anteriores…  Variable Aleatoria: Es toda magnitud cuyos valores se obtienen en mediciones.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
1 ANÁLISIS DE CORRELACIÓN, REGRESIÓN Y CONTRASTE.
Msc. Adilia Santana Msc. Any Montero. Reglas para asignar números a los objetos, con el propósito de representar cantidades de atributos Implica determinados.
Licenciatura en Psicopedagogía: Métodos, Diseños y Técnicas de Investigación Psicológica Tema 9 Fiabilidad de las puntuaciones.
Regresión logística Tema 6c. En la regresión lineal la variable dependiente es continua En regresión logística se utiliza cuando la variable dependiente.
Transcripción de la presentación:

Correlación ρ (rho) r

Correlación Cuantificación lineal de la relación entre dos variables. Cuantificación porque convierte la relación en un número. Mientras más fuerte sea la relación, mayor será el valor absoluto de la correlación. Lineal porque asume que la relación forma una línea recta. Entre dos variables porque describe qué tanto cambia una variable (X) dado un cambio en una segunda variable (Y). Un índice de correlación (r) es un número entre -1.00 y +1.00 que describe la relación entre dos variables.

Las variables varían o cambian (“se mueven”) VI VD ¿Cuánto del movimiento(o varianza) de la Ejecución puede ser explicado por el movimiento (o varianza) del Esfuerzo? Alto Valor de la variable Varianza Esfuerzo Ejecución Bajo

Las variables varían o cambian (“se mueven”) VI VD ¿Cuánto del movimiento(o varianza) de la Ejecución puede ser explicado por el movimiento (o varianza) del Esfuerzo? Alto Valor de la variable Varianza Ejecución Esfuerzo Bajo

Las variables varían o cambian (“se mueven”) VI VD ¿Cuánto del movimiento(o varianza) de la Ejecución puede ser explicado por el movimiento (o varianza) del Esfuerzo? Alto Esfuerzo Ejecución Valor de la variable Varianza Bajo

Las variables varían o cambian (“se mueven”) VI VD ¿Cuánto del movimiento(o varianza) de la Ejecución puede ser explicado por el movimiento (o varianza) del Esfuerzo? Alto Esfuerzo Valor de la variable Varianza Ejecución Bajo

DIRECCIÓN DE LA RELACIÓN Correlación negativa No correlación Correlación positiva Cuando una variable sube la otra baja Cuando un cambio en una de las variables no afecta a la otra Cuando una variable sube, la otra también sube y viceversa Número negativo - Cero Número positivo +

Mientras más se aleja el índice del cero, más fuerte es la relación. MAGNITUD (TAMAÑO) DE LA RELACIÓN Refleja la magnitud de la asociación, independientemente de las variables de que se trate y de su métrica. .30 es más fuerte que .20, pero menos que .40 .30 es de la misma magnitud que -.30 Máxima posible: 1 (o -1) Mientras más se aleja el índice del cero, más fuerte es la relación.   Correlación fuerte Correlación moderada débil |r|  0.80 0.50 < |r| <0.80. |r|  0.50

Correlación

NO CAUSALIDAD La correlación no indica por qué un cambio en una de las variables da lugar a cambios en la otra. Es decir, la correlación no implica causalidad. Una correlación alta entre dos variables no significa que una cause a la otra. Las pruebas de estadística inferencial están basadas en la correlación lineal.

Ejemplos de correlación Variable X Variable Y Correlación Altura Peso Positiva Velocidad Núm. de minutos en llegar Negativa Número de adultos que viven en la casa Número de niños que viven en la casa No correlación Autoconcepto académico Logro escolar Empatía en la práctica clínica Efectividad de la terapia Número de caries en los niños Vocabulario de los escolares Ambas debidas a la edad de los niños Vacunas aplicadas de H1N1 Prevalencia de H1N1 Ingreso total Porcentaje del ingreso gastado en alimentos Evaluación en curso de manejo Infracciones de tránsito Número de bares Número de iglesias Debida a una 3ª variable Habilidad para remar Tiempo requerido para atravesar un lago Ansiedad Ejecución en una tarea Curvilínea

Dispersigramas Constituyen un medio visual de entender los patrones de los datos numéricos bivariados. Cada punto corresponde a una observación bivariada. Muestran la dirección y la fuerza de la relación. También evidencian las observaciones extremas o sospechosas. Se construyen sólo para datos cuantitativos.

Dispersigramas Correlación lineal Correlación no lineal

Propiedades de la correlación lineal El valor de r no depende de las unidades de medición de ambas variables. El valor de r es simétrico: no depende de cuál de las dos variables se rotula X y cuál Y. r =  1 ocurre sólo cuando todos los puntos en el dispersigrama caen exactamente en una línea recta. r mide solamente la relación lineal entre dos variables.

Índice de correlación de Pearson Es el coeficiente más utilizado para estudiar el grado de relación lineal existente entre dos variables cuantitativas.   A finales del siglo XIX, Sir Francis Galton introdujo el concepto de correlación. De aquí partió el desarrollo del coeficiente de correlación creado por Karl Pearson y otros científicos biométricos. (zx zy) r = n - 1

Correlación lineal la autoevaluación que hacen de sus conocimientos sobre el tema? ¿Los puntajes que los alumnos obtienen en un examen están relacionados con a) ¿Cuál es la dirección de la relación? b) ¿Cuál es la magnitud de la relación? c) ¿Una variable es la causa a la otra?

Correlación no implica causalidad

Ejemplo (dos variables cuantitativas): Estudiante X Examen sobre un tema (30 preguntas) Y Autoevaluación de conocimientos sobre un tema (De 1 a 7) Puntajes Z de X (Zx) Z de Y (Zy) Productos cruzados (Zx . Zy) 1 16 -1.45 2.09 2 18 3 -0.96 -0.48 0.46 22 6 0.00 0.96 4 24 5 0.48 0.23 20 7 0.70 8 26 9 28 1.45 1.39 10 11 12 13 14 (zx zy) = 9.27

Correlación de Pearson Cálculo:   (zx zy) r = N - 1 9.27 r = 14 - 1 r = 0.71 a) Dirección de la relación: Positiva b) Magnitud de la relación: de moderada a fuerte c) Una variable no causa la otra

CORRELACIONES NO PARAMÉTRICAS

Coeficientes de correlación por nivel de medición de las variables Coeficiente de Pearson r Dos variables cuantitativas Coeficiente de rangos de Spearman rs Dos variables de rango Tau de Kendall tau Coeficiente phi  Dos variables dicotómicas naturales V de Cramer V Dos variables nominales Coeficiente tetracórico rt Dos variables dicotómicas creadas Coeficiente punto-biseral rpb Una variable cuantitativa con una variable dicotómica natural Coeficiente biseral rb Una variable cuantitativa con una variable dicotómica creada

Coeficientes de correlación para variables de rango Rho de Spearman Tau de Kendall τ Concordancia W

Coeficientes de correlación para variables de rango Nombre del coeficiente Características Símbolo Rho de Spearman Variables ordinales Los valores de -1 a +1 Se altera de manera importante ante la presencia de un valor extremo Relación lineal Muestras aleatorias ρ

Coeficiente de correlación de Spearman Es apropiado para estudiar la relación entre variables ordinales. También se utiliza con variables cuantitativas pero no es posible suponer que la distribución es normal. Toma valores entre -1 y 1, y se interpreta igual que el coeficiente de correlación de Pearson. ρ = rho = Correlación 6 = Constante D = Diferencia entre el rango en X y el rango en Y N = Número de casos

Coeficiente de correlación de Spearman Ejemplo: Dos profesores, uno de matemáticas y otro lengua (español), indicaron el rango que correspondía a cada uno de los ocho alumnos de su grupo en su aprovechamiento escolar. Σ d2 = 28 n = 8 rs rs = 1 – 6 (28) 8 (82 – 1) rs = 0.67

Coeficiente de correlación de Spearman Ejemplo: Se evaluó el coeficiente intelectual de 10 personas, así como el número de horas que veían la televisión a la semana, y se ordenaron (de menor a mayor) de acuerdo con los valores que obtuvieron en cada variable. Persona Coef. Intelec. (CI) Horas TV/sem (TV) Rango en CI Rango en TV d d2 1 86 2 97 20 6 -4 16 3 99 28 8 -5 25 4 100 50 4.5 10 -5.5 30.25 5 -3.5 12.25 103 -2 7 106 2.5 20.25 110 17 9 113 9.5 49 12 5.5 rs = 1 – 6 (196) 10 (102 – 1) rs = 0.19 Σ d2 = 196 n = 10

Coeficientes de correlación para variables de rango Nombre del coeficiente Características Símbolo Tau de Kendall Variables ordinales Combinación de una variable ordinal con una de intervalo Cuando no se cumplen los supuestos de normalidad Valores de -1 a +1 τ

Coeficientes de correlación para variables de rango Nombre del coeficiente Características Símbolo Concordancia Expresión del acuerdo promedio de los rangos De .00 a 1.00 Su valor es la razón de la correlación elevada al cuadrado de los datos ordenados w

Coeficientes de correlación para variables cualitativas Phi / fi ϕ C de contingencia V de Cramer Tetracórico rt

Coeficientes de correlación para variables cualitativas Nombre del coeficiente Características Símbolo Phi / fi Variables nominales dicotómicas Distribución basada en la χ2 Participantes elegidos al azar Sólo admite valores positivos ϕ

Coeficientes de correlación para variables cualitativas Nombre del coeficiente Características Símbolo C de contingencia Variables nominales polítomas Distribución basada en la χ2 Participantes elegidos al azar El valor de la correlación depende de las columnas C

Coeficientes de correlación para variables cualitativas Nombre del coeficiente Características Símbolo V de Cramer Dos variables nominales Sus valores oscilas entre cero y uno V

Coeficientes de correlación para variables cualitativas Nombre del coeficiente Características Símbolo Tetracórico Variables dicotomizadas de manera artificial Relaciones de tipo lineal rt

Coeficientes de correlación para variables mixtas Nombre del coeficiente Biserial rb Punto biserial rpb

Coeficientes de correlación para variables mixtas Nombre del coeficiente Características Sím-bolo Biserial Una variable cuantitativa + una dicotómica creada o dicotomizada rb

Coeficientes de correlación para variables mixtas Nombre del coeficiente Características Sím-bolo Punto biserial Una variable cuantitativa + una dicotómica natural rpb