Tema 5: Asociación. 1. Introducción. 2. Tablas y gráficas bivariadas.

Slides:



Advertisements
Presentaciones similares
ANALISIS PARAMÉTRICOS
Advertisements

Tema 4: Medidas de posición individual.
Tema 6: Regresión lineal.
Tema. 5. Variabilidad. Concepto
Tema.9.Predicción y estimación. Concepto. Cálculo de la ecuación de regresión lineal. Modelo general lineal. Evaluación del modelo. Diagnóstico del modelo.
Tema 7. Transformaciones. Transformaciones lineales
Tema. 6. Medidas de forma y valores atípicos. Asimetría y curtosis
Bloque III. Caracterización de la relación entre variables Tema. 8
Tema.11. Principales modelos de distribución de probabilidad en Psicología: Variables discretas: binomial y Poisson. Variables continuas: normal, chi.
Tema 19: Contraste no paramétrico de hipótesis: Conceptos básicos
Tema 22: Análisis de tablas de contingencia Prueba c2 como medida de asociación y como prueba de contraste. Coeficientes derivados de c2. Interpretación.
Instructor: Lic. Cristian R. Arroyo L.
Lic. Cristian R. Arroyo López
Técnicas para el análisis de datos en el enfoque cuantitativo
Estadísticas Inferenciales Capítulo 10
Capítulo 4: Medidas de dispersión
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Estadística: -Correlación y regresión
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Introducción Los fenómenos biológicos no suelen ser constantes, por lo que será necesario que junto a una medida que indique el valor alrededor del cual.
Estadística Administrativa II
Distribuciones de frecuencias bidimensionales
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Tema 1- Regresión lineal simple.
CURSO DE ESTADÍSTICA BÁSICA
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar VARIABLE ESTADÍSTICA UNIDIMENSIONAL Población:
Estadística bidimensional
Facultad: Turismo Y Hotelería
Análisis no paramétricos
Distribuciones bidimensionales. Tablas de contingencia
ANALISIS DE DATOS CON EXCEL
Clases 4 Pruebas de Hipótesis
ANALISIS DE DATOS CATEGORICOS
Pronósticos, Series de Tiempo y Regresión
Tema 17: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
ESTADÍSTICAS DESCRIPTIVA
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
Coeficiente de Variación
Estadística bidimensional
Tratamiento de datos y azar
Herramientas básicas.
Variables estadísticas bidimensionales
RELACIÓN ENTRE VARIABLES
Estadística I. Finanzas y Contabilidad
Análisis de Datos en Economía
LA ESTADÍSTICA PROF.: EDMUNDO C.PARDO H. CARACAS,OCTUBRE DE 2014
“Tablas de Contingencia y medidas de asociación”
INTRODUCCION En esta base de datos, la variable “estrés ” es categórica (tiene estrés / no tiene estrés ) y querríamos saber si está relacionada.
coeficientes de correlación de
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
COEFICIENTE DE CORRELACIÓN
Tipos de Variables.- Cualitativas. Describen cualidades de los elementos de la muestra. Nominales. Categorías excluyentes y sin orden. (Ej. Sexo) Ordinales.
Varianza y Covarianza.
Estadística II Regresión Lineal.
Análisis de los Datos Cuantitativos
Variables estadísticas bidimensionales
REPASO DE ESTADISTICA Supóngase que aplicamos un cuestionario de nueve preguntas a un grupo de 30 alumnos y que sus resultados fueran los siguientes: 4.
MEDIDAS DE TENDENCIA CENTRAL
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Variables estadísticas bidimensionales
Correlación Capítulo 5 Capítulo 5: Ciso 3155.
Correlación ρ (rho) r.
Unidad 4 Análisis de los Datos.
ANÁLISIS DE LA INFORMACIÓN La relación entre variables.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
1 ANÁLISIS DE CORRELACIÓN, REGRESIÓN Y CONTRASTE.
LA COVARIANZA Y EL COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON
Tema 5: Asociación. 1. Introducción. 2. Tablas y gráficas bivariadas.
Transcripción de la presentación:

Tema 5: Asociación. 1. Introducción. 2. Tablas y gráficas bivariadas. 3. Variables cuantitativas. 3.1. Covarianza. 3.2. Coeficiente de correlación de Pearson. 3.3. Matriz de varianzas/covarianzas y matriz de correlaciones. 4. Variables semicuantitativas: Coeficiente de Spearman. 5. Variables cualitativas: Indices Ji Cuadrado y V de Cramer. 6. Asociación entre variables de escalas diferentes. 7. Concepto de relaciones no lineales.

5.1 Introducción Hasta ahora nos hemos centrado en medidas de tendencia central, variabilidad, asimetría y curtosis de una única variable. No obstante, en la práctica es común examinar dos o más variables conjuntamente (v.g., relación entre inteligencia y rendimiento, etc.) En este tema nos centraremos en la relación entre 2 variables (a partir de n observaciones apareadas) y calcularemos (en particular) un índice que nos dará el grado de relación/asociación entre ambas variables: el coeficiente de correlación lineal (de Pearson)

5.2 Representación gráfica de una relación rendimiento rendimiento rendimiento inteligencia inteligencia inteligencia Relación lineal negativa Sin relación Relación lineal positiva Nota: El coeficiente de correlación de Pearson mide relación LINEAL.

Representación gráfica de una relación (2) rendimiento rendimiento inteligencia inteligencia Relación no lineal Relación lineal Nota: El coeficiente de correlación de Pearson mide relación LINEAL.

Representación gráfica de una relación (3) rendimiento rendimiento rendimiento inteligencia inteligencia inteligencia Relación lineal perfecta (casi perfecta) Relación lineal fuerte/moderada Relación lineal débil Ahora necesitamos un índice que nos informe tanto del grado en que X e Y están relacionadas, y si la relación es positiva o negativa

5.3 Covarianza e índice de correlación de Pearson Observad que cuando la relación lineal es positiva, cuando las puntuaciones diferenciales de X son positivas, las puntuaciones diferenciales de Y suelen ser positivas. rendimiento Caso 1 inteligencia Observad que cuando la relación lineal es negativa, cuando las puntuaciones diferenciales de X son positivas, las puntuaciones diferenciales de Y suelen ser negativas. rendimiento Caso 2 inteligencia

Covarianza La covarianza aprovecha esta característica señalada en la transparencia anterior (al emplear el producto de las puntuaciones diferencias de X e Y). He aquí la fórmula: En el caso 1, la covarianza será un valor positivo, y en el caso 2, la covarianza será un valor negativo. Por tanto la covarianza nos da una idea de si la relación entre X e Y es positiva o negativa. Problema: la covarianza no en un índice acotado (v.g., cómo interpretar una covarianza de 6 en términos del grado de asociación), y no tiene en cuenta la variabilidad de las variables. Por eso se emplea el siguiente índice....

Coeficiente de correlación (lineal) de Pearson El coeficiente de correlación de Pearson parte de la covarianza: Ahora veremos varias propiedades del índice...

Coeficiente de correlación (lineal) de Pearson Propiedad 1. El índice de correlación de Pearson no puede valer menos de -1 ni más de +1. Un índice de correlación de Pearson de -1 indica una relación lineal negativa perfecta Un índice de correlación de Pearson de +1 indica una relación lineal positiva perfecta. Un índice de correlación de Pearson de 0 indica ausencia de relación lineal. (Observad que un valor cercano a 0 del índice no implica que no haya algún tipo de relación no lineal: el índice de Pearson mide relación lineal.)

Coeficiente de correlación (lineal) de Pearson Propiedad 2. El índice de correlación de Pearson (en valor absoluto) no varía cuando se transforman linealmente las variables. Por ejemplo, la correlación de Pearson entre la temperatura (en grados celsius) y el nivel de depresión es la misma que la correlación entre la temperatura (medida en grados Fahrenheit) y el nivel de depresión. Evidentemente, el índice de correlación de Pearson es el mismo entre las puntaciones directas de X e Y, o entre las puntuaciones diferenciales de X e Y, o entre las puntuaciones típicas de X e Y. (Recordad que las puntuaciones diferenciales y las puntuaciones típicas son transformaciones lineales de las puntuaciones directas.)

Coeficiente de correlación (lineal) de Pearson Interpretación Hemos de tener en cuenta qué es lo que estamos midiendo para poder interpretar cuán grande es la relación entre las variables bajo estudio. En muchos casos, depende del área bajo estudio. En todo caso, es muy importante efectuar el diagrama de dispersión. Por ejemplo, en el caso de la izquierda, es claro que no hay relación entre inteligencia y rendimiento. Sin embargo, si calculamos el índice de correlación de Pearson nos dará un valor muy elevado, causado por la puntuación atípica en la esquina superior derecha. rendimiento inteligencia

Coeficiente de correlación (lineal) de Pearson Interpretación (2) Es importante indicar que “CORRELACIÓN NO IMPLICA CAUSACIÓN”. El que dos variables estén altamente correlaciones no implica que X causa Y ni que Y causa X. (Esa es una de las razones empleadas por las tabaqueras en el tema de la correlación entre cáncer de pulmón y el hecho de fumar.)

Coeficiente de correlación (lineal) de Pearson Interpretación (3) Es importante indicar que el coeficiente de correlación de Pearson puede verse afectado por la influencia de terceras variables. Por ejemplo, si fuéramos a un colegio y medimos la estatura y pasamos una prueba de habilidad verbal, saldrá que los más altos también tienen más habilidad verbal...claro, que eso puede ser debido simplemente a que en el colegio los niños más altos serán mayores en edad que los más bajos. Si se parcializa esta “tercera” variable (mediante “correlación parcial”, que ya veremos más adelante), difícilmente habrá una relación de importancia entre estatura y habilidad numérica. Hay muchos casos en que es la tercera variable la causante de una alta relación entre X e Y (y ello muchas veces es difícil de identificar) 14 a Habilidad numérica 12 a 10 a 8 a 6 años Estatura

Coeficiente de correlación (lineal) de Pearson Interpretación (3) Por otra parte, el valor del coeficiente de Pearson depende en parte de la variabilidad del grupo. Si efectuamos el coeficiente de Pearson entre inteligencia y rendimiento con todos los sujetos, el valor del coeficiente de Pearson será bastante elevado. Sin embargo, si empleamos únicamente los individuos con CI bajo (o CI alto) y calculamos la correlación con Rendimiendo, el valor del coeficiente de Pearson será claramente menor. Rendimiento Un grupo heterogéneo daría pues un mayor grado de relación entre variables que un grupo homogéneo. CI bajo CI alto inteligencia

5.4 Otros coeficientes: variables semi-cuantitativas Claro está, es posible obtener medidas del grado de relación de variables cuando éstas no sean cuantitativas. El caso en que las variables X e Y sean ordinales Recordad, cuando tenemos variables con escala ordinal, podemos establecer el orden entre los valores, pero no sabemos las distancias entre los valores. (Si supiéramos la distancia entre los valores ya estaríamos al menos en una escala de intervalo) Podemos calcular el coeficiente de correlación de Spearman o el coeficiente de correlación de Kendall. (Veremos el primero.)

Coeficiente de correlación de Spearman Lo que tenemos ahora son 2 sucesiones de valores ordinales. El coeficiente de Spearman es un caso especial del coeficiente de correlación de Pearson aplicada a dos series de los n primeros números naturales (cuando no hay empates; si hay –muchos- empates hay otra fórmula es la diferencia entre el valor ordinal en X y el valor ordinal en Y del sujeto i

Coeficiente de correlación de Spearman (propiedades) Primera. Se encuentra acotado, como el coeficiente de Pearson entre -1 y +1. Un coeficiente de Spearman de +1 quiere decir que el que es primero en X es primero en Y, el que es segundo en X es segundo en I, etc Un coeficiente de Sperman de -1 quiere decir que el que es primero en X es último en Y, el segundo en X es el penúltimo en Y, etc. Segunda. Su cálculo es muy sencillo (más que el del coeficiente de correlación de Pearson). No obstante, con los ordenadores y un programa estadístico, esto es irrelevante estos días...

5.5 Variables cualitativas Prueba c2 como medida de asociación y como prueba de contraste La prueba chi-cuadrado es una prueba no paramétrica que se emplea para medir la asociación entre dos variables cuando tenemos tablas de contingencia. También es empleada, de manera general, para evaluar la divergencia entre una puntuaciones observadas (empíricas) y unas puntuaciones predichas (teóricas). De manera general, el estadístico chi-cuadrado se obtiene así: Donde fe representa las frecuencias empíricas y ft representa las frecuencias teóricas

Prueba c2 como medida de asociación: El caso de independencia de 2 variables cualitativas Las frecuencias empíricas son las que tenemos en la tabla de contingencia. Ahora bien, ¿cómo computar las frecuencias teóricas? Tal proceso es simple: Si ambas variables son independientes, la frecuencia teórica de cada celdilla será el resultado de multiplicar la suma de frecuencias de la fila x la suma de frecuencia de las columnas, y ese resultado se divide por N Para calcular "chi-cuadrado" con tablas de contingencia en internet: http://faculty.vassar.edu/lowry/newcs.html

Prueba c2 como medida de asociación Prueba c2 como medida de asociación. Coeficientes derivados e interpretación A partir de la prueba chi-cuadrado, se han propuesto cierto número de medidas de asociación entre variables cuando tenemos frecuencias en tablas de contingencia. Se trata de cuantificar la fuerza de la relación entre dos variables. Caso de tener tablas 2x2: Coeficiente phi Este índice se interpreta de manera análoga al coeficiente de Pearson (pero observa que phi no puede ser negativo...sólo de 0 a 1)

Prueba c2 como medida de asociación: Coeficientes derivados e interpretación Caso de tener más de 2 filas ó columnas: Prueba de Cramer m es el número menor entre el número de filas-1 y columnas-1 Este índice se interpreta análogamente al índice de Pearson (excepto por el tema del signo). Observa que si la tabla es 2x2 este índice coincide con el índice phi