Análisis de Datos en Psicología Análisis de Datos en Psicología * Estadística bivariada Área de Metodología.

Slides:



Advertisements
Presentaciones similares
ANALISIS PARAMÉTRICOS
Advertisements

Tema 6: Regresión lineal.
Tema.9.Predicción y estimación. Concepto. Cálculo de la ecuación de regresión lineal. Modelo general lineal. Evaluación del modelo. Diagnóstico del modelo.
Tema 3: Estadística descriptiva bivariante y regresión lineal.
Tema 3: Estadística descriptiva bivariante y regresión lineal.
REGRESION Y CORRELACION
Estadística Unidad II Regresión lineal
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Análisis de Datos en Psicología * Índices de posición
Estadística: -Correlación y regresión
15. Regresión lineal Este tema, prácticamente íntegro, está calcado de los excelentes apuntes y transparencias de Bioestadística del profesor F.J. Barón.
4ºESO Matemáticas B Colegio Divina Pastora (Toledo)
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Estadística Descriptiva
Econometria 2. Modelo de Regresión Lineal Simple
Regresión y correlación
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Regresión Simple..
Tema 1- Regresión lineal simple.
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar VARIABLE ESTADÍSTICA UNIDIMENSIONAL Población:
Estadística bidimensional
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Análisis Descriptivo de datos Bivariados
Análisis de Correlación y de Regresión lineal simple
La lógica de covarianza
UNIVERSIDAD AUTONOMA DEL PERÚ
Distribuciones bidimensionales. Tablas de contingencia
Tema 3: Estadística descriptiva bivariante y regresión lineal.
ELEMENTOS DE ESTADÍSTICA BIVARIANTE
CORRELACION Y REGRESION LINEAL: Introducción
Estadística I.
Pronósticos, Series de Tiempo y Regresión
Universidad Central de Venezuela Facultad de Agronomía Cátedra de Estadística 1.
Introducción a la Inferencia Estadística
ESTADÍSTICA BIDIMENSIONAL
REGRESION LINEAL SIMPLE
Estadística bidimensional
LA RECTA DE REGRESIÓN CONTENIDOS:
Primerasdefiniciones y conceptos de la regresión El análisis de la regresión es una técnica estadística que se utiliza para estudiar la relación entre.
Variables estadísticas bidimensionales
RELACIÓN ENTRE VARIABLES
Estadística I. Finanzas y Contabilidad
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
Distribuciones de probabilidad bidimensionales o conjuntas
Estadística Descriptiva
FUNCIONES CONCEPTO Función es la correspondencia entre dos conjuntos A y B llamados Dominio e Imagen respectivamente, donde a cada elemento del conjunto.
Estadística aplicada a la educación
Relaciones entre variables y regresión
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
Estadística II Regresión Lineal.
Aplicaciones Estadísticas a las Finanzas Clase 1
Variables estadísticas bidimensionales
Correlación Decimos que dos variables, X e Y, están correlacionadas cuando hay una relación cuantitativa entre ellas. X suele ser la variable independiente.
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Variables estadísticas bidimensionales
TEMA 3: Estadística Bidimensional.
ANÁLISIS DE LA INFORMACIÓN La relación entre variables.
TEMA 3: Estadística Bidimensoional.
@ Angel Prieto BenitoMatemáticas Aplicadas CS I1 U.D. 12 * 1º BCS ESTADÍSTICA BIDIMENSIONAL.
UNIDAD IV Regresión y correlación lineal
Tema 2: Estadística bidimensional
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
CONCEPTOS BÁSICOS, TABULACIÓN, GRÁFICOS
1 REGRESIÓN CON VARIABLES DICOTÓMICAS TEMA 1 (CONTINUACIÓN)
ESTADÍSTICA BIDIMENSIONAL
ESTADISTICA BIDIMENSIONAL
Transcripción de la presentación:

Análisis de Datos en Psicología Análisis de Datos en Psicología * Estadística bivariada Área de Metodología Dpto. de Psicología Universidad de Oviedo

Introducción Formas de describir la relación entre dos variables cuando éstas son numéricas. Formas de describir la relación entre dos variables cuando éstas son numéricas. ¿Existe asociación entre ‘CI’ y el nivel de ‘rendimiento escolar’?

Estudio conjunto de dos variables A la derecha tenemos una posible manera de recoger los datos obtenidos observando dos variables en varios individuos de una muestra. A la derecha tenemos una posible manera de recoger los datos obtenidos observando dos variables en varios individuos de una muestra. En cada fila tenemos los datos de un individuo En cada fila tenemos los datos de un individuo Cada columna representa los valores que toma una variable sobre los mismos. Cada columna representa los valores que toma una variable sobre los mismos. CINotas 1626,1 1546,0 1807,8 1586,2 1716,6 1696,0 1665,4 1768,4 1636,

Diagramas de dispersión o nube de puntos Las observaciones pueden ser representadas en un diagrama de dispersión. En ellos, cada individuo es un punto cuyas coordenadas son los valores de las variables. Nuestro objetivo será intentar reconocer a partir del mismo si hay relación entre las variables, y de qué tipo.

Ejemplo CI 187 CI 161 Nota 7,6 Nota5,0 CI y las notas de 30 individuos representados en un diagrama de dispersión.

Ejemplo Parece que las notas aumentan con el CI

Incorrelación Relación lineal directa e inversa. Para valores de X por encima de la media tenemos valores de Y por encima y por debajo en proporciones similares. Relación no lineal. Para los valores de X mayores que la media le corresponden valores de Y menores. Esto es relación inversa o decreciente. Para los valores de X mayores que la media le corresponden valores de Y mayores también. Para los valores de X menores que la media le corresponden valores de Y menores también. Esto se llama relación directa o creciente entre X e Y.

Cómo reconocer buena o mala relación Dado un valor de X no podemos decir gran cosa sobre Y. Mala relación. Independencia. Conocido X sabemos que Y se mueve por una horquilla estrecha. Buena relación. Lo de “horquilla estrecha” hay que entenderlo con respecto a la dispersión que tiene la variable Y por si sola, cuando no se considera X. o o o o o

Otros modelos Se pueden considerar otros tipos de modelos, en función del aspecto que presente el diagrama de dispersión (regresión no lineal) Se pueden considerar otros tipos de modelos, en función del aspecto que presente el diagrama de dispersión (regresión no lineal) Incluso se puede considerar el que una variable dependa de varias (regresión múltiple). Incluso se puede considerar el que una variable dependa de varias (regresión múltiple).

Otras nubes de puntos

La covarianza entre dos variables, S xy, nos indica si la posible relación entre dos variables es directa o inversa. La covarianza entre dos variables, S xy, nos indica si la posible relación entre dos variables es directa o inversa. Directa: S xy >0 Directa: S xy >0 Incorrelacionadas: S xy =0 Incorrelacionadas: S xy =0 Inversa: S xy <0 Inversa: S xy <0 El signo de la covarianza nos dice si el aspecto de la nube de puntos es creciente o no, pero no nos dice nada sobre la intensidad de la relación entre las variables. El signo de la covarianza nos dice si el aspecto de la nube de puntos es creciente o no, pero no nos dice nada sobre la intensidad de la relación entre las variables. Covarianza de dos variables X e Y n-1

Preguntas frecuentes ¿Si Sxy=0 eso quiere decir que las variables son independientes? ¿Si Sxy=0 eso quiere decir que las variables son independientes? En la práctica, casi siempre sí, pero no tiene por qué ser cierto en todos los casos. En la práctica, casi siempre sí, pero no tiene por qué ser cierto en todos los casos. Lo contrario si es cierto: Independencia implica incorrelación. Lo contrario si es cierto: Independencia implica incorrelación.

Coef. de correlación lineal de Pearson Nos indica si los puntos tienen una tendencia a disponerse alineadamente. Nos indica si los puntos tienen una tendencia a disponerse alineadamente.

Es adimensional Es adimensional Sólo toma valores en [-1,1] Sólo toma valores en [-1,1] Las variables están incorrelacionadas  r=0 Las variables están incorrelacionadas  r=0 Relación lineal perfecta entre dos variables  r=+1 o r=-1 Relación lineal perfecta entre dos variables  r=+1 o r=-1 Cuanto más cerca esté r de +1 o -1 mejor será el grado de relación lineal. Cuanto más cerca esté r de +1 o -1 mejor será el grado de relación lineal. Siempre que no existan observaciones anómalas. Siempre que no existan observaciones anómalas. Propiedades de r +1 0 Relación inversa perfecta Relación directa casi perfecta Variables incorreladas

Coef. de correlación lineal de Pearson tiene el mismo signo que S xy por tanto de su signo obtenemos el que la posible relación sea directa o inversa. tiene el mismo signo que S xy por tanto de su signo obtenemos el que la posible relación sea directa o inversa. r es útil para determinar si hay relación lineal entre dos variables, pero no servirá para otro tipo de relaciones (cuadrática, logarítmica,etc...) r es útil para determinar si hay relación lineal entre dos variables, pero no servirá para otro tipo de relaciones (cuadrática, logarítmica,etc...)

/(2,16*3,74)=0,95 /(2,16*4,16)=0,82 /(3,74*4,16)=0,60

Ejemplos: correlaciones positivas

Ejemplos: casi perfectas y positivas

Ejemplos: correlaciones negativas

Evolución de r y diagrama de dispersión

Seed voxel PLS

Preguntas frecuentes Me ha salido r=1’2 ¿la relación es “superlineal”[sic]? Me ha salido r=1’2 ¿la relación es “superlineal”[sic]? ¿Superqué? Eso es un error de cálculo. Siempre debe tomar un valor entre -1 y +1. ¿Superqué? Eso es un error de cálculo. Siempre debe tomar un valor entre -1 y +1. ¿A partir de qué valores se considera que hay “buena relación lineal”? ¿A partir de qué valores se considera que hay “buena relación lineal”?... observaciones anómalas,campo de aplicación,etc...pueden modificar el criterio anterior.... observaciones anómalas,campo de aplicación,etc...pueden modificar el criterio anterior. |r|  0,8: Relación fuerte 0,6  |r| < 0,8: Relación mediana 0,4  |r| < 0,6: Relación débil |r| < 0,4: Relación muy débil

Coeficiente de determinación Grado de ajuste de un modelo de regresión (R xy 2 ) Grado de ajuste de un modelo de regresión (R xy 2 ) R 2 es una cantidad que sólo puede tomar valores en [0, 1] R 2 es una cantidad que sólo puede tomar valores en [0, 1] A R 2 también se le denomina porcentaje de variabilidad explicado por el modelo de regresión. A R 2 también se le denomina porcentaje de variabilidad explicado por el modelo de regresión. 1-R 2 es el coeficiente de alienación que también puede tomar valores en [0, 1] 1-R 2 es el coeficiente de alienación que también puede tomar valores en [0, 1] 1= CD+CA; CD=1-CA; CA=1-CD 1= CD+CA; CD=1-CA; CA=1-CD

Outliers

Outliers

Moduladoras

Moduladoras

Restricción de Rango

Normalidad y Homoscedasticidad

Tamaño muestral No existe consenso – rango entre 5 a 50 casos por VP No existe consenso – rango entre 5 a 50 casos por VP 15 casos por VP es un criterio aceptable 15 casos por VP es un criterio aceptable E.j., para 4 VP, min. N ~ 60 Otra forma de aproximarse al problema es usar un mínimo de 20 casos, y cuando se tienen muchas variables de 5 a 20 observaciones por variable (preferiblemente 20) Otra forma de aproximarse al problema es usar un mínimo de 20 casos, y cuando se tienen muchas variables de 5 a 20 observaciones por variable (preferiblemente 20)

Relaciones aparentes: ejemplos Existe una elevada correlación positiva y significativa entre las ventas anuales de chicle y la incidencia del crimen en los Estados Unidos de América. Existe una elevada correlación positiva y significativa entre las ventas anuales de chicle y la incidencia del crimen en los Estados Unidos de América. Obviamente, no es lícito concluir que prohibiendo la venta de chicle podría reducirse el crimen, pues ambas variables dependen de una tercera: el tamaño de la población. Obviamente, no es lícito concluir que prohibiendo la venta de chicle podría reducirse el crimen, pues ambas variables dependen de una tercera: el tamaño de la población.

Control de las relaciones aparentes Una correlación es un “proceso matemático” no una relación de causalidad, ya que es posible: – Y “causa” X – X “causa” Y – Z “causa” X and Y Las correlaciones pueden ser simples coincidencias (ej.:tamaños muestrales reducidos) Control: Diseño experimental Diseño experimental A.E.D. A.E.D. Técnicas alternativas Técnicas alternativas X ……. Y Z

Diseños correlacionales