La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Análisis de Datos en Psicología Análisis de Datos en Psicología * Estadística bivariada Área de Metodología.

Presentaciones similares


Presentación del tema: "Análisis de Datos en Psicología Análisis de Datos en Psicología * Estadística bivariada Área de Metodología."— Transcripción de la presentación:

1

2 Análisis de Datos en Psicología Análisis de Datos en Psicología http://www.psico.uniovi.es/Fac_Psicologia/w3doc/ad/ * Estadística bivariada Área de Metodología Dpto. de Psicología Universidad de Oviedo

3 Introducción Formas de describir la relación entre dos variables cuando éstas son numéricas. Formas de describir la relación entre dos variables cuando éstas son numéricas. ¿Existe asociación entre ‘CI’ y el nivel de ‘rendimiento escolar’?

4 Estudio conjunto de dos variables A la derecha tenemos una posible manera de recoger los datos obtenidos observando dos variables en varios individuos de una muestra. A la derecha tenemos una posible manera de recoger los datos obtenidos observando dos variables en varios individuos de una muestra. En cada fila tenemos los datos de un individuo En cada fila tenemos los datos de un individuo Cada columna representa los valores que toma una variable sobre los mismos. Cada columna representa los valores que toma una variable sobre los mismos. CINotas 1626,1 1546,0 1807,8 1586,2 1716,6 1696,0 1665,4 1768,4 1636,8......

5 Diagramas de dispersión o nube de puntos Las observaciones pueden ser representadas en un diagrama de dispersión. En ellos, cada individuo es un punto cuyas coordenadas son los valores de las variables. Nuestro objetivo será intentar reconocer a partir del mismo si hay relación entre las variables, y de qué tipo.

6 Ejemplo CI 187 CI 161 Nota 7,6 Nota5,0 CI y las notas de 30 individuos representados en un diagrama de dispersión.

7 Ejemplo Parece que las notas aumentan con el CI

8 Incorrelación 30 80 130 180 230 280 330 140150160170180190200 Relación lineal directa e inversa. Para valores de X por encima de la media tenemos valores de Y por encima y por debajo en proporciones similares. Relación no lineal. Para los valores de X mayores que la media le corresponden valores de Y menores. Esto es relación inversa o decreciente. Para los valores de X mayores que la media le corresponden valores de Y mayores también. Para los valores de X menores que la media le corresponden valores de Y menores también. Esto se llama relación directa o creciente entre X e Y.

9 Cómo reconocer buena o mala relación Dado un valor de X no podemos decir gran cosa sobre Y. Mala relación. Independencia. Conocido X sabemos que Y se mueve por una horquilla estrecha. Buena relación. Lo de “horquilla estrecha” hay que entenderlo con respecto a la dispersión que tiene la variable Y por si sola, cuando no se considera X. o o o o o

10 Otros modelos Se pueden considerar otros tipos de modelos, en función del aspecto que presente el diagrama de dispersión (regresión no lineal) Se pueden considerar otros tipos de modelos, en función del aspecto que presente el diagrama de dispersión (regresión no lineal) Incluso se puede considerar el que una variable dependa de varias (regresión múltiple). Incluso se puede considerar el que una variable dependa de varias (regresión múltiple).

11 Otras nubes de puntos

12 La covarianza entre dos variables, S xy, nos indica si la posible relación entre dos variables es directa o inversa. La covarianza entre dos variables, S xy, nos indica si la posible relación entre dos variables es directa o inversa. Directa: S xy >0 Directa: S xy >0 Incorrelacionadas: S xy =0 Incorrelacionadas: S xy =0 Inversa: S xy <0 Inversa: S xy <0 El signo de la covarianza nos dice si el aspecto de la nube de puntos es creciente o no, pero no nos dice nada sobre la intensidad de la relación entre las variables. El signo de la covarianza nos dice si el aspecto de la nube de puntos es creciente o no, pero no nos dice nada sobre la intensidad de la relación entre las variables. Covarianza de dos variables X e Y n-1

13

14 Preguntas frecuentes ¿Si Sxy=0 eso quiere decir que las variables son independientes? ¿Si Sxy=0 eso quiere decir que las variables son independientes? En la práctica, casi siempre sí, pero no tiene por qué ser cierto en todos los casos. En la práctica, casi siempre sí, pero no tiene por qué ser cierto en todos los casos. Lo contrario si es cierto: Independencia implica incorrelación. Lo contrario si es cierto: Independencia implica incorrelación.

15 Coef. de correlación lineal de Pearson Nos indica si los puntos tienen una tendencia a disponerse alineadamente. Nos indica si los puntos tienen una tendencia a disponerse alineadamente.

16 Es adimensional Es adimensional Sólo toma valores en [-1,1] Sólo toma valores en [-1,1] Las variables están incorrelacionadas  r=0 Las variables están incorrelacionadas  r=0 Relación lineal perfecta entre dos variables  r=+1 o r=-1 Relación lineal perfecta entre dos variables  r=+1 o r=-1 Cuanto más cerca esté r de +1 o -1 mejor será el grado de relación lineal. Cuanto más cerca esté r de +1 o -1 mejor será el grado de relación lineal. Siempre que no existan observaciones anómalas. Siempre que no existan observaciones anómalas. Propiedades de r +1 0 Relación inversa perfecta Relación directa casi perfecta Variables incorreladas

17 Coef. de correlación lineal de Pearson tiene el mismo signo que S xy por tanto de su signo obtenemos el que la posible relación sea directa o inversa. tiene el mismo signo que S xy por tanto de su signo obtenemos el que la posible relación sea directa o inversa. r es útil para determinar si hay relación lineal entre dos variables, pero no servirá para otro tipo de relaciones (cuadrática, logarítmica,etc...) r es útil para determinar si hay relación lineal entre dos variables, pero no servirá para otro tipo de relaciones (cuadrática, logarítmica,etc...)

18

19 /(2,16*3,74)=0,95 /(2,16*4,16)=0,82 /(3,74*4,16)=0,60

20 Ejemplos: correlaciones positivas

21 Ejemplos: casi perfectas y positivas

22 Ejemplos: correlaciones negativas

23 Evolución de r y diagrama de dispersión

24 Seed voxel PLS

25 Preguntas frecuentes Me ha salido r=1’2 ¿la relación es “superlineal”[sic]? Me ha salido r=1’2 ¿la relación es “superlineal”[sic]? ¿Superqué? Eso es un error de cálculo. Siempre debe tomar un valor entre -1 y +1. ¿Superqué? Eso es un error de cálculo. Siempre debe tomar un valor entre -1 y +1. ¿A partir de qué valores se considera que hay “buena relación lineal”? ¿A partir de qué valores se considera que hay “buena relación lineal”?... observaciones anómalas,campo de aplicación,etc...pueden modificar el criterio anterior.... observaciones anómalas,campo de aplicación,etc...pueden modificar el criterio anterior. |r|  0,8: Relación fuerte 0,6  |r| < 0,8: Relación mediana 0,4  |r| < 0,6: Relación débil |r| < 0,4: Relación muy débil

26 Coeficiente de determinación Grado de ajuste de un modelo de regresión (R xy 2 ) Grado de ajuste de un modelo de regresión (R xy 2 ) R 2 es una cantidad que sólo puede tomar valores en [0, 1] R 2 es una cantidad que sólo puede tomar valores en [0, 1] A R 2 también se le denomina porcentaje de variabilidad explicado por el modelo de regresión. A R 2 también se le denomina porcentaje de variabilidad explicado por el modelo de regresión. 1-R 2 es el coeficiente de alienación que también puede tomar valores en [0, 1] 1-R 2 es el coeficiente de alienación que también puede tomar valores en [0, 1] 1= CD+CA; CD=1-CA; CA=1-CD 1= CD+CA; CD=1-CA; CA=1-CD

27 Outliers

28 Outliers

29 Moduladoras

30 Moduladoras

31 Restricción de Rango

32

33

34 Normalidad y Homoscedasticidad

35 Tamaño muestral No existe consenso – rango entre 5 a 50 casos por VP No existe consenso – rango entre 5 a 50 casos por VP 15 casos por VP es un criterio aceptable 15 casos por VP es un criterio aceptable E.j., para 4 VP, min. N ~ 60 Otra forma de aproximarse al problema es usar un mínimo de 20 casos, y cuando se tienen muchas variables de 5 a 20 observaciones por variable (preferiblemente 20) Otra forma de aproximarse al problema es usar un mínimo de 20 casos, y cuando se tienen muchas variables de 5 a 20 observaciones por variable (preferiblemente 20)

36 Relaciones aparentes: ejemplos Existe una elevada correlación positiva y significativa entre las ventas anuales de chicle y la incidencia del crimen en los Estados Unidos de América. Existe una elevada correlación positiva y significativa entre las ventas anuales de chicle y la incidencia del crimen en los Estados Unidos de América. Obviamente, no es lícito concluir que prohibiendo la venta de chicle podría reducirse el crimen, pues ambas variables dependen de una tercera: el tamaño de la población. Obviamente, no es lícito concluir que prohibiendo la venta de chicle podría reducirse el crimen, pues ambas variables dependen de una tercera: el tamaño de la población.

37 Control de las relaciones aparentes Una correlación es un “proceso matemático” no una relación de causalidad, ya que es posible: – Y “causa” X – X “causa” Y – Z “causa” X and Y Las correlaciones pueden ser simples coincidencias (ej.:tamaños muestrales reducidos) Control: Diseño experimental Diseño experimental A.E.D. A.E.D. Técnicas alternativas Técnicas alternativas X ……. Y Z

38 Diseños correlacionales


Descargar ppt "Análisis de Datos en Psicología Análisis de Datos en Psicología * Estadística bivariada Área de Metodología."

Presentaciones similares


Anuncios Google