Miles, J. & Shervin, M. (2011). Applying regression & correlation. A guide for students and researchers (chap. 3). London: Sage
Psicólogos experimentales Examinan diferencias entre condiciones experimentales (“Investigadores de ANOVA”) Psicólogos “correlacionales” Analizan mediante correlaciones y regresiones INVESTIGACIÓN PSICOLOGÍA Finalmente, experimentales y correlacionales hacen lo mismo, pero de diferente forma.
VARIABLES CATEGÓRICAS O NOMINALES Lo más común en la investigación en psicología es buscar diferencias entre grupos. Método simplificado: Suma de las desviaciones de los puntajes respecto de la media al cuadrado. ANOVA Método fácil y rápido. Pero: Es posible usar las VIs categóricas en las ecuaciones de regresión.
ANOVA llegó a ser la forma común de análisis de datos cuando la VI era categórica porque reducía la complejidad de los cálculos (no había computadoras ). Los programas computacionales separaron ANOVA y Regresión. Los científicos consideraron que eran cosas diferentes. Pero: ANOVA: es un caso especial de regresión, donde las VIs son categóricas y no continuas. Recientemente, el Modelo Lineal General (GLM) combina Regresión y ANOVA
VENTAJAS DEL USO DEL ANÁLISIS DE REGRESIÓN 1º El análisis de regresión es más claro conceptualmente: no hay distinción entre VIs categóricas y continuas. Pueden incluirse en el mismo análisis. 2º El análisis de regresión evita tener que categorizar las variables continuas para “ajustarlas” al ANOVA. V.gr., categorizar edad en: “niños ”, “jóvenes ” y “adultos”. a)Categorizando se pierde información muy valiosa obtenida arduamente. b)Categorizando se posibilitan relaciones espurias.
VENTAJAS DEL USO DEL ANÁLISIS DE REGRESIÓN 3º El análisis de regresión fuerza a considerar cómo podrían estar interactuando las VIs, según su influencia en la VD. El ANOVA estima automáticamente todas las interacciones posibles entre las VIs (procedimiento de pesca de datos «data fishing»). La regresión fuerza al investigador a especificar y calcular interacciones específicas (procedimiento más guiado por la teoría). Se evita «inflar» el error tipo I. 4º Con los procedimientos del Modelo Lineal General (GLM) se facilita entender qué está pasando y por qué.
La regresión puede utilizarse para analizar datos comúnmente analizados con t y con ANOVA Mismo propósito: Explicar la variabilidad de una variable (VD o criterio) con base en la variabilidad de una o más variables (VIs o predictoras)
Prueba t como Regresión
Ejemplo: Experimento de memoria VI Uso de ayudas mnémicas VD Número de objetos recodados correctamente Puntaje Grupo control (Sin mnemotecnia) n = 10 Se les presenta una lista de objetos y se les pide que traten de recordar tantos como puedan. Grupo experimental (Con mnemotecnia) n = 10 Antes de la tarea, se les muestra cómo usar una nemotecnia para mejorar la ejecución de su memoria
VI Grupo de uso de ayudas mnémicas Codificación: Control = 0 Experimental = 1 α - Intercepto: Valor de la VD cuando la VI = 0 En el ejemplo, la VI es 0 para el grupo control, por lo que el intercepto será igual a la media del grupo control. β - Pendiente: Incremento del puntaje en la VD cuando la VI incrementa 1. En el ejemplo, = 1: valor de código del grupo experimental. Por tanto, corresponde a la diferencia entre las dos medias. VD Número de respuestas correctas CON ANÁLISIS DE REGRESIÓN
Experimento Grupo control (0) Grupo experimental (1) 110 Si se efectuaran tres experimentos y se obtuvieran las siguientes medias: β = Diferencia de medias entre los dos grupos β = 10 – 10 =
Experimento Grupo control (0) Grupo experimental (1) Si se efectuaran tres experimentos y se obtuvieran las siguientes medias: β = Diferencia de medias entre los dos grupos β = 20 – 10 =
Experimento Grupo control (0) Grupo experimental (1) Si se efectuaran tres experimentos y se obtuvieran las siguientes medias: β = Diferencia de medias entre los dos grupos β = 50 – 10 =
GrupoPuntaje GrupoNMediaDEError CoeficienteError Coeficiente estandarizado tSig. Constate Grupo t =2.89, gl = 18 p=.01 Prueba t como regresión Regresión Datos 0 = Grupo control 1 = Grupo experimental
ANOVA como Regresión
VI Uso de ayudas mnémicas VD Número de objetos recodados correctamente Puntaje Grupo control (Sin mnemotecnia) n = 10 Se les presenta una lista de objetos y se les pide que traten de recordar tantos como puedan. Grupo experimental (Con mnemotecnia) n = 10 Antes de la tarea, se les muestra cómo usar una nemotecnia para mejorar la ejecución de su memoria Ejemplo: Extensión del experimento de memoria Grupo experimental (Con aromaterapia) n = 10 La sala en la que se efectúa la tarea, se impregna con una fragancia de romero, que se dice aumenta la memoria
VI Uso de ayudas mnémicas Objetos recodados Grupo control (Sin mnemotecnia) Grupo experimental (Con mnemotecnia) Ejemplo: Extensión del experimento de memoria Grupo experimental (Con aromaterapia) Codificación: 0 Codificación: 1Codificación: 2
Uso de la aproximación tradicional del ANOVA) GrupoPuntaje GrupoNMediaDEError Est95% CI para la media LowerUpper 0 (Control) ( Mnemo) (Aromat) TOTAL S CdfM CFSig. Entre grupos Dentro grupos Total (I) Grupo(J) GrupoDiferencia de medias (I-J) Sig. 0 (Control) 1 (Mnemotecnia) 3 (Aromaterapia) 1 (Mnemo) 2 (Aromater) 0 (Control) 2 (Aromater) 0 (Control) 1 (Mnemo) Grupo con media más alta Pruebas post hoc LSD
GpoPun- taje Gpo 1 Gpo CODIFICACIÓN DUMMY Grupo 1 : 1 = Sí están en el grupo de mnemotecnia 0 = No están en el grupo de mnemotecnia Grupo control = 0 Grupo experimental 1: Estrategia mnémica Grupo experimental 2: Aromaterapia Puntaje: VD ANOVA como Regresión VI con 3 valores: 0, 1 y 2 Para usar esta variable en regresión se requiere recodificarla en varias variables. Grupo 2 : 1 = Sí están en el grupo de aromaterapia 0 = No están en el grupo de aromaterapia
Suma de cuadrados glMedia cuadráticaFSig. Regresión Residual Total Pendiente (b)Error Tip.Coeficientes Estandarizados tSig Constante (Control) Grupo 1 (Mnemo) Grupo 2 (Aromat) < Análisis de regresión de ANOVA ANOVA como Regresión Pendientes – β: Indican la diferencia entre la media de cada grupo experimental y la media del grupo de referencia (grupo control). Si β es positiva (grupo 1), la media de la condición es más alta que la del grupo de referencia. Si β es negativa (grupo 2), la media de la condición es más baja que la del grupo de referencia.
Para mantener la tasa de.05 se necesita una significancia estadística para cada pendiente de (0.05/2) en lugar de.05. Ejemplo:
BONFERRONI Corrección para comparaciones múltiples Ejemplo: Para 2 comparaciones: 1. Control y Nemotécnica 2. Control y Aromaterapia Significancia original: 0.05 Significancia corregida: 0.05/2 = Pendiente (b)Error Tip.Coeficientes Estandarizados tSig Constante (Control) Grupo 1 (Mnemo) Grupo 2 (Aromat) < Para realizar la comparación: 3. Nemotécnica y Aromaterapia se requeriría: a) Correr nuevamente el análisis usando una de la otras variables como referencia. b) Corregir la significancia para 3 comparaciones en lugar de 2. No cambia la interpretación para ninguno de los dos
CODIFICACIÓN DE EFECTO Codificación Dummy Se usa un grupo de referencia. Codificación: 0 Codificación de efecto Uno de los grupos se elige arbitrariamente. Codificación: -1 Número de variables = Número de grupos menos uno Grupo Grupo 1 Grupo 2 Grupo 3 Grupo Grupo elegido arbitrariamente Núm. de variables = 5 - 1
5: Posgrado Ejemplo: Estudio de estrés en profesores de diferentes niveles de enseñanza 4: Licenciatura 3: Bachillerato 2: Secundaria 1: Primaria
Nivel de enseñanza Estrés : Posgrado Estudio de estrés en profesores de diferentes niveles de enseñanza Grupo Grupo 1 Grupo 2 Grupo 3 Grupo Codificación de efecto Grupo usado como referencia 4: Licenciatura 3: Bachillerato 2: Secundaria 1: Primaria
Coeficientes no estandarizados Coeficientes EstandarizadostSig Pendiente (B) Error típ.Beta Constante Grupo 1 Grupo 2 Grupo 3 Grupo El grupo 5 se excluye del análisis porque se toma como grupo de referencia. Para comparar su nivel de estrés se hace de nuevo el análisis tomando a otro grupo como referencia Media global Cantidad que cada grupo difiere de la media total Diferencias significativas de la media global - + S CglM CFSig Regresión Residual Total Análisis de regresión
Conclusiones: ANOVA es simplemente un caso especial de análisis de regresión. Cualquier análisis que se realice con ANOVA de un factor puede también efectuarse con análisis de regresión. Entonces, ¿por qué no usar siempre ANOVA? Hay circunstancias en que tiene más ventajas usar análisis de regresión que ANOVA para el análisis del cambio en los puntajes.
1ª. Fase a) Se asigna aleatoriamente a los participantes a las condiciones experimentales de contexto (VI) Grupo experimental: Presencia de olor Grupo control: Ausencia de olor b) Se les pide que examinen palabras y que las califiquen de acuerdo con la emocionalidad que les evoca. (No se les dice que están aprendiendo palabras). El proceso se denomina «Impronta»: palabras se aprenden implícitamente sin que el participante sea consciente. PalabrasEvaluación de la emocionalidad generada por la palabra Elefante Zanahoria Mantel Beligerante Automático Mucho : Bastante : Un poco : Nada Ejemplo: Experimento del contexto en la memoria
2ª fase Después de un descanso, se les dice que van a participar en otro experimento no relacionado con el anterior. Se les pide que llenen los espacios en una lista de palabras para completarlas. Presencia de olor o Ausencia de olor Mientras lo hacen, se recrea el contexto al cual evaluaron las palabras en la fase 1. Palabra _l__ a__e _a__r__a Z __a__i_ T_s__o M__t__ T_ l__o__ __l_ge__t_ U__v__s___d __tó__t___ __l Hay 2 tipos de palabras: Improntadas (I): incluidas en la lista de la Fase 1 No improntadas (N): no incluidas en la lista de la Fase 1
LetrasPalabra Impro nta _l_ _ a__e _a__r__a Z __a__i_ T_s__o M__t__ T_ l__o__ __l_ge__t_ U__v__s___d __to__t___ __l Elefante Catarata Zanahoria Tesoro Mantel Teléfono Beligerante Universidad Automático Col ININININININININININ VD: Número de palabras improntadas (las que se presentaron en la fase 1) Variable extraña: El vocabulario que posean las personas puede influir en la tarea de llenar los espacios en blanco para completar la palabra, ya que quienes tengan más habilidades de reconocimiento de palabras tendrán una mejor ejecución. Para controlar estadísticamente el efecto que el vocabulario pudiera tener en la VD se cuenta con el número de palabras no improntadas (que no estuvieron en la fase 1). Ésta es una medida sensible del efecto de la VI.
VI: Contexto Grupo control: Ausencia de olor. Codificación 0. Grupo experimental: Presencia de olor. Codificación 1. VD: Registros IC: Número de palabras improntadas completadas exitosamente NIC: Número de palabras no improntadas completadas exitosamente Diferencia entre IC y NIC GpoNICICDif
ESTRATEGIAS PARA ANALIZAR LOS DATOS 1ª Con prueba t t= 1.95, df= 48, p=.056 No se rechaza la Ho. No puede concluirse que la manipulación tuvo efecto.
2ª Con ANOVA factorial Factor 2: Grupo de contexto: control (Ausencia de olor) vs experimental (Presencia de olor). Grupos-independientes. Factor 1: Impronta de las palabras: Improntadas vs No Improntadas Medidas-repetidas. Hs: Habrá un efecto de interacción entre VIs (la manipulación experimental tendría un efecto en el grupo experimental, pero no en el control) Problema: Se está suponiendo que la correlación entre los puntajes (IC-NIC) es = 1. Si la correlación fuera <1 los resultados podrían ser distorsionados Control Experimental ___ NIC IC GRUPO PUNTAJE S FuenteF (gl= 1,48)Sig. Grupo Impronta Grupo X Impronta ns
Usar las palabras IC como VD y las palabras NIC como VI junto con la variable grupo. El nivel de vocabulario estará, por tanto, controlado, considerando la correlación entre IC y NIC. 3ª Con análisis de regresión Coeficientes no estandarizadosCoeficientes estanarizado tSig. Pendiente(B)Error tip.(Beta) Constante NIC Grupo El efecto de la manipulación experimental es ahora significativa. VD: IC
La regresión es una estrategia más poderosa para la prueba de hipótesis En el ejemplo: La diferencia en los valores de la significancia en los tres métodos es muy pequeña: Con las dos primeras estrategias se pasan solo un poco. Con la regresión apenas alcanza el nivel de significancia. Pero: Mientras más grande sea la muestra, mayor será la diferencia en poder entre las dos técnicas. Aquí la diferencia es pequeña en parte porque la muestra es pequeña. Además, Mientras menor sea la correlación entre las variables, mayor será el poder de la diferencia.
El análisis de regresión es una estrategia muy flexible: Se puede usar para analizar datos no experimentales y experimentales. Se puede utilizar con datos continuos o categóricos. Puede indicar la dirección y la magnitud de efectos particulares.