Supuestos en el análisis de regresión Miles, J. & Shervin, M. (2011). Applyng regression & correlation. A guide for students and researchers. London: Sage. Chap. 4. Parte 2a. Supuestos para distribuciones multivariadas
Distribuciones multivariadas Distribuciones conjuntas. Contienen más de una variable. Son más complejas que las univariadas. Están regidas por los mismos principios.
Residuales Diferencia entre los puntajes predichos por el modelo y los puntajes reales. Error.
Residuales Distribución de los puntajes brutos = Distribución de los residuales Modelo de un parámetro: Media Residuales: Puntaje - media Todo se aplica de igual manera a las distribuciones de residuales. Puntajes brutos Residuales
Estimadores de mínimos cuadrados Media Beta o pendiente
Cuatro supuestos básicos 1. Normalidad en la distribución de los residuales En cada valor de la VD, la distribución de los residuales debe ser normal. 2. HomocedasticidadLa varianza de los residuales en cada grupo de valores de la VI debe ser igual. 3. Linealidad En cada valor posible de la VD, el valor esperado (la media) de los residuales debe ser igual a cero. 4. IndependenciaEl correlación esperada entre los residuales para cualquier par de casos debe ser igual a cero
1. Normalidad de los residuales En cada valor de la VD, la distribución de los residuales debe ser normal. Examinar: A) Outliers B) Sesgo y curtosis
Outliers No outlier Outlier ¿Por qué? ¿Error o real? Distribución conjunta o multivariadas Distribuciones univariadas
Outliers Complicado con 1VI Muy difícil con 2VIs Imposible con >2VIs ¿Cómo examinar si hay outliers? Método gráfico Dispersigrama Métodos con residuales 1º Calcular una ecuación de regresión. 2º Ver qué tan lejos se encuentra el puntaje de su valor predicho.
Outliers ¿Cómo examinar si hay outliers? Modelo Coeficientes no estandarizados Error estándar de Beta Coeficientes estandarizados tSig. Constante IQ de la Mujer a. Variable dependiente: IQ del Hombre IQ del Hombre = X IQ de la Mujer º Cálculo de la ecuación de regresión. 3º. Cálculo de las diferencias entre los valores predichos y los reales (residuales) 2º Cálculo de los valores predichos para cada par de puntajes (IQ de cada Hombre X IQ de la Mujer). Distribución conjunta o multivariadas
Outliers ¿Cómo examinar si hay outliers? IQ del Hombre = X IQ de la Mujer Línea de regresión Línea de mejor ajuste Residuales Dispersigrama con residuales Desventaja : Limitado a una VI.
Outliers ¿Cómo examinar si hay outliers? Histograma de residuales Outlier
Outliers ¿Cómo examinar si hay outliers? Dispersigrama con valores predichos y residuales Outlier Ventaja : Es posible usarlo cuando la regresión incluye muchas Vis.
Outliers Ejemplo Eventos de la vida Molestias Apoyo social Depresión
Outliers Eventos de la vida Molestias Apoyo social Depresión Distribución normal Dispersigramas bivariados sin outliers Distribución normal Eventos de la vida Molestias Eventos de la vida Apoyo social Eventos de la vida Depresión Molestias Eventos de la vida Molestias Apoyo social Molestias Depresión
Outliers Modelo Coeficientes no estandarizados Coeficientes estandarizados tSig. BError estándarBeta 1(Constante) Eventos de la vida Molestias Apoyo social a. Variable dependiente: Depresión Pero, ¿hay outlier multivariado? Analizar Estadísticos descriptivos Descriptivos Guardar valores estandarizados como variables
Outliers Analizar Estadísticos descriptivos Descriptivos Guardar valores estandarizados como variables Caso Eventos Z EventosMolestias Z MolestiasApoyo Z ApoyoDepresión Z Depresión Z RESID Aparece un outlier cuando se considera todos los puntajes con los residuales.
Outliers Analizar Regresión Lineal Guardar Valores pronosticados / Residuos Estandarizados [ZPRED / ZRESID] Outlier Dispersigrama con puntajes predichos y residuales
Tipos de residuales Analizar Regresión Lineal Guardar Residuos
Comparación de los residuales Caso 3