Regresión lineal
Definición del problema Evaluar la capacidad explicativa de un conjunto de características socio demográficas que inciden en los ingresos laborales de los jóvenes. Evaluar el peso de factores tales como la edad, el sexo, el nivel de instrucción y la categoría ocupacional. Y (Nivel de Ingresos) = b0 + b1.X1 (nivel educativo)+ b2.X2 (categoría ocupacional) + b3.x3 (sexo) + b4.x4 (edad) + u
Gráficos de dispersión
Matriz de correlaciones (supuesto de multicolinealidad)
MULTICOLINEALIDAD Incorporar Interacción entre nivel educativo y edad
Transformación de las variables independientes
Lista de variables y propiedades Quiero establecer como categoría de comparación el nivel secundario completo para medir el efecto que produce tener menores o mayores credenciales a estas
Variable de origen Variable de resultado
Crea variable de interacción edad*nivel educativo
Aplicación del modelo
trabajamos sólo con los ocupados de entre 15 y 29 años que tienen ingresos
El método más usual es introducir: incluye todas las variables dependientes al mismo tiempo
Prueba para correlación de errores entre sí (varía entre 0y4. 2 es no correlación)
Pruebas correlación de errores con la variable Y (heterocedasticidad) Pruebas de normalidad de residuos
Guarda los residuos tipificados en valores z como variable. Puede utilizarse como variable filtro de casos raros
Pruebas de normalidad de residuos
Pruebas correlación de errores con la variable Y (heterocedasticidad)
Ajustes del modelo Transformación de la variable dependiente Eliminación de casos raros
Transformar ingresos en variable logarítmica
Nombre de la nueva variable Logaritmo de la variable que se asigne entre paréntesis
Eliminación de casos raros