Análisis de Datos en Economía Regresión Lineal
Datos Iniciales Notas C.Int Horas 8 120 4 7 125 3 6 100 3 8 115 4 7 120 4 4 95 2 3 80 2 1 80 1 5 90 3 Partimos de la información obtenida de una muestra de 10 elementos de una determinada distribución. Las variables sometidas a observación son: Notas Obtenidas Coeficiente de Inteligencia Horas de Estudio
Objetivos Iniciales: ¿ Entendemos que las notas que saca un estudiante depende de las horas de estudio de dedicación a la asignatura o del Coeficiente de Inteligencia que tenga ? Ó ¿ de Ambas variables ? A partir de aquí nos planteamos, en primer lugar, realizar un análisis de regresión. El primer paso es realizar el análisis por el método introducir las dos variables simultáneamente
Matriz de Correlación Planteamiento de que existe o no asociación lineal entre las variables Ho : el coeficiente de correlación lineal es cero. Si el p-valor asociado es menor que se rechaza la hip. Nula Nos indica las variables introducidas y el método utilizado
Análisis de la Varianza Raíz cuadrada de la varianza residual Coeficiente de determinación corregido. Depende del numero de variables y numero de elementos. K-1 n-k n-1 SCR= Suma de los cuadrados de la regresión SCE= Suma de los cuadrados de los errores La Hipótesis nula: La ecuación de regresión muestral no explica un porcentaje significativo de la varianza de la variable Cuanto mayor sea F mas se explica que se queda por explicar
Coeficientes de regresión estandarizado Valor t B/error típico Cuanto mayor sea mas se explica de la variable dependiente Al igual que en otros contrastes se rechazara la variable si se acepta que el coeficiente es igual a cero.
Ganancias 4% 4% 15% 77% R2 = 96 % COEF. INTEL 81% HORAS 92% ¿Que aporta cada una de los regresores a la explicación de la variable dependiente?
Ganancias Método Introducir por bloques 1º horas, 2º C.Int.
Método Introducir por bloques 1º C.Int, 2º Horas.
Método por Pasos Método que se utiliza para la obtención semiautomatica del modelo de regresión. A través de la selección de cada una de las variables Se irán introduciendo las variables a partir de aquella que tenga mayor correlación. Se establece criterios de entrada y salida PIN probabilidad de entrada POUT probabilidad de salida (siempre es mayor que la probabilidad de entrada El criterio de aceptación de la variable es que se rechace la hipótesis nula de que el coeficiente sea igual a cero
Indicador de la colinealidad existente Método por Pasos Indicador de la colinealidad existente entre las variables. Tolerancia = ( 1-R2) Si el valor de la tolerancia es próximo a 0, la variable será casi una combinación lineal de las restantes.