Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra la independiente Se grafica con el diagrama de dispersión. Dice cómo es la relación entre las dos variables. El análisis consiste en encontrar la “mejor” línea recta de esos puntos.
Supuestos La variable X o independiente o predictora (está bajo el control del investigador), la variable Y es la variable dependiente o predicha. Los valores de X son fijos (seleccionados previamente por el investigador). Para cada X, existe un conjunto de valores de Y, que deben seguir una distribución normal (es decir, los valores de Y deben ser normales), para aplicar con validez los procedimientos de inferencia y/o estimación. Todas las varianzas de las subpoblaciones de Y son iguales.
El modelo de regresión lineal La relación se puede representar gráficamente mediante una línea recta. Se supone que el error sigue una distribución normal con media cero y varianza sigma2. El modelo de regresión completo es Y es el valor de la variable dependiente A o alfa es el intercepto, donde cruza el eje Y B o beta es la pendiente o inclinación
Diagrama de dispersión
Diagrama de dispersión y recta
Prueba de hipótesis Prueba de Ho: beta=0, mediante el estadístico F. El modelo lineal proporciona un buen ajuste para los datos, pero un modelo curvilíneo podría proporcionar un mejor ajuste.
Estudio de la significancia Tiene dos grandes partes: el análisis de varianza, que dice si el modelo es significativo como un todo el estudio de los coeficientes individuales por medio de una prueba t. La prueba t permite probar hipótesis y construir intervalos de confianza para los coeficientes del modelo
Ejemplo: regresión lineal simple
Ejemplo: regresión lineal simple
Correlación simple
Correlación simple Es una extensión de la regresión simple. Mide la calidad del ajuste de una línea. Dice cuánto se relacionan las dos variables r es el coeficiente de correlación r2 es el coeficiente de determinación
Prueba de hipótesis Ho: r=0, mediante la estadística F Si r es igual a cero, se concluye que no existe correlación lineal entre las variables, pero puede ser no lineal (exponencial, curva, etc.)
Coeficiente r de Pearson Puede variar de –1 a +1 -1 correlación negativa perfecta -0.9 correlación negativa muy fuerte -0.75 correlación negativa considerable -0.5 correlación negativa media -0.1 correlación negativa débil 0.0 no existe correlación entre las variables Los programas reportan el valor de p del coeficiente para evaluar la significancia de la correlación