Bioestadistica II 2014 FACULTAD DE CIENCIAS EXACTAS, FÍSICAS Y NATURALES. UNIVERSIDAD NACIONAL DE CÓRDOBA.
REGRESIÓN LINEAL MÚLTIPLE OBJETIVO: Encontrar un modelo que ajuste bien (es decir, que esté “cerca” de los datos observados) y que sea útil para predecir observaciones futuras razonablemente bien.
REGRESION LINEAL MULTIPLE La ecuación del modelo de regresión lineal múltiple es: yi = β 0 + β 1 x 1i + β 2 x 2i + …..+ β k x ki + e i donde, Y i = i-ésima observación de la variable dependiente Y x 1i, x 2i,...,x ki = i-ésimo valor de las variables regresoras X 1, X 2,...,X k o independientes β 0 = parámetro desconocido que representa la ordenada al origen de la recta (indica el valor esperado de y cuando x 1 =0, x 2 =0,...,x k =0) β 1,..., β k = parámetros desconocidos que representan las tasas de cambio en y frente al cambio unitario de X 1,X 2...,X k, respectivamente e i = término de error aleatorio
Hipotesis
Pasos a seguir para construir un modelo de regresion multiple 1.- Seleccionar las variables importantes 2.- Usar residuales 3.- Verificacion de supuestos
1.- SELECCIONAR LAS VARIABLES IMPORTANTES
Normalidad – Homogeneidad de Varianzas - Independencia 3.- VERIFICACION DE SUPUESTOS Linealidad …Transformaciones…. 2.- USAR RESIDUALES
Para estudiar la relación entre el pH (pH), la salinidad (Salinidad), el contenido de Zn (Zinc) y el contenido de K (Potasio) presentes en el suelo con la producción de biomasa de una forrajera, se registraron 45 mediciones de la biomasa (gr) y de dichos valores característicos del suelo donde crecieron las plantas. (salinidad.idb2) REGRESION LINEAL MULTIPLE
Salidas Ecuación estimada de la regresión
Análisis de los residuos studentizados vs cada una de las variables
Modelo 2 : ajuste polinómico
Modelo 3 : ajuste sin incluir el potasio
Predecir, si es posible, la biomasa producida en el suelo de pH=6, con una Salinidad de 35, un contenido de Zn=20 y de K= 900
Intervalos