TEMA 8: ANÁLISIS DE LA REGRESIÓN Y CORRELACIÓN ENTRE DOS VARIABLES Estadística Descriptiva
ORGANIZACIÓN DEL CAPÍTULO 8 8.1 Introducción. 8.2 Determinación de la función a ajustar. Criterio de los mínimos cuadrados. 8.3 Diversos ajustes estándar: ajuste lineal, polinómico, potencial, exponencial e hiperbólico. 8.4 Estudio de la bondad del ajuste: Varianza residual y coeficiente de determinación. 8.5 Análisis de los residuos en el ajuste lineal 8.6 Predicción. Estadística Descriptiva
OBJETIVOS EJEMPLO 1: Determinar el precio de una casa (Y) X1=Superficie X2=Situación X3=Antigüedad etc. EJEMPLO 2: Seleccionar un trabajador (Y) X1=Formación académica X2=Experiencia laboral X3=Personalidad etc. EJEMPLO 3: Número de accidentes (Y) X=Número de vehículos en circulación Estadística Descriptiva
OBJETIVOS Estudiar el tipo de relación existente entre dos variables. EJEMPLO: Estudiar cómo se reproducen los virus en un cultivo. Se produce un aumento lineal, exponencial, etc. Estudiar variables que no pueden ser medidas directamente excepto a través del estudio de otras variables que estén relacionadas con ellas. EJEMPLO: Si los virus se reproducen según una relación de tipo lineal, se puede conocer el número de virus en un instante de tiempo sin realizar el experimento. Predecir comportamientos futuros de una de las variables conocido el valor de las otras. EJEMPLO: Predecir el número de virus en el experimento que se está realizando para un instante de tiempo futuro. Estadística Descriptiva
ESTUDIO DE LA DEPENDENCIA ESTADÍSTICA Estudiar la correlación: Grado de asociación o dependencia estadística entre dos variables. Naturaleza de las variables Dependencia débil FIN Decidir cuál es la variable exógena (X) y la variable endógena (Y): Variable explicativa y explicada o variable independiente y dependiente: Por la naturaleza de las variables Por los objetivos del estudio Y=Nº de accidentes X=Nº de vehículos en circulación Estadística Descriptiva
ANÁLISIS DE LA REGRESIÓN Seleccionar la forma de la función que mejor explica el comportamiento de las dos variables. Mediante el conocimiento de las variables Mediante la nube de puntos Estadística Descriptiva
ANÁLISIS DE LA REGRESIÓN Las familias de funciones más usuales son: Ajuste lineal: Y=aX+b Ajuste polinómico: Y=a0+a1X+...+anXn Ajuste potencial: Y=a Xb Ajuste exponencial: Y=a bX Ajuste hiperbólico: Y=a+b/X donde Y es la variable explicada y X la explicativa. Estadística Descriptiva
FUNCIONES POLINÓMICAS Y=a0+a1X+...+anXn Y=X3 Y=X2 Y=X Estadística Descriptiva
FUNCIONES POTENCIALES Y=a Xb con b>1 Y=X2 Y=X3 Y=X Estadística Descriptiva
FUNCIONES POTENCIALES Y=a Xb con 0<b<1 Estadística Descriptiva
FUNCIONES POTENCIALES Y=a Xb con b<0 Y=1/X Estadística Descriptiva
FUNCIONES EXPONENCIALES Y=a bX Y=eX Y=e-X Estadística Descriptiva
ANÁLISIS DE LA REGRESIÓN Una vez seleccionada la familia de funciones, elegir el criterio para obtener los parámetros que fijan la función: Minimizar la distancia de los puntos a la función. EJEMPLO: Familia de funciones lineales Y=aX+b con n=2 Estadística Descriptiva
ANÁLISIS DE LA REGRESIÓN EJEMPLO: Familia de funciones lineales Y=aX+b con n=3 Estadística Descriptiva
ANÁLISIS DE LA REGRESIÓN Y=a X + b CRITERIO DE LOS MÍNIMOS CUADRADOS: Usaremos las distancias verticales que miden los errores que se cometen al aproximar el verdadero valor de Y=yi por Y=a xi+b. Estadística Descriptiva
BONDAD DEL AJUSTE Medir la bondad del ajuste: Coeficiente de determinación general R2 Estadística Descriptiva
BONDAD DEL AJUSTE R2=0,6662 Estadística Descriptiva
BONDAD DEL AJUSTE R2=0,6662 Estadística Descriptiva