RELACIÓN ENTRE UNA VARIABLE DEPENDIENTE Y UNA O MAS INDEPENDIENTES.
LA REGRESIÓN ES UNA TÉCNICA PARA DESCRIBIR UN CONJUNTO DE DATOS QUE CONTIENEN UNA VARIABLE DE INTERÉS O RESPUESTA (VARIABLE DEPENDIENTE O EFECTO) Y UNA O MAS PREDICTORAS O VARIABLES INDEPENDIENTES (CAUSAS).
RELACIÓN CAUSAL CAUSA EFECTO LA REGRESIÓN NO DETERMINA UNA RELACIÓN CAUSAL. SOLO ESTABLECE LA RELACIÓN ENTRE UNA DEPENDIENTE Y UNA O MAS INDEPENDIENTES. EXPERIMENTALMENTE SE PUEDE LLEGAR A DETERMINAR LA RELACIÓN CAUSAL Y ANALIZARLA POR REGRESIÓN.
LA TÉCNICA TRABAJA A BASE DEL AJUSTE DE MODELOS MATEMÁTICOS AL CONJUNTO DE DATOS, QUE SON SELECCIONADOS EN BASE A LA TENDENCIA QUE MUESTRAN EN UNA GRAFICA.
MODELOS DE REGRESIÓN LINEAL. MODELOS DE REGRESIÓN NO LINEAL.
VARIABLES: AQUELLOS QUE LLEVAN EL SUBINDICE DE LA VARIABLE DEPENDIENTE. CONSTANTES: NO LLEVAN EL SUBINDICE DE LA DEPENDIENTE, POR LO QUE SON LAS CONSTANTES O PARÁMETROS DEL MODELO.
SON LINEALES EN LOS PARÁMETROS. CONSTANTES A LA POTENCIA 1 QUE MULTIPLICAN ALGUNA FUNCIÓN DE LAS PREDICTORAS. SE CLASIFICAN EN: LINEAL SIMPLE. MÚLTIPLE. POLINOMIAL.
INTERCEPTO: VALOR ESTIMADO DE LA RESPUESTA CUANDO LAS PREDICTORAS SON CERO. PENDIENTE: ES LA TASA DE CAMBIO DE LA RESPUESTA POR UNIDAD DE INCREMENTO EN LA PREDICTORA.
Se pretende estimar el consumo familiar semanal a partir del ingreso de la familia. Se elige una muestra de 10 familias en donde se observaron los siguientes resultados:
INGRESOCONSUMO
RESPUESTA: SALARIO ANUAL EN MILES DE PESOS. PREDICTORA: AÑOS DE EXPERIENCIA. INTERCEPTO: SUELDO BASE. PENDIENTE: TASA DE INCREMENTO ANUAL EN EL SALARIO EN MILES DE PESOS.
SALARIOANTIGÜEDAD
LOS PARÁMETROS EN UN MODELO DEBEN SER ESTIMADOS A PARTIR DE UNA MUESTRA DE VALORES DE LA PREDICTORA Y LA RESPUESTA. EL MÉTODO DE ESTIMACIÓN ES POR MÍNIMOS CUADRADOS. PARA DENOTAR UN ESTIMADOR, AL SIMBOLO DEL PARÁMETRO SE LE SUPERPONE EL SIMBOLO ^, AL QUE COMUNMENTE SE LE LLAMA GORRO.
EL ESTIMADOR ES UNA VARIABLE ALEATORIA, POR SER CALCULADO A PARTIR DE UNA MUESTRA, Y POR LO TANTO TIENE VARIABILIDAD. EL PARÁMETRO ES UNA CONSTANTE. ESTIMA A
ES EL MODELO QUE SE GENERA CON LOS ESTIMADORES DE LOS PARÁMETROS, EL CUAL SE DENOTA POR LOS VALORES PREDICHOS POR LA ECUACIÓN AJUSTADA, SE CONOCEN COMO VALORES ESPERADOS.
ES EL COMPONENTE ALEATORIO DEL MODELO ES LA DISTANCIA ENTRE EL VALOR OBSERVADO Y EL ESPERADO POR LA ECUACIÓN DE REGRESIÓN AJUSTADA.
CONTAR CON ANTECEDENTES DE QUE LA TENDENCIA ENCONTRADA EN LOS DATOS SE MANTIENE CONSTANTE HASTA EL VALOR DE X=0. ALTERNATIVAMENTE, CONTAR EN EL CONJUNTO DE DATOS CON VALORES DE X EN LA VECINDAD DE CERO.
CUANTIFICA EL CAMBIO EN Y POR EFECTO DEL INCREMENTO EN UNA UNIDAD DE X. LA TASA DE CAMBIO SE MANTIENE CONSTANTE A LO LARGO DE TODA LA RECTA.
LAS CARACTERÍSTICAS BÁSICAS QUE DEBEN REUNIR LOS RESIDUALES SE RESUMEN EN: NORMALIDAD. INDEPENDENCIA. HOMOGENEIDAD DE VARIANZAS.
Suponga que al administrador de una cadena de almacenes le gustaria desarrollar un modelo para predecir las ventas semanales. Se selecciona una muestra de 20 almacenes de entre todos los que conforman la cadena. De esta muestra se colectan los datos de ventas semanales y numero de clientes que visitan fisicamente la tienda.
clientesventasclientesventas
SE TIENEN DISPONIBLES LOS SIGUIENTES PRECIOS DE UN MODELO IMPORTADO DE CARRO COMPACTO (MILES DE DIS) Y SU VIDA DE USO (AÑOS):
AÑOSPRECIO
LOS SIGUIENTES DATOS INDICAN EL PROGRESO (OBTENIDO EN PRACTICAS DE LECTURA RAPIDA) DE OCHO ESTUDIANTES QUE SIGUIERON UN PROGRAMA, Y EL NUMERO DE SEMANAS QUE LLEVAN EN ELPROGRAMA
numero semanasgan_vel pal/min
MANEJO DE VARIABLES CATEGÓRICAS EN REGRESIÓN.
Las variables indicadoras son variables que toman solo los valores enteros cero y uno. El valor cero indica ausencia de una condición especificada y el uno indica presencia de dicha condición.
Describir con ceros y unos las categorías de una variable cualitativa. Para una variable cualitativa de dos categorías es suficiente una sola variable indicadora. Por ejemplo, para describir el genero podemos definir la variable indicadora como el genero macho; entonces el cero indica ausencia (hembra) y el uno indica presencia (macho).
En un trabajo de investigación en administracion se tomo una muestra de 19 empleados administrativos a quienes se les tomo su genero y años de antigüedad en el trabajo para determinar su efecto sobre el salario anual.
yaños expergenero 151F 161F 151F 182F 194F 236F 256F 268F 279F 3812F yaños expergenero 171M 192M 4M 215M 226M 217M 8M 239M 2510M
En un trabajo experimental se probaron dos tipos de plantas forrajeras para produccion de materia seca en invernadero. Se probaron en cada uno diferentes densidades y los resultados fueron acomodados en dos series de acuerdo al tipo. El A es el de la izquierda y el B corresponde a la derecha.
XY XY
DOS O MAS VARIABLES INDEPENDIENTES EN EL MODELO.
Determinar el impacto que cada una de las variables independientes tienen sobre la variable dependiente. Este impacto se cuantifica a través de las pendientes que se estiman en el modelo y se determina si son estadisticamente significativas.
El subindice i denota la unidad de muestreo que fue evaluada en la dependiente y en cada una de las independientes. Corresponde al subindice de renglon en notación matricial. El segundo subindice (j) en las variables independinetes denota una de ellas en particular, y corresponde a la identificacion de columna en notación matricial.
El modelo completo es el que contiene todas las variables independientes disponibles. Al eliminar una o mas variables independientes se generan los submodelos.
Se desea determinar como impactan en las ventas de un producto el costo del empaque y el costo de publicidad. Los resultados son los siguientes, donde Y son las ventas, X1 costo de publicidad y x2 costo del empaque.
YX1X YX1X
En una población determinada se quizo determinar las características de las familias que impactan sobre los gastos de alimentacion. Se midieron las variables gasto en alimentacion, ingreso y numero de personas en la familia. Se llevo a cabo un análisis de regresión,
ALIMENTOINGRESOPERSONAS
ALIMENTOINGRESOPERSONAS
En un departamento de selección de personal se aplican 4 nuevas pruebas de aptitud a 25 solicitantes. Para propósitos del estudio los 25 fueron aceptados y monitoreados en su desempeño. Una calificación de desempeño fue obtenida después de un periodo de prueba. Se desea determinar que pruebas se relacionan mas con la evaluación del desempeño.
x1x2x3x4y
x1x2x3x4y