REGRESIÓN LINEAL MÚLTIPLE

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS
Advertisements

REGRESION LINEAL SIMPLE
Correlación ©1997-Sep-06 Pedro Juan Rodríguez Esquerdo Departamento de Matemáticas UPR Río Piedras.
MÉTODOS DE MEDICIÓN DE COSTOS.
ESTUDIO DE MERCADO. MÉTODOS DE PROYECCIÓN
Pronósticos, Series de Tiempo y Regresión
MÉTODO CIENTÍFICO.
UNIDAD I MODELOS Y TOMA DE DECISIONES
AUTORES: peter b. seddon y min-yenkiew
KRIGING.
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Regresión y correlación
Estadística Administrativa II
CONTRASTE Y VALIDACIÓN DE UN MODELO
Estadística Descriptiva: 4. Correlación y Regresión Lineal
بسم الله الرحمن الرحيم.
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Regresión Lineal Simple
Curso de Estadística Básica
9 Regresión Lineal Simple
Técnicas estadísticas paramétricas univariantes: regresión
PROBLEMAS ECONOMETRICOS
Clases 4 Pruebas de Hipótesis
REGRESION Y CORRELACION
CONTRASTE Y VALIDACIÓN DE UN MODELO
15 Análisis de Regresión Múltiple
MEDIDA Y MÉTODO CIENTÍFICO
Pronósticos, Series de Tiempo y Regresión
Pronósticos, Series de Tiempo y Regresión
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
Regresión No- lineal y Múltiple
Herramientas básicas.
VARIABLE DEPENDIENTE DICOTOMICA. Hemos estudiados casos donde las variables dicotómicas actuaban como regresores, variables independientes o que explican.
Variables estadísticas bidimensionales
Regresión lineal múltiple
FUNDAMENTOS DE MARKETING
1.Función y ecuación polinomial
PRUEBAS ESTADISTICAS NO PARAMETRICAS
ANÁLISIS DE REGRESIÓN SIMPLE
Estadística II Regresión Lineal.
Análisis de los Datos Cuantitativos
Regresión Lineal Simple
Aplicaciones Estadísticas a las Finanzas Clase 1
Variables estadísticas bidimensionales
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
VARIANZA, COVARIANZA, DESVIACION ESTANDAR Y BETA
Variables estadísticas bidimensionales
Regresión lineal simple Nazira Calleja
MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables.
Unidad 4 Análisis de los Datos.
REGRESIÓN LINEAL MÚLTIPLE.
Modelos de regresión lineal
EPE MA 148 ESTADÍSTICA INFERENCIAL TEMA:
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
Copyright © 2003 by The McGraw-Hill Companies, Inc. All rights reserved.
REGRESIÓN LINEAL SIMPLE
RELACIÓN ENTRE UNA VARIABLE DEPENDIENTE Y UNA O MAS INDEPENDIENTES.
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
PRONOSTICOS CON REGRESION LINEAL MULTIPLE En la regresión lineal simple se investiga la relación entre una variable independiente y otra dependiente. A.
1 REGRESIÓN CON VARIABLES DICOTÓMICAS TEMA 1 (CONTINUACIÓN)
METODO DE MAXIMA PENDIENTE
14 Introducción al Análisis de Correlación y de Regresión Lineal
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
GRÁFICAS Y FUNCIONES MATEMÁTICAS Bernardo Nieto Castellanos.
ANALISIS DE VARIANZA.
Transcripción de la presentación:

REGRESIÓN LINEAL MÚLTIPLE Bibliografía: Introducción a la probabilidad y estadística - William Mendenhall, Robert J. Beaver y Barbara M. Beaver.

REGRESIÓN LINEAL MÚLTIPLE La regresión lineal múltiple es una extensión de regresión lineal simple para tomar en cuenta más de una variable independiente. Busca predecir una variable dependiente a través de 2 o más variables independientes. Con el uso de más de una variable independiente, se debe hacer un mejor trabajo de explicar la variación en y y en consecuencia hacer predicciones más precisas.

REGRESIÓN LINEAL MÚLTIPLE EJEMPLO: ¿Con qué variables se podría predecir la estatura de una persona? ¿Con qué variables se podría predecir el tiempo de llenado de una piscina? ¿Con qué variables se podría predecir el tiempo de construcción de un edificio?

REGRESIÓN LINEAL MÚLTIPLE Las ventas regionales y del producto de una compañía podrían estar relacionadas con tres factores: x1: la cantidad gastada en publicidad en televisión. x2: la cantidad gastada en publicidad en periódicos. x3: el número de vendedores asignados a la región.

REGRESIÓN LINEAL MÚLTIPLE En la regresión lineal múltiple aparecen varias preguntas, muy similares al caso de regresión lineal simple: ¿Qué tan bien se ajusta el modelo? ¿Qué tan fuerte es la relación entre y y las variables predictoras? ¿Se han violado suposiciones importantes? ¿Qué tan buenas son las estimaciones y predicciones?

EJEMPLO ¿En qué forma los vendedores de bienes raíces determinan el precio de venta para un condominio recién inscrito en lista? La base de datos de una computadora en una pequeña comunidad contiene el precio de venta de lista y (en miles de dólares), la cantidad de área de vivienda x1 (en cientos de pies cuadrados), así como los números de pisos x2,recámaras x3 y baños x4, para n 15 condominios seleccionados al azar actualmente en el mercado. Observación Precio de lista y Área de vivienda x1 Pisos x2 Recámaras x3 Baños x4 1 169 6 2 218,5 10 3 216,5 4 225 11 5 229,9 13 1,7 235 2,5 7 239,9 8 247,9 17 9 260 19 269,9 18 234,9 12 255 14 294,5 20 15 309,9 21

UNA RECOMENDACIÓN Mantenga el número de variables predictoras lo suficientemente pequeño para que sea efectivo pero manejable. Es necesario estar conscientes que el número de observaciones del conjunto de datos debe exceder el número de términos del modelo; cuanto mayor el exceso, mejor.

PRUEBA DE UTILIDAD DEL MODELO DE REGRESIÓN MÚLTIPLE Para determinar la utilidad del modelo de regresión múltiple se pueden usar las siguientes pruebas: El coeficiente de determinación R2. Prueba de significancia de los coeficientes de regresión parcial. El análisis de varianza de la Prueba F

PRUEBA DE UTILIDAD DEL MODELO DE REGRESIÓN MÚLTIPLE El análisis de varianza de la Prueba F Se realiza para resolver la interrogante: ¿Al menos una de las variables predictoras está aportando información significativa para la predicción de la variable y? Se realiza a través de una prueba de hipótesis del análisis de varianza.

PRUEBA DE UTILIDAD DEL MODELO DE REGRESIÓN MÚLTIPLE El análisis de varianza de la Prueba F El estadístico de prueba se encuentra en la tabla ANOVA.

MULTICOLINEALIDAD La multicolinealidad es un fenómeno que se da cuando, dos o más variables tienen «mucho de lo mismo» o información compartida. La multicolinealidad se presenta cuando dos o más de las variables predictoras están altamente correlacionadas entre sí.

MULTICOLINEALIDAD ¿Cómo saber si un análisis de regresión exhibe multicolinealidad? El valor de R2 es grande, lo cual indica un buen ajuste, pero las pruebas t individuales no son significativas. Los signos de los coeficientes de regresión son contrarios a lo que intuitivamente se esperaría fueran las contribuciones de esas variables. Una matriz de correlaciones, generada por computadora, muestra cuáles variables predictoras están altamente correlacionadas entre sí y con la respuesta y.

MULTICOLINEALIDAD En el análisis de regresión múltiple, ni el tamaño del coeficiente de regresión, ni su valor t indican la importancia de la variable como contribuyente de información. Como existe multicolinealidad en alguna medida en todos los problemas de regresión, debemos considerar los términos individuales como aportadores de información, en lugar de tratar de medir la importancia práctica de cada término.

MULTICOLINEALIDAD EJEMPLO: Observación Precio de lista y Área de vivienda Pisos Recámaras Baños 1 169 6 2 218,5 10 3 216,5 4 225 11 5 229,9 13 1,7 235 2,5 7 239,9 8 247,9 17 9 260 19 269,9 18 234,9 12 255 14 294,5 20 15 309,9 21

INTERPRETACIÓN DE GRÁFICAS DE RESIDUALES Se pueden usar gráficas residuales para descubrir posibles violaciones en las suposiciones requeridas para un análisis de regresión. Hay varios patrones comunes que se deben reconocer porque se presentan con frecuencia en aplicaciones prácticas.

INTERPRETACIÓN DE GRÁFICAS DE RESIDUALES Si el rango de los residuales aumenta cuando 𝑦 aumenta, se puede estabilizar la varianza de la respuesta al correr el análisis de regresión en 𝑦 ∗ = 𝑥 la gráfica residual de la figura mostraría que la variación no explicada exhibe un patrón curvado, que sugiere que hay un efecto cuadrático que no se ha incluido en el modelo. Se puede ajustar el modelo ajustando una ecuación de segundo orden.

INTERPRETACIÓN DE GRÁFICAS DE RESIDUALES Para los datos del ejemplo, mostraría un conjunto distinto de residuales positivos correspondientes a dos comportamientos. Este patrón señala que una «variable cualitativa» no estaba incluida en el modelo. Desafortunadamente, no todas las gráficas residuales dan una indicación tan clara del problema. Con todo cuidado deben examinarse las gráficas residuales, buscando que no haya aleatoriedad en el modelo de residuales. Si se puede hallar una explicación para el comportamiento de los residuales, se puede modificar el modelo para eliminar el problema.

MODELO DE REGRESIÓN POLINOMIAL En un estudio de variables que afecta la productividad en el comercio de comestibles al menudeo, W.S. Good usa valor agregado por hora de trabajo para medir la productividad de tiendas de comestibles al menudeo. Él define “valor agregado” como “el excedente [dinero generado por el negocio] disponible para pagar empleados, mobiliario y enseres, y equipo”. Los datos consistentes con la relación entre valor agregado por hora de trabajo y y el tamaño x de una tienda de comestibles descrita en el artículo de Good, se muestran en la tabla para 10 tiendas de alimentos ficticias. Escoja un modelo para relacionar y con x.

MODELO DE REGRESIÓN POLINOMIAL Tienda Valor agregado por hora de trabajo Tamaño de la tienda (miles de pies cuadrados) 1 4,08 21 2 3,40 12 3 3,51 25,2 4 3,09 10,4 5 2,92 30,9 6 1,94 6,8 7 4,11 19,6 8 3,16 14,5 9 3,75 25 10 3,60 19,1

MODELO DE REGRESIÓN POLINOMIAL El modelo cuadrático es un ejemplo de un modelo de segundo orden porque contiene un término cuyos exponentes suman 2 (en este caso, x2). También es un ejemplo de un modelo polinomial, un modelo que toma la forma

MODELO DE REGRESIÓN CO VARIABLES CUALITATIVAS

MODELO DE REGRESIÓN CO VARIABLES CUALITATIVAS Una primera posibilidad para estudiar este problema consiste en dividir la muestra en grupos, según la variable atributo, y estudiar la regresión en cada caso. Esta solución no es eficiente y en algunas ocasiones, imposible de realizar si se dispone de muy pocos datos en alguno de los grupos. Un método mejor y más eficiente consiste en introducir una variable de clasificación. Para ello, si se quiere dividir la muestra en dos grupos (A y B) al ajustar un modelo de regresión lineal simple.

MODELO DE REGRESIÓN CO VARIABLES CUALITATIVAS Ejemplo: Se realizó un estudio para examinar la relación entre salario en una universidad, y, el número de años de experiencia del miembro del profesorado y el género del miembro del profesorado. Si se espera que haya una relación de línea recta entre salario medio y años de experiencia para caballeros y mujeres, escriba el modelo que relacione salario medio con las dos variables predictoras: años de experiencia (cuantitativa) y género del profesor (cualitativa).

MODELO DE REGRESIÓN CO VARIABLES CUALITATIVAS La variable cualitativa “género” contiene k = 2 categorías, caballeros y mujeres. Por lo tanto, se necesita (k - 1) = 1 variable ficticia, x2, definida como:

MODELO DE REGRESIÓN CO VARIABLES CUALITATIVAS El hecho de que las pendientes de las dos rectas puedan diferir significa que las dos variables predictoras interactúan; esto es, el cambio en E(y) correspondiente a un cambio en x1 depende de si el profesor es hombre o mujer. Para tomar en cuenta esta interacción (diferencia en pendientes), el término de interacción x1x2 se introduce en el modelo.

PASOS PARA CONSTRUIR UN MODELO DE REGRESIÓN MÚLTIPLE Seleccione las variables predictoras a ser incluidas en el modelo. Escriba un modelo usando las variables predictoras seleccionadas. Si las variables son cualitativas, es mejor empezar incluyendo términos de interacción; si las variables son cuantitativas, es mejor empezar con un modelo de segundo orden. Los términos no necesarios pueden eliminarse después. Obtenga el modelo de predicción ajustado. Use la ANOVA (Prueba F y R2), para determinar que tan bien ajusta el modelo a los datos. Verifique las pruebas t para los coeficientes de regresión parcial para ver cuáles están aportando información significativa en presencia de los otros. Use gráficas de residuales generadas por computadora para ver si hay violación de las suposiciones de la regresión.