León Darío Bello Parias

Slides:



Advertisements
Presentaciones similares
Regresión Lineal Verificación de Supuestos
Advertisements

Tema 6: Regresión lineal.
REGRESION LINEAL SIMPLE
Error Estándar de la Media
Modelos de Variable Dependiente Binaria -Logit y Probit-
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Pronósticos, Series de Tiempo y Regresión
ANÁLISIS EXPLORATORIO DE DATOS
Ingeniería Industrial II CicloEducativo 2011
León Darío Bello Parias
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN
MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I MULTICOLINEALIDAD
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Econometria 2. Modelo de Regresión Lineal Simple
Capitulo 10: La metodología Box-Jenkins
ALGUNOS CONCEPTOS PREVIOS
Regresión y correlación
CONTRASTE Y VALIDACIÓN DE UN MODELO
Estadística Descriptiva: 4. Correlación y Regresión Lineal
بسم الله الرحمن الرحيم.
Tema 1- Regresión lineal simple.
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Regresión Lineal Simple
División de Estudios Políticos, CIDE
Análisis de Correlación y de Regresión lineal simple
SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES
Técnicas estadísticas paramétricas univariantes: regresión
PROBLEMAS ECONOMETRICOS
CONTRASTE Y VALIDACIÓN DE UN MODELO
15 Análisis de Regresión Múltiple
MODELOS GENERALIZADOS
Este procedimiento mide la relación entre la intensidad de un estímulo y la proporción de casos que presentan una cierta respuesta a dicho estímulo. Es.
Pronósticos, Series de Tiempo y Regresión
Pronósticos, Series de Tiempo y Regresión
Caso: Situación de las Comunidades Autónomas españolasen cuanto a indicadores de bienestar En el periódico “El País” del día 17 de enero de 2002 se publicó.
Modelo de regresión con dos variables: Estimación
Métodos de calibración: regresión y correlación
Tema 7: Regresión Simple
Departamento de Informática Universidad Técnica Federico Santa María
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
Regresión lineal múltiple
Modelos secundarios Tanto los parámetros que definen las curvas de Inactivación D ó z, como los que definen las curvas De crecimiento , se ven afectados.
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
Estadística II Regresión Lineal.
Análisis de los Datos Cuantitativos
Titular: Agustín Salvia
Regresión Lineal Simple
Aplicaciones Estadísticas a las Finanzas Clase 1
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Construcción de modelos con regresión y correlación
MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I MODELO DE REGRESIÓN GENERAL 1 Profesor: Barland A. Huamán Bravo 2011 UNIVERSIDAD NACIONAL AGRARIA DE LA.
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Regresión lineal simple Nazira Calleja
Unidad 4 Análisis de los Datos.
REGRESIÓN LINEAL MÚLTIPLE.
ANÁLISIS DE LA INFORMACIÓN La relación entre variables.
TEMA : ANALISIS DE REGRESION
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
Aplicaciones Estadísticas a las Finanzas Clase 1
REGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
1 REGRESIÓN CON VARIABLES DICOTÓMICAS TEMA 1 (CONTINUACIÓN)
14 Introducción al Análisis de Correlación y de Regresión Lineal
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
ANALISIS DE VARIANZA.
Transcripción de la presentación:

León Darío Bello Parias UNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICA “Héctor Abad Gómez” León Darío Bello Parias Regresión Múltiple ldbello@guajiros.udea.edu.co Facultad Nacional de Salud Pública “Héctor Abad Gómez”

REGRESION LINEAL Pasos V.dependiente V.Independiente ^ Y= b0 + b1 X   Identificar X, Y Construír diagrama de dispersión Estímar los parámetros del modelo. Probar la signifícancia Determinar la fuerza de la asociación Verificar la exactitud de la predicción Análisis de residuales V.Independiente ^ Y= b0 + b1 X Modelo matemático Docente León Darío Bello P.

CORRELACION LINEAL Objetivo Fórmulas R2= ----------- SCR   Se está interesado en medir el grado de asociación entre dos variables y en que sentido (X, Y = Y, X) Fórmulas R2= ----------- SCR Coeficiente de Determinación SCTO Coeficiente de Correlación Docente León Darío Bello P.

+1 -1 Además de la apreciación visual de la correlación, existe un parámetro llamado coeficiente de correlación de Pearson ( r ) que nos permite valorar el grado de asociación Muy buena Muy buena Poca Débil Débil Buena Buena 0.33 0.33 0.90 0.70 0.70 0.90 0.50 0.50 +1 -1 Ideal Pésimo Ideal

ANALISIS GRAFICO DE LOS RESIDUALES Heterocedasticidad No Correlación No linealidad Dependencia de evento Heterocedasticidad Dependencia temporal Preparado por León Darío Bello P.

EL ANÁLISIS DE REGRESIÓN MÚLTIPLE: CONCEPTO Método multivariante que analiza la relación entre una única variable dependiente (criterio) y varias variables independientes (predictores). El objetivo es predecir cambios en la variable dependiente en respuesta a cambios en varias de las variables independientes Cada variable predictor es ponderada, indicando la ponderación su contribución relativa a la predicción conjunta El conjunto de variables independientes ponderadas se denomina valor teórico de la regresión o ecuación de regresión Y= b0 + b1X1 + b2X2 +.....+ bn Xn Técnica de dependencia en la que los datos deben ser métricos o apropiadamente transformados

OBJETIVOS DE LA REGRESIÓN MÚLTIPLE Análisis de regresión múltiple OBJETIVOS DE LA REGRESIÓN MÚLTIPLE Predicción de la variable criterio con un conjunto de variables independientes, de forma que se maximice el valor teórico de la regresión. La predicción del modelo elegido debe demostrar tanto significación práctica como estadística Explicación objetiva del grado y carácter de la relación entre las variables independientes y la variable dependiente. Concretamente: Determinación de la importancia relativa de cada variable independiente sobre la variable dependiente (magnitud y dirección de la relación) Evaluación de la naturaleza de las relaciones entre las variables independientes y la dependiente (lineal y/o curvilineal) Evaluación de las interrelaciones entre las variables independientes

SUPUESTOS EN LA REGRESIÓN MÚLTIPLE Análisis de regresión múltiple SUPUESTOS EN LA REGRESIÓN MÚLTIPLE NORMALIDAD El perfil de la distribución de los datos se corresponde con una distribución normal. Si la variación respecto de la distribución normal es amplia, los tests estadísticos resultantes no son válidos, dado que se requiere la normalidad para el uso de los estadísticos de la t y de la F. La normalidad univariante ayuda a obtener normalidad multivariante, pero no la garantiza. La normalidad multivariante implica que las variables individuales son normales. ¿cómo evaluarla? 1. Gráfico de probabilidad normal de los residuos 2. Test de Kolmogorov-Smirnov sobre los residuos estandarizados LINEALIDAD Supuesto implícito en todas las técnicas multivariantes basadas en medidas de correlación. Resulta necesario identificar cualquier desplazamiento de la linealidad que pueda impactar la correlación. ¿cómo evaluarla? Examen visual de los residuos y Gráfico de regresión parcial HOMOSCEDASTICIDAD Varianza constante del término de error. Se refiere al supuesto de que las variables dependientes exhiban iguales niveles de varianza a lo largo del rango de los valores de las variables independientes. ¿cómo evaluarla? 1. Examen visual de los residuos 2. Test de Levene

MÉTODOS DE ESTIMACIÓN SECUENCIAL Análisis de regresión múltiple MÉTODOS DE ESTIMACIÓN SECUENCIAL Estimación por etapas (paso a paso ó stepwise) 1. Empezar con modelo de regresión simple, seleccionando la variable independiente que tenga la mayor correlación con la variable dependiente. Ecuación: Y = b0 + b1X1 2. Examinar coeficientes de correlación parcial para encontrar una variable adicional que explique la mayor parte del error que queda de la primera ecuación de regresión 3. Recalcular la ecuación de regresión utilizando las dos variables independientes, y examinar el valor parcial F de la variable original del modelo para ver si todavía realiza una contribución significativa. Si no lo hace, se elimina. Si lo hace, la ecuación queda: Y = b0 + b1X1 + b2X2 4. Continuar este procedimiento con todas las variables independientes restantes para ver si deberían incluirse en la ecuación. Si se incluye alguna, hay que examinar las variables previamente incluidas para juzgar si deben mantenerse Estimación progresiva (forward) y regresiva (backward) El modelo de estimación progresiva es similar a la estimación por etapas, mientras que la estimación regresiva implica calcular una ecuación de regresión con todas las variables independientes, para a continuación ir eliminando aquéllas que no contribuyan significativamente. La diferencia con la estimación por etapas es que en ésta se pueden añadir o eliminar variables en cada etapa, mientras que una vez que se añade o elimina una variable en los procedimientos de estimación progresiva o regresiva, no existe la posibilidad de revertir la acción posteriormente.

Ejemplo en SPSS Preparado por León Darío Bello P.

Ejemplo en SPSS Preparado por León Darío Bello P.

COEFICIENTE DE DETERMINACION AJUSTADO R2Y.12...p= ----------- SCE Coeficiente de Determinación Múltiple SCTO n-1 R2Corr.= 1- ((1- R2Y.12.. k ) ---------- n-k-1 Representa la porción de la variación en Y que se puede explicar por Xi Necesario cuando se comparan 2 o + modelos de regresión que predicen Y, pero con diferente Nº de Xi Preparado por León Darío Bello P.

EVALUACIÓN DE LA MULTICOLINEALIDAD Análisis de regresión múltiple EVALUACIÓN DE LA MULTICOLINEALIDAD Situación ideal: Tener una cantidad de variables independientes altamente correlacionadas con la variable dependiente, pero con poca correlación entre sí Multicolinealidad: correlación entre tres o más variables independientes La multicolinealidad reduce el poder predictivo de cualquier variable independiente individual, en la medida en que está asociado con las otras variables independientes A mayor colinealidad, la varianza única explicada por cada variable independiente se reduce y el porcentaje de predicción compartida aumenta ¿Cómo detectar la existencia de multicolinealidad? 1. Examen de la matriz de correlación de las variables independientes (altas correlaciones indican elevada colinealidad) 2. Estadísticos de colinealidad: valor de tolerancia (TOL) y factor de inflación de la varianza (FIV) (valores de TOL próximos a 0 y elevados valores de FIV, superiores a 4, denotan multicolinealidad) Efecto

IDENTIFICACION DE LA MULTICOLINEALIDA Matriz de correlación Valor de la tolerancia Factor de Inflación de la varianza (VIF) Indice de condición (30 o más). Es la cantidad de variabilidad de las Xi seleccionadas no explicadas por el resto de las Xi. Tolerancia reducida, elevada colinealidad (Valores cercanos a cero). Miden el grado en el que cada variable Xi se explica por otras variables independientes. Preparado por León Darío Bello P.

REMEDIOS PARA LA MULTICOLINEALIDAD Omitir una o varias Xi correlacionadas e identificar otras variables independientes. (Error de especificación) Utilizar el modelo sólo para predecir. (No interpretar coeficientes). Utilizar las correlaciones simples entre Y vs Xi para entender la relación de cada variable X con Y. Métodos más sofisticados (Regresión Bayesiana, Componentes principales) VALIDACION DE RESULTADOS Preparado por León Darío Bello P.

Variables Dummy Son aquellas que por ser cualitativas requieren una codificación especial, también son llamadas: Artificiales o internas o indicadoras. Si se tienen las siguientes opciones: Nunca fumó, Ex-fumador, Actualmente fuma menos de 10 cigarrillos diarios, Actualmente fuma 10 o más cigarrillos diarios, se tienen 4 posibles respuestas por lo que construiremos 3 variables internas dicotómicas (valores 0,1), existiendo diferentes posibilidades de codificación, que conducen a diferentes interpretaciones, y siendo la más habitual la siguiente: I1 I2 I3 Nunca fumó Ex- fumador 1 Menos de 10 cigarrillos diarios 10 o más cigarrillos diarios Preparado por León Darío Bello P.