Regresión y Correlación Múltiple: Confusión y colinearidad.

Slides:



Advertisements
Presentaciones similares
Estudios de Cohorte Dra. Pilar Jiménez M..
Advertisements

CONCEPTOS BÁSICOS DE DISEÑO DE ESTUDIOS EPIDEMIOLÓGICOS
REGRESION Y CORRELACION LINEALES. REGRESION LINEAL SIMPLE Finalidad Estimar los valores de y (variable dependiente) a partir de los valores de x (variable.
Análisis de datos El diseño estadístico.
Pronósticos, Series de Tiempo y Regresión
Modulo04_Ejercicio19 Covariable dependiente del tiempo.
REGRESIÓN LINEAL MÚLTIPLE TEMA INTRODUCCIÓN 2 x1x1 Y x2x2 x3x3 xKxK.
CAUSALIDAD Y VALIDEZ EN LOS ESTUDIOS EPIDEMIOLÓGICOS.
LEONARDO LÓPEZ C. ECONOMIA ESTADISTICA COMPUTARIZADA PARALELO: 261.
¿Qué es el Análisis Multivariante? X Y Z W T Son métodos estadísticos que analizan X, Y, Z, W, …, T simultaneamente Medidas múltiples Individuo u objeto.
DISEÑOS EXPERIMENTALES ESTADÍSTICA PARA INGENIERIA II.
Free and Quick Translation of Anderson's slides1 Modelo de Regresión Lineal Simple y =  0 +  1 x + u.
EVALUACION Y CALIDAD EDUCATIVA TIPOS DE INSTRUMENTOS MODULO 3.
REGRESIÓN Y CORRELACIÓN  REGRESIÓN Es un Proceso estadístico que consiste en predecir una variable a partir de otra utilizando datos anteriores. INGA.
1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.
ANCOVA ANALISIS DE COVARIANZA *DBCA *DCA. El ANCOVA es una fusión del ANOVA y de la regresión lineal. Es un procedimiento estadístico que permite eliminar.
¡Guía tonta de estadística! Dr. Hamda Qotba, B.Med.Sc, M.D, ABCM.
Prof. Dr. Luis Alberto Rubio Jacobo CURSO: “Estadística Aplicada al Marketing” MAESTRIA EN GERENCIA DE MARKETING.
RELACIÓN ENTRE OBESIDAD Y DIABETES EN EL EMBARAZO:
Variables Instrumentales
Se describe la evolución de un paciente. Se formula de manera detallada la aparición de los distintos signos y síntomas de la enfermedad. Los estudios.
Tipos de estudio.
Facultad de Ciencias Sociales
Procedimiento completo de regresión múltiple
Pedro Letelier Patricio Contreras
Econometría Introducción
Carlos Grandi1, Ligia Nascente2, Viviane C. Cardoso3
Análisis de varianza Paramétricos vs. No Paramétricos
CORRELACIÓN PARCIAL Y CORRELACIÓN SEMIPARCIAL
CAPÍTULO 5 CUESTIONES PROBLEMÁTICAS EN EL ANÁLISIS DE REGRESIÓN Causalidad Nazira Calleja Miles, J. & Shevlin, M. (2011). Applying regression & correlation.
Tema 4: Análisis de datos bivariantes numéricos (continuación)
Correlación Lineal de Pearson y Regresión Lineal Simple
Epidemiología clínica
RELACIÓN ENTRE UNA VARIABLE DEPENDIENTE Y UNA O MAS INDEPENDIENTES.
Bioestadística Regresión y Correlación Múltiple:
¡Guía básica de estadística! Dr. Hamda Qotba, B.Med.Sc, M.D, ABCM.
PREDICCIÓN Y ESTIMACIÓN
REGRESÍON LINEAL SIMPLE
INVESTIGACIONES DE MERCADO
Epidemiología clínica
Variables e Hipótesis.
Sesgo, error e interacción
ANOVA DE UN FACTOR. Diferencias de Medias Independientes Dependientes Diferencias de Varianzas.
INTRODUCCIÓN A LA HIGIENE INDUSTRIAL
Epidemiología clínica
Epidemiología clínica
ANÁLISIS DE REGRESIÓN SIMPLE
ANALISIS DE VARIANZA
Tema 1- Regresión lineal simple.
METODOLOGÍA DE LA INVESTIGACIÓN (SAMPIERI)
Pasos Del Método Científico.
Correlación Relación no lineal Relación lineal positiva Relación
Regresión y Correlación Múltiple: Prueba de hipótesis.
Epidemiología clínica
Correlación Relación no lineal Relación lineal positiva Relación
¡Guía tonta de estadística! Dr. Hamda Qotba, B.Med.Sc, M.D, ABCM.
ANOVA Permite evaluar dos o más tratamientos.
Modelo de Regresión Lineal Simple
Analisis de Regresion Multiple
HG=[C(V 1 V 2 V 3 )+P+L+T]k HG = Hipótesis general C = Calificativo (diferente) V 1 = Variable independiente V 2 = Variable dependiente V 3 = Variable.
REGRESIONINTERPOLACION Los Métodos Numéricos Métodos mas utilizados Ajuste de Curvas.
ANÁLISIS DE REGRESIÓN LINEAL Y CORRELACIÓN SIMPLE ANÁLISIS DE REGRESIÓN LINEAL Y CORRELACIÓN SIMPLE 1 1.
SESGO. ▪ Es un error sistemático que resulta de una estimación incorrecta, provocando resultados inválidos. ▪ Diseño y su ejecución ▪ Son prevenibles.
Método epidemiológico
ESTUDIO DE MERCADO. MÉTODOS DE PROYECCIÓN ¿Qué es una proyección? Es una estimación del comportamiento de una variable en el futuro. Específicamente, se.
11.3 ANÁLISIS CUALITATIVO DE RIESGOS: PRIORIZAR LOS RIESGOS PARA UN ANÁLISIS O ACCIÓN DETERMINADA Son los roles y responsabilidades para llevar a cabo.
REGRESION LINEAL SIMPLE
Metodología de la Investigación 3 e Roberto Hernández Sampieri Carlos Fernández Collado Pilar Baptista Lucio.
UNIDAD EDUCATIVA “MARIANO PICON SALAS REGRESION LINEAL SIMPLE
Econometría financiera Retorno y riesgo. ¿Qué es la econometría financiera? La econometría consiste en dar un contenido empírico a un razonamiento económico.
Transcripción de la presentación:

Regresión y Correlación Múltiple: Confusión y colinearidad. Bioestadística Regresión y Correlación Múltiple: Confusión y colinearidad.

Sesgo de confusión. Implica la posibilidad de que la asociación observada entre dos variables (una independiente y otra dependiente) sea explicada, totalmente o en parte, mediante una distribución desigual entre los grupos de estudio de otros factores diferentes a la exposición de interés que también influyen en la variable dependiente. El sesgo que introduce un factor de confusión puede sobreestimar, subestimar y aún cambiar la dirección en la estimación de la asociación a evaluar.

Sesgo de confusión. Implica la posibilidad de que la asociación observada entre dos variables (una independiente y otra dependiente) sea explicada, totalmente o en parte, mediante una distribución desigual entre los grupos de estudio de otros factores diferentes a la exposición de interés que también influyen en la variable dependiente. El sesgo que introduce un factor de confusión puede sobreestimar, subestimar y aún cambiar la dirección en la estimación de la asociación a evaluar.

Sesgo de confusión. De manera intuitiva, la confusión debe ser entendida como una mezcla del efecto de la variable independiente en estudio con otra variable independiente (factor de confusión) que influye en la variable dependiente. Este tercer factor, o factor de confusión, debe estar asociado con la exposición en estudio y modificar la variable a predecir, independientemente de la variable predictora en estudio.

Sesgo de confusión. De manera intuitiva, la confusión debe ser entendida como una mezcla del efecto de la variable independiente en estudio con otra variable independiente (factor de confusión) que influye en la variable dependiente. Este tercer factor, o factor de confusión, debe estar asociado con la exposición en estudio y modificar la variable a predecir, independientemente de la variable predictora en estudio.

Sesgo de confusión. Tres condiciones son necesarias para que un factor sea considerado de confusión: El factor debe de estar asociado con la variable dependiente, aún en ausencia de la variable independiente en estudio. El factor debe estar asociado con la variable independiente en la población base. El potencial factor no debe ser un eslabón intermedio de la cadena causal entre la variable independiente de interés y la variable dependiente. Para evaluar esto es necesario información externa al estudio.

Sesgo de confusión. Tres condiciones son necesarias para que un factor sea considerado de confusión: El factor debe de estar asociado con la variable dependiente, aún en ausencia de la variable independiente en estudio. El factor debe estar asociado con la variable independiente en la población base. El potencial factor no debe ser un eslabón intermedio de la cadena causal entre la variable independiente de interés y la variable dependiente. Para evaluar esto es necesario información externa al estudio.

Sesgo de confusión. Tres condiciones son necesarias para que un factor sea considerado de confusión: El factor debe de estar asociado con la variable dependiente, aún en ausencia de la variable independiente en estudio. El factor debe estar asociado con la variable independiente en la población base. El potencial factor no debe ser un eslabón intermedio de la cadena causal entre la variable independiente de interés y la variable dependiente. Para evaluar esto es necesario información externa al estudio.

Sesgo de confusión. Tres condiciones son necesarias para que un factor sea considerado de confusión: El factor debe de estar asociado con la variable dependiente, aún en ausencia de la variable independiente en estudio. El factor debe estar asociado con la variable independiente en la población base. El potencial factor no debe ser un eslabón intermedio de la cadena causal entre la variable independiente de interés y la variable dependiente. Para evaluar esto es necesario información externa al estudio.

Variable independiente Sesgo de confusión. Hipótesis Variable independiente Variable dependiente Covariable Factor de confusión

Variable independiente Sesgo de confusión. Hipótesis Variable independiente Variable dependiente Covariable Factor de confusión

Variable independiente Sesgo de confusión. Hipótesis Variable independiente Variable dependiente Covariable Factor de confusión

Variable independiente Sesgo de confusión. Hipótesis Variable independiente Variable dependiente Covariable Factor de confusión

Variable independiente El factor no confunde. Hipótesis Variable independiente Variable dependiente Covariable No confunde

Variable independiente Sesgo de confusión. Hipótesis Variable independiente Variable dependiente Covariable No confunde

Variable independiente El factor no confunde. Hipótesis Variable independiente Variable dependiente Covariable No confunde

Variable independiente Sesgo de confusión. Hipótesis Variable independiente Variable dependiente Covariable No confunde

Variable independiente El factor no confunde. Hipótesis Variable independiente Variable dependiente Covariable No confunde

Evaluación de la confusión. Para evaluar si hay confusión comparamos dos modelos, uno que incluye la variable que consideramos confunde y otro sin la variable. Si al ajustar se observa una variación sustantiva, y si el conocimiento del investigador sobre el tema hace suponer que es preferible la estimación ajustada, entonces hay que ajustar, aunque no exista asociación significativa entre la exposición o el evento de estudio. Si el ajuste no modifica sustancialmente la estimación hay que ignorarla sin importar que el potencial factor de confusión esté asociado "significativamente" con la variable dependiente.

Evaluación de la confusión. Para evaluar si hay confusión comparamos dos modelos, uno que incluye la variable que consideramos confunde y otro sin la variable. Si al ajustar se observa una variación sustantiva, y si el conocimiento del investigador sobre el tema hace suponer que es preferible la estimación ajustada, entonces hay que ajustar, aunque no exista asociación significativa entre la exposición o el evento de estudio. Si el ajuste no modifica sustancialmente la estimación hay que ignorarla sin importar que el potencial factor de confusión esté asociado "significativamente" con la variable dependiente.

Evaluación de la confusión. Para evaluar si hay confusión comparamos dos modelos, uno que incluye la variable que consideramos confunde y otro sin la variable. Si al ajustar se observa una variación sustantiva, y si el conocimiento del investigador sobre el tema hace suponer que es preferible la estimación ajustada, entonces hay que ajustar, aunque no exista asociación significativa entre la exposición o el evento de estudio. Si el ajuste no modifica sustancialmente la estimación hay que ignorarla sin importar que el potencial factor de confusión esté asociado "significativamente" con la variable dependiente.

Registro: datos en hoja RM5. X1 X2 X3 Y 1 35 61 0.242 … 2 50 33 0.690 42 77 56 1.153 3 78 0.467 43 25 83 0.815 4 39 63 0.523 44 41 90 0.583 5 57 84 1.066 45 66 29 0.529 6 88 0.768 46 0.347 7 100 1.287 47 0.287 8 96 71 1.208 48 89 58 0.943 49 52 0.821 “X1” es una variable cualitativa independiente. “X2” y “X3” son variables cuantitativas independientes. “Y” es la variable dependiente cuantitativa.

Evaluación de la confusión. Variable Coeficiente p X1 0.219 Constante Variable Coeficiente p X1 0.288 X2 0.006 Constante Variable Coeficiente p X1 0.005 Constante

Evaluación de la confusión. Variable Coeficiente p X1 0.219 < 0.01 Constante Variable Coeficiente p X1 0.288 < 0.01 X2 0.006 Constante Variable Coeficiente p X2 0.005 < 0.01 Constante

Evaluación de la confusión. Variable Coeficiente p X1 0.219 0.01 Constante Variable Coeficiente p X1 0.180 0.02 X3 0.002 0.38 Constante Variable Coeficiente p X3 0.005 0.01 Constante

Evaluación de la confusión. Variable Coeficiente p X2 0.005 0.01 Constante Variable Coeficiente p X2 0.005 < 0.01 X3 0.006 Constante Variable Coeficiente p X3 0.005 0.01 Constante

Evaluación de la confusión. Variable Coeficiente p X1 0.265 < 0.01 X2 0.006 X3 0.001 0.45 Constante

Asociación entre covariables. X1 Media de X2 p 71.12 1 60.50 0.10 X1 Media de X3 p 52.64 1 70.54 < 0.01 Asociación entre X2 y X3 p r 0.004 0.67 r2 0.000

Registro: datos en hoja RM6. cm pulg peso 1 181 71.26 81.30 7 155 61.02 55.77 2 183 72.05 84.14 8 175 68.9 77.58 3 159 62.6 60.28 9 162 63.78 67.17 4 157 61.81 58.62 10 177 69.69 79.20 5 152 59.84 50.93 11 158 62.2 63.68 6 160 62.99 62.90 12 151 59.45 50.96 “cm” y “pulg” son variables cuantitativas independientes. “peso” es la variable dependiente cuantitativa.

Colinearidad entre cm y pulg. Asociación entre cm y pulg p r 1.00 < 0.01 r2

Colinearidad. Variable Coeficiente p cm 1.009 < 0.01 Constante -.99.542 Variable Coeficiente p cm 82.392 0.49 pulg -206.632 Constante -104.842 Variable Coeficiente p pulg 2.561 < 0.01 Constante -99.473