La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez.

Presentaciones similares


Presentación del tema: "UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez."— Transcripción de la presentación:

1 UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez Facultad Nacional de Salud Pública Héctor Abad Gómez

2 Regresión logística Binaria Planteamiento: Una variable dependiente que tiene únicamente dos opciones. (dicotómica) Se quiere calcular la probabilidad de que ocurra una u otra a partir de una serie de informaciones (variables independientes). Ejemplos: Vota o no vota en unas elecciones Cumple la dieta o no la cumple Diagnóstico positivo o negativo en una prueba médica

3 Mantiene cierta analogía con el análisis de regresión múltiple excepto que la variable dependiente es dicotómica. Es algo así como un caso particular del análisis discriminante, en el que la variable dependiente tiene dos estados, los supuestos son menos restrictivos y se admiten variables independientes categóricas. Regresión logística

4 Un investigador médico está interesado en determinar si la probabilidad de un ataque al corazón puede predecirse conociendo la presión de la sangre del paciente, el nivel de colesterol, la ingesta de calorías, el sexo y el estilo de vida. Regresión logística

5 En general, con k variables independientes:. Regresión logística P es la probabilidad de que se prediga que una persona puede tener un ataque al corazón teniendo en cuenta las variables independientes X i.

6 La ecuación anterior modeliza el logaritmo neperiano de las odds como una función lineal de las variables independientes y es equivalente a una ecuación de regresión múltiple con el ln de las odds como variable dependiente. Las variables independientes pueden ser continuas y categóricas. El ln (log) de las odds se conoce como logit. De ahí viene el nombre de regresión logística múltiple. Regresión logística

7 Si sólo hay una variable independiente:. Regresión logística Probabilidad del éxito (sí vota, sí tiene la enfermedad...)

8 El objetivo primordial que resuelve esta técnica es el de modelar cómo influye en la probabilidad de aparición de un suceso, habitualmente dicotómico, la presencia o no de diversos factores y el valor o nivel de los mismos. También puede ser usada para estimar la probabilidad de aparición de cada una de las posibilidades de un suceso con más de dos categorías (politómico). Preparado por León Darío Bello P.

9 REGRESION LOGISTICA La regresión logística resulta útil para los casos en los que se desea predecir la presencia o ausencia de una característica según los valores de un conjunto de variables predictoras. la variable dependiente es dicotómica. Los coeficientes de regresión logística pueden utilizarse para estimar la razón de las ventajas (odds ratio) de cada variable independiente del modelo. Preparado por León Darío Bello P. Cociente de dos ODDS

10 Calcular el odds de presencia de hipertensión cuando el consumo de sal es inferior a esa cantidad. Si dividimos el primer odds entre el segundo, hemos calculado un cociente de odds, esto es un odds ratio, que de alguna manera cuantifica cuánto más probable es la aparición de hipertensión cuando se consume mucha sal (primer odds) respecto a cuando se consume poca. REGRESION LOGISTICA

11 ¿Qué características del estilo de vida son factores de riesgo de enfermedad cardiovascular? Dada una muestra de pacientes a los que se mide la situación de fumador, dieta, ejercicio, consumo de alcohol, y estado de enfermedad cardiovascular, se puede construir un modelo utilizando las cuatro variables de estilo de vida para predecir la presencia o ausencia de enfermedad cardiovascular en una muestra de pacientes. Preparado por León Darío Bello P.

12 REGRESION LOGISTICA Disponer de al menos 10 * (k + 1) casos para estimar un modelo con k variables independientes; es decir, al menos 10 casos por cada variable que interviene en el modelo, considerando también la variable dependiente (la probabilidad del suceso). Sí las variables que intervienen están muy correlacionadas, lo que conduce a un modelo desprovisto de sentido y por lo tanto a unos valores de los coeficientes no interpretables. A esta situación, de variables independientes correlacionadas, se la denomina colinealidad.

13 REGRESION LOGISTICA COEFICIENTES El coeficiente logístico compara la probabilidad de ocurrencia de un suceso con la probabilidad de que no ocurra (odds ratio) Prob (Evento) Prob (No Evento) ESTADISTICO WALD H 0 = ß j = 0 la información que se perdería al eliminar X j en el siguiente caso no es significativa PUNTUACION EFICIENTE DE RAO H 0 = ß j = 0 la información que aportaría la nueva variable no sería significativa. = e b0 + b1 X1 +b2 X Preparado por León Darío Bello P.

14 REGRESION LOGISTICA BONDAD DEL AJUSTE BONDAD DEL AJUSTE Se utiliza –2 logaritmo del valor de verosimilitud y se representa por –2LL. Un modelo con un buen ajuste tendrá un valor pequeño para – 2LL. El contraste Chi cuadrado para la reducción en el logaritmo del valor de verosimilitud proporciona una medida de mejora debida a la introducción de variables independientes. R 2 de COX Y SNELL Similar al R 2 de la regresión lineal. R 2 de NAGELKERKE Corrección del anterior. Preparado por León Darío Bello P.

15 Ejemplo Mediante un modelo de regresión logística, determine la posible asociación entre el cáncer de vejiga, el consumo de café y la procedencia. Se eligen 50 pacientes con cáncer y 50 sin él y se definen 3 variables: CÁNCER (0=sin cáncer, 1= con cáncer), CAFÉ (0=sin consumo, 1= con consumo), MEDIO (0=rural, 1=urbano) Desarróllelo usando el SPSS. Preparado por León Darío Bello P.

16 Prueba de Hosmer-Lemeshow Compara los valores observados y los esperados, por lo tanto, si SIG es mayor de 0.05 no se puede rechazar la hipótesis nula de que no hay diferencia significativa entre los valores observados y los que predice el modelo. Por lo tanto, el modelo tiene un buen ajuste. Preparado por León Darío Bello P.


Descargar ppt "UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez."

Presentaciones similares


Anuncios Google