La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Regresión logística.

Presentaciones similares


Presentación del tema: "Regresión logística."— Transcripción de la presentación:

1 Regresión logística

2 Introducción La regresión logística describe la relación entre una variable respuesta (Y) dicotómica, de varias categorías o en escala ordinal, y una variables independiente o un conjunto de ellas. Las variables independientes pueden ser continuas o discretas, o pueden ser factores clasificados con letras o números.

3 Introducción El objetivo primordial que resuelve la regresión logística es el de modelar cómo influye en la probabilidad de aparición de un suceso (habitualmente dicotómico, o sea con dos categorías, tales como sano o enfermo, contaminado o no), la presencia o no de diversos factores y el valor o nivel de los mismos. También puede usarse para estimar la probabilidad de aparición de cada una de las categorías de un suceso con más de dos categorías, en relación a diversas variables independientes o factores.

4 Introducción Muchas variables de respuesta categóricas tienen sólo dos valores. Por ejemplo, en un estudio médico, el paciente sobrevive o se muere. En un estudio de alimentos el producto contiene residuos tóxicos o no, está contaminado con ciertos microorganismos o no. En estos problemas, el interés científico está en la identificación de factores que se relacionan con la probabilidad de aparición del tóxico o de contaminación del alimento.

5 Introducción Para estas situaciones se puede usar la regresión logística para determinar qué variables o factores inciden en la supervivencia o en el cambio. En estos ejemplos la variable dependiente Y estará expresada como: a) 0 y 1 para cada observación, donde el 0 es la ausencia del tóxico en el alimento y el 1 la presencia del tóxico. b) porcentajes (o proporciones) de 0’s o de 1’s de un conjunto de observaciones.

6 Introducción La regresión logística modela estas proporciones como la función de variables explicativas (independientes) y da resultados respecto a la importancia de la variable en la aparición del tóxico en el alimento o en la supervivencia o muerte del paciente.

7 Introducción Por ejemplo, podemos calcular la odds ratio (razón de momios) de la presencia de un contaminante en un alimento, lo que determina cuántas veces es más probable que el alimento tenga el contaminante en relación a la probabilidad de que no lo tenga. Si la literatura reporta que la temperatura de almacenamiento puede ser un factor que incide en la contaminación del alimento, se puede establecer un estudio en el cual se almacenan varias muestras del alimento a diferentes temperaturas. Al final del estudio se obtendrán datos como los siguientes: pi 0.02 0.07 0.08 0.10 0.14 0.16 0.27 0.34 0.45 0.61 Ti (°C) -5 5 10 15 20 25 30 35 40

8 Introducción Para entender los objetivos de la regresión logística debemos conocer algunos conceptos que se relacionan con su cálculo e interpretación. Proporción o probabilidad de ocurrencia de casos de interés: p= (Número de casos de interés/Número total de casos) Se llama odds ratio (razón de momios), al cociente p/(1-p). La odds asociada a un suceso es la probabilidad de ocurrencia del suceso (p). La odds ratio es el cociente entre la probabilidad de que ocurra el suceso sobre la probabilidad de que no ocurra: siendo p la probabilidad del suceso.

9 Regresión logística simple
Con los datos proporcionados en el ejemplo anterior, la regresión logística se calcula con la ecuación: donde la variable dependiente es la probabilidad de que un alimento esté contaminado y la variable independiente es la temperatura.

10 Ejemplo  estimada es 0.06 con una probabilidad de ser diferente de 0 de p <

11 Ejemplo El parámetro de interés es  o sea el coeficiente de la temperatura. En la salida del Infostat se puede ver que este parámetro es altamente significativo con un valor p de Esto indica que la temperatura incide significativamente sobre la probabilidad de encontrar un alimento contaminado. Uno de los problemas de estas ecuaciones exponenciales es la dificultad de interpretación, por lo que se puede usar una transformación logarítmica para quedarnos con una ecuación lineal (similar a la regresión lineal simple).

12 Regresión Logística simple
La transformación logística es: Li = Logit (pi) = Loge[pi/(1-pi)], denominada logaritmo neperiano de la razón de momios. El modelo de regresión logística simple es: Logit (pi) = b0 + b1Xi + ei donde b0: ordenada al origen, b1: pendiente de la regresión, Xi: variable independiente, y ei : desviación de la regresión.

13 Regresión logística simple
El valor calculado de pi a través de la regresión logística será igual a: El método empleado para estimar la regresión logística es una aproximación del método de máxima-verosimilitud (a diferencia de la regresión lineal simple o múltiple donde se emplea el método de mínimos cuadrados).

14

15


Descargar ppt "Regresión logística."

Presentaciones similares


Anuncios Google