REGRESION LOGISTICA (Logit)
La regresión logística El objetivo primordial que resuelve la regresión logística es modelar cómo influye en la probabilidad de aparición de un suceso, por lo general dicotómico, la presencia o no de diversos factores y el valor o nivel de los mismos.
La regresión logística Nota Metodológica 1 Se dice que un proceso es binomial cuando sólo tiene dos posibles resultados: "éxito" y "fracaso“. Un proceso binomial está caracterizado por la probabilidad de éxito, representada por p, la probabilidad de fracaso se representa por q y, evidentemente, ambas probabilidades están relacionadas por p+q=1.
En ocasiones, se usa el cociente p/q, denominado "odds“ o momios y que indica cuánto más probable es el éxito que el fracaso, como parámetro característico de la distribución binomial.
La regresión logística El odds asociado a un suceso es el cociente entre la probabilidad de que ocurra frente a la probabilidad de que no ocurra:
La regresión logística Nota Metodológica 2 Si clasificamos el valor de la variable respuesta como 0 cuando no se presenta un suceso y con 1 cuando sí está presente, y buscamos cuantificar la posible relación entre ese suceso y alguna variable independiente, podríamos caer en error de utilizar una regresión lineal: y = a + bx, y estimar, a partir de nuestros datos y por el procedimiento de mínimos cuadrados, los coeficientes a y b de la ecuación.
Sin embargo, nos conduce a la obtención de resultados absurdos, pues puede que no se cumpla: P(S)=1 P(A)>0
La regresión logística Si utilizamos cómo variable dependiente la probabilidad p de que ocurra un determinado suceso y construimos la siguiente función: tenemos una variable que puede tomar cualquier valor a través de una ecuación bajo la forma:
Función logística
Función logística
La regresión logística Esta expresión permite calcular directamente la probabilidad del proceso binomial para los distintos valores de la variable X.
Hacer regresión logística con Income-Credit.xlx Hacer regresión lineal Comparar p (ingreso=62) Calcular la probabilidad de tener tarjeta de crédito en la media del ingreso.
Pendiente de recta tangente=B*P(Y=1)*p(1-P(Y=1)) Calcular pendiente máxima = B/4
Interpretación usando momios Log (odds)= a+bx odds = = Efecto multiplicativo sobre momios En el ejemplo = 1.11 Esto indica que, por ejemplo un individuo con ingreso =25 K tiene una probabilidad 11% mayor de tener tarjeta que uno con ingreso=24k.
La regresión logística p = 0.5 cuando
regresión logística múltiple Hacer regresión logística para death.xlx dp=1, recibe pena de muerte dr=1, raza del acusado (blanco) vr=1, raza de la victima (blanco) Calcular P(dp=1) para (dr=1,vr=1), (dr=0,vr=1), (dr=1,vr=0), (dr=0, vr=0)
Interpretación usando momios Log (odds)= a+b1x1 +b2x2 odds =
= Efecto multiplicativo sobre momios En el ejemplo b1 = -0.868 Esto indica que, por ejemplo un acusado blanco tiene Es decir los momios para acusado blanco de que reciba la pena de muerte es solo un 42% de los momios de un acusado negro. O bien, para un acusado negro los momios son 1/.42 = 2.38 veces mayores que para un acusado blanco.