La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Regresión logística 1. Ejemplos comunes Lanzamiento de una moneda (sol/águila) Resultado de un juego (ganar/ñerder) Estado del tiempo (lluvia/seco) Llegar.

Presentaciones similares


Presentación del tema: "Regresión logística 1. Ejemplos comunes Lanzamiento de una moneda (sol/águila) Resultado de un juego (ganar/ñerder) Estado del tiempo (lluvia/seco) Llegar."— Transcripción de la presentación:

1 Regresión logística 1

2 Ejemplos comunes Lanzamiento de una moneda (sol/águila) Resultado de un juego (ganar/ñerder) Estado del tiempo (lluvia/seco) Llegar al trabajo (a tiempo/tarde) Presentar un examen (pasar/reprobar) 2

3 Probabilidad y esperanza Para describir la posibilidad de que ocurra un evento se utiliza el término probabilidad y esperanza. Probabilidad (P)= resultados deseados/resultados posibles Para un dado, la probabilidad P(6) = 1/6 Esperanza (O) = resultados deseados / resultados Indeseados Para un dado, la esperanza O(6) = 1/5 = 0.2 3

4 Probabilidad Para el caso de dos dados, si el resultado esperado es 7 se tiene P(7) = 6/36 = 1/6 4 123456 1234567 2345678 3456789 45678910 56789 11 6789101112

5 Esperanza Para el caso de dos dados, si el resultado esperado es 7 se tiene O(7) = 6/30 5 123456 1234567 2345678 3456789 45678910 56789 11 6789101112

6 Probabilidad y Esperanza Esperanza (O) = P/(1-P) Probabilidad (P) = O/(O+1) Para el ejemplo de un dado, P = 6/36 = 0.1667 O = 6:30 = 0.2000 P = O/(O+1) = 0.2 / (0.2 + 1) = 0.1667 O = P/(1-P) = 0.1667 / (1 – 0.1667) = 0.2000 6

7 Ejemplo: Introducción de un nuevo producto en función del tiempo 7 AñoVentasTotalProbabilidad 11150.0667 22170.1176 34210.1905 48270.2963 522470.4681 635550.6364 758760.7632 8871000.8700 91051160.9052 1086900.9556 1161630.9683

8 Ejemplo: con Regresión lineal 8

9 Regresión lineal Al sustituir valores en X de -5 y +6 da probabilidades ilógicas de -0.051 y 1.118 También los residuos tienen un cierto patrón 9

10 Ejemplo: Cálculo de la Esperanza = p / (1-P) y su logaritmo natural e 10 AñoVentasTotal Probabilidad( P)Esperanza (O)Ln (O) 11150.06670.0714-2.6391 22170.11760.1333-2.0149 34210.19050.2353-1.4469 48270.29630.4211-0.8650 522470.46810.8800-0.1278 635550.63641.75000.5596 758760.76323.22221.1701 8871000.87006.69231.9010 91051160.90529.54552.2561 1086900.955621.50003.0681 1161630.968330.50003.4177

11 Regresión logística Es una herramienta de modelado usado para calcular una ecuación de predicción (o función de transferencia) cuando se tiene Y binaria y X continuas Es decir tiene la función de determinar cuales variables predictoras son significativas y determinar el nivel de influencia para la respuesta 11

12 Regresión logística – paso a paso Organizar los datos y en resultados binarios (0,1, pasa, no pasa, etc.) Graficar los datos Correr el modelo de regresión logística Buscar: Curva S Valores P Tasa de esperanzas Ecuación de predicción o función de transferencia 12

13 Regresión logística – Gráfica en S 13

14 Regresión logística – paso a paso File Open worksheet Exh-Regr Stat > Regression > Binary Logistic Regression. En Response, poner RestingPulse. En Model, poner Smokes Weight. En Factors (optional), poner Smokes. Click Graphs. Sel. Delta chi-square vs probability y Delta chi-square vs leverage. Click OK. Click Results. Choose In addition, list of factor level values, tests for terms with more than 1 degree of freedom, and 2 additional goodness-of- fit tests. Click OK en cada caja de diálogo. Storage seleccionar Event Probability NOTA: El valor 1 o superior representa el valor éxito 14

15 Datos 15 RestingPulseSmokesWeight LowNo140 LowNo145 LowYes160 LowYes190 LowNo155 LowNo165 HighNo150 LowNo190 LowNo195 LowNo138 HighYes160 LowNo155 HighYes153 LowNo145 LowNo170 LowNo175 LowYes175 LowYes170 LowYes180 LowNo135 LowNo170 LowNo157 LowNo130 LowYes185 HighNo140 LowNo120 LowYes130 HighNo138 HighYes121 LowNo125 HighNo116 LowNo145 HighYes150 LowYes112 LowNo125 LowNo190 LowNo155 LowYes170 LowNo155 LowNo215 LowYes150 LowYes145 LowNo155 LowNo155 LowNo150 LowYes155 LowNo150 HighYes180 LowNo160 LowNo135 LowNo160 LowYes130 LowYes155 LowYes150 LowNo148 HighNo155 LowNo150 HighYes140 LowNo180 LowYes190 HighNo145 HighYes150 LowYes164 LowNo140 LowNo142 HighNo136 LowNo123 LowNo155 HighNo130 LowNo120 LowNo130 HighYes131 LowNo120 LowNo118 LowNo125 HighYes135 LowNo125 HighNo118 LowNo122 LowNo115 LowNo102 LowNo115 LowNo150 LowNo110 HighNo116 LowYes108 HighNo95 HighYes125 LowNo133 LowNo110 HighNo150 LowNo108

16 Regresión logística – paso a paso 16 Logistic Regression Table Odds 95% CI Predictor Coef SE Coef Z P Ratio Lower Upper Constant -1.98717 1.67930 -1.18 0.237 Smokes Yes -1.19297 0.552980 -2.16 0.031 0.30 0.10 0.90 Weight 0.0250226 0.0122551 2.04 0.041 1.03 1.00 1.05 Log-Likelihood = -46.820 Test that all slopes are zero: G = 7.574, DF = 2, P-Value = 0.023 Goodness-of-Fit Tests Method Chi-Square DF P Pearson 40.8477 47 0.724 Deviance 51.2008 47 0.312 Hosmer-Lemeshow 4.7451 8 0.784 Si P value es menor a alfa (.05), se puede decir que no es un buen modelo. Un valor cercano a 1 indica un ajuste excelente. Como regla utilizar el estadístico de Hosmer-Lemeshow.

17 Regresión logística – paso a paso 17 Logistic Regression Table Odds 95% CI Predictor Coef SE Coef Z P Ratio Lower Upper Constant -1.98717 1.67930 -1.18 0.237 Smokes Yes -1.19297 0.552980 -2.16 0.031 0.30 0.10 0.90 Weight 0.0250226 0.0122551 2.04 0.041 1.03 1.00 1.05 La tasa de esperanza de Pulso Bajo del peso de (1.03) indica que un incremento en peso de 10 libras, incrementa la esperanza que el pulso bajo se incremente 1.28 veces. Para fumar, con el mismo peso, la tasa de esperanza de Pulso Bajo de los sujetos que fuman es de un 30% de los que no fuman. Un valor de 1.0 indica que no hay efecto en el resultado

18 Regresión logística – paso a paso En la prueba de Hosmer Lemeshow, los valores mayores a 3.84 son valores atípicos, desajustan el modelo 18

19 Regresión logística – paso a paso En la prueba de Hosmer Lemeshow, los valores mayores a 3.84 son valores atípicos 19

20 Regresión logística – paso a paso 20 Logistic Regression Table Odds 95% CI Predictor Coef SE Coef Z P Ratio Lower Upper Constant -1.98717 1.67930 -1.18 0.237 Smokes Yes -1.19297 0.552980 -2.16 0.031 0.30 0.10 0.90 Weight 0.0250226 0.0122551 2.04 0.041 1.03 1.00 1.05 La ecuación de regresión es: RestingPulse = -1.987 – 1.193*Fuma +0.025*Weight

21 Regresión logística – paso a paso 21 BLR calcula el logaritmo natural de la Esperanza (odds) de un evento y Odds = expo (Log odds), y Probabilidad = Odds / (1 + Odds) La ecuación de regresión es: RestingPulse = -1.987 – 1.193*Fuma +0.025*Weight En nuestro caso, a 150 lbs de peso para SI fuma: Log Odds =-1.987+0.025*Weight = 1.763 Odds = exp(1.763) = 5.83 Probability = 5.83/6.83= 0.853 or a 85.3% de probabilidad de éxito

22 Regresión logística – paso a paso La gráfica de probabilidades vs peso es: 22 La probabilidad de pulso bajo es mayor para los no fumadores vs los fumadores y en ambos aumenta conforme aumenta el peso.


Descargar ppt "Regresión logística 1. Ejemplos comunes Lanzamiento de una moneda (sol/águila) Resultado de un juego (ganar/ñerder) Estado del tiempo (lluvia/seco) Llegar."

Presentaciones similares


Anuncios Google