MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

Tema 22: Análisis de tablas de contingencia Prueba c2 como medida de asociación y como prueba de contraste. Coeficientes derivados de c2. Interpretación.
Regresión mínimo cuadrada (I)
CONTENIDOS Teoría del muestreo ¿Cómo seleccionar una muestra?
Error Estándar de la Media
Modelos de Variable Dependiente Binaria -Logit y Probit-
Selección del modelo adecuado
UNIVERSIDAD AUTÓNOMA DEL CARIBE
MODELO DE REGRESIÓN MÚLTIPLE
DISTRIBUCIONES MUESTRALES, DE LAS MUESTRAS O DE MUESTREO
Regresión Lineal y Regresión Polinomial
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
MODELOS DE ELECCIÓN BINARIA: MODELO DE PROBABILIDAD LINEAL
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Regresión Lineal Simple
9 Regresión Lineal Simple
Facultad: Turismo Y Hotelería
Análisis no paramétricos
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Capítulo III Análisis de varianza.
TIPOS DE MODELOS DE REGRESIÓN Y SUPUESTOS PARA EL MODELO A
Este procedimiento mide la relación entre la intensidad de un estímulo y la proporción de casos que presentan una cierta respuesta a dicho estímulo. Es.
MODELOS DE ELECCIÓN BINARIA : ANÁLISIS PROBIT
Pronósticos, Series de Tiempo y Regresión
1 INTERPRETACIÓN DE UNA ECUACIÓN DE REGRESIÓN El diagrama muestra el ingreso por hora en 2002 graficado contra los años de educación, definido como el.
Modelo de regresión simple: Y =  1 +  2 X + u 1 Hemos visto que los coeficientes de regresión b 1 y b 2 son variables aleatorias. Estos, respectivamente,
Modelo de regresión simple: Y =  1 +  2 X + u Ahora, demostraremos que el estimador ordinario de mínimos cuadrados (OLS) del coeficiente de la pendiente.
INTERVALO DE CONFIANZA
Estadística Descriptiva continuación
DERIVADO DE LOS COEFICIENTES DE REGRESIÓN LINEAL Y X Esta sequencia muestra cómo los coeficientes de regresión para un modelo de regresión lineal simple.
ESTIMACIÓN DE COEFICIENTES DE MÁXIMA VEROSIMILITUD
Unidad V: Estimación de
ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población.
Estimación Sea una característica, un parámetro poblacional cuyo valor se desea conocer a partir de una muestra. Sea un estadístico ( función.
Curso de Bioestadística. ANOVA
Regresión logística.
LOS COMPONENTES ALEATORIOS DE LOS COEFICIENTES DE REGRESIÓN
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
ESTADISTICA I CSH M. en C. Gal Vargas Neri.
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
Clase 4a Significancia Estadística y Prueba Z
RELACIÓN GRÁFICA EN UN MODELO DE REGRESIÓN MULTIPLE. reg EARNINGS S EXP Source | SS df MS Number of obs =
LA PRUEBA F DE BONDAD DE AJUSTE 2 Vamos a considerar el caso general donde hay k – 1 variables explicativas. Para la prueba F de bondad de ajuste de la.
Capítulo 1. Conceptos básicos de la Estadística
Eva Medina Moral Profesora Economía Aplicada (UAM) Febrero 2007
REGRESION LINEAL II Mario Briones L. MV, MSc
ANÁLISIS DE REGRESIÓN SIMPLE
REGRESIÓN MULTIPLE CON DOS VARIABLES EXPLICATIVAS: EJEMPLO INGRESO EXP S 11 1 INGRESO =  1 +  2 S +  3 EXP + u Esta presentación proporciona una interpretación.
1 Y MODELO DE REGRESIÓN SIMPLE Suponemos que una variable Y es una función lineal de otra variable X, con parámetros desconocidos  1 y  2 que queremos.
Análisis de los Datos Cuantitativos
2.1 DEFINICIONES CARACTERÍSTICAS Y SUPOSICIONES.
Regresión Lineal Simple
INTERVALOS DE CONFIANZA
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
ESTIMACIÓN DE PARÁMETROS
Resolución de Problemas Método Gráfico
Regresión lineal simple Nazira Calleja
MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables.
INFERENCIA ESTADÍSTICA
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
Aplicaciones Estadísticas a las Finanzas Clase 1
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
Estimación Estadística Tares # 3. Estimación Estadística Conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a.
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
TAMAÑO DE LA MUESTRA Alvaro Alfredo Bravo Dpto. de Matemáticas y Estadística Universidad de Nariño - Colombia.
Regresión logística Tema 6c. En la regresión lineal la variable dependiente es continua En regresión logística se utiliza cuando la variable dependiente.
ANALISIS DE VARIANZA.
Auxiliar 11 IN4402-1: Aplicaciones de Probabilidades y Estadística en Gestión Profesora: Paola Bordón T. Auxiliar: Andrés E. Fernández V, 28 de Julio,
Transcripción de la presentación:

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Y, p A 1 1 – b1 – b2Xi b1 +b2Xi b1 b1 + b2Xi B Xi X El modelo de probabilidad lineal puede hacer predicciones sin sentido que indiquen que un evento ocurrirá con una probabilidad mayor a 1 o menor a 0. 1

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT La manera común de evitar este problema es establecer la hipótesis de que la probabilidad es una función sigmoidea (S-shaped) de Z, F(Z), en la que Z es una función de la variable explicativa. 2

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Muchas funciones matemáticas son sigmoideas en carácter. Una es la función logística mostrada aquí. Mientras Z va al infinito, e–Z va hacia a 0 y p va a 1 (pero no lo puede exceder). Mientras que Z va hacia menos infinito, e–Z va hacia el infinito y p hacia 0 (pero no puede ser menor a 0). 3

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT El modelo implica que, para valores de Z menores a –2, la probabilidad de ocurrencia del evento es baja y poco sensible a las variaciones de Z. 4

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Para obtener una expresión de la sensibilidad, se deriva F(Z) con respecto a Z. El recuadro gris contiene la regla general para derivar un cociente y lo aplica a F(Z). 5

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT La sensibilidad, medida por la pendiente, es mayor cuando Z es igual a 0. La función marginal, f(Z), alcanza un máximo en este punto. 6

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Para un modelo no-lineal de este tipo, la estimación de máxima verosimilitud es muy superior al principio de mínimos cuadrados en la estimación de los parámetros. Mayores detalles sobre esta apliación se encuentran al final de esta presentación. 7

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Se aplicará este modelo al ejemplo de graduados de la preparatoria descrito en la presentación del “Modelo de probabilidad lineal”. Se inicia asumiendo que ASVABC es la única variable explicativa relevante, por lo que Z es una función simple de ésta. 8

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT . logit GRAD ASVABC Iteration 0: Log Likelihood =-162.29468 Iteration 1: Log Likelihood =-132.97646 Iteration 2: Log Likelihood =-117.99291 Iteration 3: Log Likelihood =-117.36084 Iteration 4: Log Likelihood =-117.35136 Iteration 5: Log Likelihood =-117.35135 Logit Estimates Number of obs = 570 chi2(1) = 89.89 Prob > chi2 = 0.0000 Log Likelihood = -117.35135 Pseudo R2 = 0.2769 ------------------------------------------------------------------------------ grad | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---------+-------------------------------------------------------------------- asvabc | .1666022 .0211265 7.886 0.000 .1251951 .2080094 _cons | -5.003779 .8649213 -5.785 0.000 -6.698993 -3.308564 El comando de Stata es logit, seguido por la variable dependiente y la(s) variable(s) explicativa(s). La estimación de máxima verosimilitud es una proceso iterativo, por lo que la primera parte del resultado será similar al que se muestra. 9

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT . logit GRAD ASVABC Iteration 0: log likelihood = -118.67769 Iteration 1: log likelihood = -104.45292 Iteration 2: log likelihood = -97.135677 Iteration 3: log likelihood = -96.887294 Iteration 4: log likelihood = -96.886017 Logit estimates Number of obs = 540 LR chi2(1) = 43.58 Prob > chi2 = 0.0000 Log likelihood = -96.886017 Pseudo R2 = 0.1836 ------------------------------------------------------------------------------ GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- ASVABC | .1313626 .022428 5.86 0.000 .0874045 .1753206 _cons | -3.240218 .9444844 -3.43 0.001 -5.091373 -1.389063 En este caso los coeficientes de la función Z son los que se muestran. 10

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Puesto a que sólo hay una variable explicativa, podemos dibujar las funciones de probabilidad y de efectos marginales como funciones de ASVABC. 11

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Observamos que ASVABC tiene un mayor efecto en la graduación cuando es menor a 40, es decir, en el rango más bajo de habilidad. Cualquier individuo con un puntaje superior al promedio (50) seguramente se graduará. 12

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT . logit GRAD ASVABC Iteration 0: log likelihood = -118.67769 Iteration 1: log likelihood = -104.45292 Iteration 2: log likelihood = -97.135677 Iteration 3: log likelihood = -96.887294 Iteration 4: log likelihood = -96.886017 Logit estimates Number of obs = 540 LR chi2(1) = 43.58 Prob > chi2 = 0.0000 Log likelihood = -96.886017 Pseudo R2 = 0.1836 ------------------------------------------------------------------------------ GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- ASVABC | .1313626 .022428 5.86 0.000 .0874045 .1753206 _cons | -3.240218 .9444844 -3.43 0.001 -5.091373 -1.389063 El estadístico t indica que el efecto de la variación de ASVABC sobre la probabilidad de graduarse de la preparatoria es altamente significativo. 13

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT . logit GRAD ASVABC Iteration 0: log likelihood = -118.67769 Iteration 1: log likelihood = -104.45292 Iteration 2: log likelihood = -97.135677 Iteration 3: log likelihood = -96.887294 Iteration 4: log likelihood = -96.886017 Logit estimates Number of obs = 540 LR chi2(1) = 43.58 Prob > chi2 = 0.0000 Log likelihood = -96.886017 Pseudo R2 = 0.1836 ------------------------------------------------------------------------------ GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- ASVABC | .1313626 .022428 5.86 0.000 .0874045 .1753206 _cons | -3.240218 .9444844 -3.43 0.001 -5.091373 -1.389063 En realidad, el estadístico t es válido solamente para muestras grandes, por lo que la distribución normal es la distribución de referencia. Por esta razón el estadítico se denota con una z en el resultado de Stata. Esta z no está relacionada con la función Z . 14

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT El coeficiente de la función Z no tiene ninguna interpretación intuitiva directa. 15

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Sin embargo, podemos utilizarlos para cuantificar el efecto marginal de un cambio en ASVABC sobre la probabilidad de graduarse. Esto se realizará teóricamente para el caso general donde Z es una función de muchas variables explicativas. 16

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Puesto que p es una función de Z, y Z es una función de las variables X, el efecto marginal de Xi sobre p puede expresarse como el producto del efecto marginal de Z sobre p y el efecto marginal de Xi sobre Z. 17

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Ya se derivó una expresión para dp/dZ. El efecto marginal de Xi sobre Z está dado por su coeficiente b. 18

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Por lo tanto, se obtiene una expresión para el efecto marginal de Xi sobre p. 19

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT El efecto marginal no es constante debido a que depende de los valores de Z, que a su vez dependen de los valores de las variables explicativas. Un procedimiento muy común es evaluarlo con base en la media muestral de las variables explicativas. 20

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT . sum GRAD ASVABC Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- GRAD | 540 .9425926 .2328351 0 1 ASVABC | 540 51.36271 9.567646 25.45931 66.07963 Logit estimates Number of obs = 540 LR chi2(1) = 43.58 Prob > chi2 = 0.0000 Log likelihood = -96.886017 Pseudo R2 = 0.1836 ------------------------------------------------------------------------------ GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- ASVABC | .1313626 .022428 5.86 0.000 .0874045 .1753206 _cons | -3.240218 .9444844 -3.43 0.001 -5.091373 -1.389063 La media muestral de ASVABC en esta muestra es 51.36. 21

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT . sum GRAD ASVABC Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- GRAD | 540 .9425926 .2328351 0 1 ASVABC | 540 51.36271 9.567646 25.45931 66.07963 Logit estimates Number of obs = 540 LR chi2(1) = 43.58 Prob > chi2 = 0.0000 Log likelihood = -96.886017 Pseudo R2 = 0.1836 ------------------------------------------------------------------------------ GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- ASVABC | .1313626 .022428 5.86 0.000 .0874045 .1753206 _cons | -3.240218 .9444844 -3.43 0.001 -5.091373 -1.389063 Cuando se evalúa en la media, Z es igual a 3.507. 22

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT . sum GRAD ASVABC Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- GRAD | 540 .9425926 .2328351 0 1 ASVABC | 540 51.36271 9.567646 25.45931 66.07963 e–Z es 0.030. Por lo tanto, f(Z) es 0.028. 23

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT . sum GRAD ASVABC Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- GRAD | 540 .9425926 .2328351 0 1 ASVABC | 540 51.36271 9.567646 25.45931 66.07963 El efecto marginal, evaluado en la media, es entonces 0.004. Esto implica que un punto de incremento en ASVABC incrementaría la probabilidad de graduarse de la preparatoria en 0.4%. 24

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT 51.36 En este ejemplo, el efecto marginal en la media de ASVABC es bastante bajo. La razón es que cualquier persona con un puntaje promedio tiene certeza de graduarse de cualquier manera. Por lo que un incremento en el puntaje tiene un efecto muy bajo. 25

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT . sum GRAD ASVABC Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- GRAD | 540 .9425926 .2328351 0 1 ASVABC | 540 51.36271 9.567646 25.45931 66.07963 Para mostrar que el efecto marginal varía, también se calculará para ASVABC igual a 30. Un punto de incremento en ASVABC aumenta la probabilidad en 2.9%. 26

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Un individuo con un puntaje de 30 tiene sólo 67% de probabilidad de graduarse, y un incremento en su puntaje tiene un impacto relativo mayor. 27

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT . logit GRAD ASVABC SM SF MALE Iteration 0: log likelihood = -118.67769 Iteration 1: log likelihood = -104.73493 Iteration 2: log likelihood = -97.080528 Iteration 3: log likelihood = -96.806623 Iteration 4: log likelihood = -96.804845 Iteration 5: log likelihood = -96.804844 Logit estimates Number of obs = 540 LR chi2(4) = 43.75 Prob > chi2 = 0.0000 Log likelihood = -96.804844 Pseudo R2 = 0.1843 ------------------------------------------------------------------------------ GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- ASVABC | .1329127 .0245718 5.41 0.000 .0847528 .1810726 SM | -.023178 .0868122 -0.27 0.789 -.1933267 .1469708 SF | .0122663 .0718876 0.17 0.865 -.1286307 .1531634 MALE | .1279654 .3989345 0.32 0.748 -.6539318 .9098627 _cons | -3.252373 1.065524 -3.05 0.002 -5.340761 -1.163985 Este es el resultado de un modelo con una mejor especificación. 28

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT . sum GRAD ASVABC SM SF MALE Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- GRAD | 540 .9425926 .2328351 0 1 ASVABC | 540 51.36271 9.567646 25.45931 66.07963 SM | 540 11.57963 2.816456 0 20 SF | 540 11.83704 3.53715 0 20 MALE | 540 .5 .5004636 0 1 Se estimarán los efectos marginales al poner todas las variables explicativas en el valor de su media muestral. Como se aprecia, 94% de los casos se graduaron. 29

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Logit: Marginal Effects mean b product f(Z) f(Z)b ASVABC 51.36 0.133 6.826 0.028 0.004 SM 11.58 –0.023 –0.269 0.028 –0.001 SF 11.84 0.012 0.146 0.028 0.000 MALE 0.50 0.128 0.064 0.028 0.004 Constant 1.00 –3.252 –3.252 Total 3.514 El primer paso es calcular Z, cuando las variables X con iguales a su media muestral. 30

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Logit: Marginal Effects mean b product f(Z) f(Z)b ASVABC 51.36 0.133 6.826 0.028 0.004 SM 11.58 –0.023 –0.269 0.028 –0.001 SF 11.84 0.012 0.146 0.028 0.000 MALE 0.50 0.128 0.064 0.028 0.004 Constant 1.00 –3.252 –3.252 Total 3.514 Ahora, se calcula f(Z). 31

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Logit: Marginal Effects mean b product f(Z) f(Z)b ASVABC 51.36 0.133 6.826 0.028 0.004 SM 11.58 –0.023 –0.269 0.028 –0.001 SF 11.84 0.012 0.146 0.028 0.000 MALE 0.50 0.128 0.064 0.028 0.004 Constant 1.00 –3.252 –3.252 Total 3.514 Los efectos marginales estimados son f(Z) multiplicado por su respectivos coeficientes. Se observa que el efecto ASVABC es similar al anterior. La educación de la madre tiene un efecto insignificante y la educación del padre no tiene un efecto discernible. 32

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Logit: Marginal Effects mean b product f(Z) f(Z)b ASVABC 51.36 0.133 6.826 0.028 0.004 SM 11.58 –0.023 –0.269 0.028 –0.001 SF 11.84 0.012 0.146 0.028 0.000 MALE 0.50 0.128 0.064 0.028 0.004 Constant 1.00 –3.252 –3.252 Total 3.514 Los hombre tienen 0.4% mayor de probabilidad de graduarse respecto a las mujeres. Estos efectos habrían sido mayores si se hubieran evaluado respecto a los menores puntajes de ASVABC. En stata, los efectos marginales se calculan con los comandos mfx o prvalue, entre otros. 33

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Las personas que se graduaron: probabilidad del resultado Esta presentación concluirá con una explicación puntual de cómo se estima el modelo utilizando la estimación de máxima verosimilitud. 34

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Las personas que se graduaron: probabilidad del resultado En el caso de un individuo que se graduó, la probabilidad de ese resultado es F(Z). Daremos los subíndices 1,…, s a los individuos que graduaron. 35

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Maximize F(Z1) x ... x F(Zs) x [1 – F(Zs+1)] x ... x [1 – F(Zn)] Las personas que se graduaron: probabilidad del resultado Las personas que no se graduaron: probabilidad del resultado En el caso de un individuo que no se graduó, la probabilidad es este resultado es 1 – F(Z). Daremos los subíndices s+1, ..., n a estos individuos. 36

MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT Maximize F(Z1) x ... x F(Zs) x [1 – F(Zs+1)] x ... x [1 – F(Zn)] Se graduaron No se graduaron Seleccionamos b1 y b2 para maximizar la probabilidad conjunta de estos resultados, esto es, F(Z1) x ... x F(Zs) x [1 – F(Zs+1)] x ... x [1 – F(Zn)]. No existe una fórmula matemática para b1 y b2. Tienen que ser determinadas iterativamente en un proceso de prueba y error. 37

Copyright Christopher Dougherty 2000–2010 Copyright Christopher Dougherty 2000–2010. This slideshow may be freely copied for personal use. 02.02.10