Sebastian Galiani Mayo 2006 Sesión VI T é cnicas de Pareamiento.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

PRUEBAS DE HIPÓTESIS.
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN METODOLOGÍAS DE INVESTIGACIÓN
CONTENIDOS Teoría del muestreo ¿Cómo seleccionar una muestra?
Modelos de Variable Dependiente Binaria -Logit y Probit-
Bivariadas y Multivariadas
KRIGING.
GEOESTADISTICA MULTIVARIADA
Pruebas de Especificación en el Modelo de Regresión Múltiple
MODELO DE REGRESIÓN MÚLTIPLE
MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I MULTICOLINEALIDAD
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Econometria 2. Modelo de Regresión Lineal Simple
Tests de permutaciones y tests de aleatorización
Muestreo Obtención de evidencia confiable y pertinente, suficiente para brindar una base razonable sobre la cual emitir una opinión. Procedimientos que.
Nombre: Israel Espinosa Jiménez Matricula: Carrera: TIC Cuatrimestre: 4 Página 1 de 5.
División de Estudios Políticos, CIDE
Tema 2: Métodos de ajuste
FUNCIONES DE DENSIDAD DE PROBABILIDAD
Inferencia Estadística
Unidad VI: PRUEBAS DE HIPOTESIS
1 Planteamiento del problema ¿Tenemos los humanos la capacidad de percibir si nos miran desde atrás? O, más exactamente: ¿Es defendible que existen otras.
Población y Muestra.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
TIPOS DE MODELOS DE REGRESIÓN Y SUPUESTOS PARA EL MODELO A
Unidad V: Estimación de
ANALISIS DE DATOS CATEGORICOS
Mt. Martín Moreyra Navarrete.
(Organización y Manejo de Archivos)
INTERVALO DE CONFIANZA
Elementos Básicos de Probabilidad y Estadística Javier Aparicio División de Estudios Políticos, CIDE Julio 2009
Investigación Experimental
Unidad V: Estimación de
ESTADISTICA TEMA y 223.
ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población.
Estimación Sea una característica, un parámetro poblacional cuyo valor se desea conocer a partir de una muestra. Sea un estadístico ( función.
Métodos de calibración: regresión y correlación
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
ESTIMACION POR INTERVALOS
Análisis Cuantitativo de Datos (Básico)
Capacidad de Proceso.
Inferencia Estadística
Herramientas básicas.
Unidad V: Estimación de
Capítulo 1. Conceptos básicos de la Estadística
Distribuciones de probabilidad bidimensionales o conjuntas
Pruebas de hipótesis.
PRUEBAS ESTADISTICAS NO PARAMETRICAS
Elementos Básicos de Probabilidad y Estadística
Estimación y contraste de hipótesis
Diseños Generales. 2 Propósito implícito del diseño experimental El propósito implícito de todo diseño experimental consiste en imponer restricciones.
Tomando decisiones sobre las unidades de análisis
INTERVALOS DE CONFIANZA
ESTIMACIÓN DE PARÁMETROS
INTERVALO DE CONFIANZA
MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables.
NORMA INTERNACIONAL DE AUDITORÍA 530
Muestreo Probabilístico
Aspectos generales de la investigación educativa en el SNIT
Clase N°11 Métodos de reducción de varianza
INFERENCIA ESTADÍSTICA
1 Tema 8. Diseños evaluativos de alta intervención TALLER: DISEÑO Y EVALUACIÓN DE PROGRAMAS XIV CONGRESO DE METODOLOGÍA DE LAS CIENCIAS SOCIALES Y DE LA.
BIOESTADÍSTICA Y ESTADÍSTICA BÁSICA CHILLÁN, SEGUNDO SEMESTRE PROF. SOC. M© KEVIN VILLEGAS.
Copyright © 2015 Banco Interamericano de Desarrollo. Esta obra está bajo una licencia Creative Commons IGO 3.0 Reconocimiento-No Comercial-Sin Obra Derivada.
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Tarea # 4 PRUEBAS DE HIPÓTESIS ESTADÍSTICAS. PRUEBA DE HIPÓTESIS Hipótesis es una aseveración de una población elaborado con el propósito de poner a prueba,
Estimación estadística
Free and Quick translation of Prof. Anderson's slides1 Analisis de Regresion Multiple y =  0 +  1 x 1 +  2 x  k x k + u 1. Estimacion.
INTERVALO DE CONFIANZA
Transcripción de la presentación:

Sebastian Galiani Mayo 2006 Sesión VI T é cnicas de Pareamiento

WBIFPSILACHDN 2 El caso de la asignación aleatoria al tratamiento  Si la asignación al tratamiento es aleatoria en la población, ambos resultados potenciales son independientes del estado de tratamiento. Y (1), Y (0)  D (1)  En este caso la información faltante no crea problemas porque: E{Y i (0)|D i = 0} = E{Y i (0)|D i = 1} = E{Yi(0)} (2) E{Y i (1)|D i = 0} = E{Y i (1)|D i = 1} = E{Y i (1)} (3)  Entonces,  = E{  i | D i = 1} (4) =E{Y i (1) - Y i (0) | D i = 1} =E{Y i (1)|D i = 1} - E{Y i (0) | D i = 1} = E{Y i (1)|D i = 1} - E{Y i (0)|D i = 0} = E{Y i |D i = 1} - E{Y i |D i = 0}.

WBIFPSILACHDN 3  La aleatorización asegura que el sesgo de selección de la muestra es cero: E{Y i (0) | D i = 1} - E{Y i (0) | D i = 0} = 0(5)  Notar que la aleatorización implica que la información faltante es “completamente faltante de forma aleatoria”, por esta razón no puede crear problemas.  Si la aleatorización no es posible y no están disponibles experimentos naturales necesitamos partir de un conjunto diferente de hipótesis. El caso de la asignación aleatoria al tratamiento

WBIFPSILACHDN 4 Insesgamiento y selección en observables  Sea X una matriz en la cual cada renglón es un vector de variables observables antes del tratamiento para el individuo i.  Definición de insesgamiento La asignación al tratamiento es insesgada dadas las variables pre-tratamiento si Y (1), Y (0)  D | X  Veáse que asumir es equivalente a decir que: Dentro de cada celda definida por el tratamiento X es aleatoria ; La selección dentro del tratamiento depende sólo de las variables observables X.

WBIFPSILACHDN 5 Efectos promedio sobre los intervenidos asumiendo insesgamiento  Si estamos dispuestos a asumir que no hay sesgos: E{Y i (0)|D i = 0,X} = E{Y i (0)|D i = 1,X} = E{Y i (0)|X} (6) E{Y i (1)|D i = 0,X} = E{Y i (1)|D i = 1,X} = E{Y i (1)|X} (7)  Usando estas expresiones, podemos definir para cada celda definida por X:  x = E{  i |X} (8) = E{Y i (1) - Y i (0)|X} = E{Y i (1)|X}- E{Y i (0)|X} = E{Y i (1)|D i = 1,X} - E{Y i (0)|D i = 0,X} = E{Y i |D i = 1,X} - E{Y i |D i = 0,X}

WBIFPSILACHDN 6  Usando la Ley de expectativas interativas, el efecto promedio del tratamiento sobre el grupo de intervención está dado por:  = E{  i |D i = 1}(9) = E{E{  i |D i = 1,X} | D i = 1} = E{ E{Y i |D i = 1,X} - E{Y i |D i = 0,X} |D i = 1} = E{  x |D i = 1}  Donde la esperanza externa está sobre la distribución de X|Di = 1. Efectos promedio sobre los intervenidos asumiendo insesgamiento

WBIFPSILACHDN 7 Estrategias de Pareamiento y Regresión para la estimación los efectos causales promedio  Insesgamiento sugiere la siguiente estrategia para la estimación del efecto del tratamiento promedio definido en las ecuaciones 8 y 9: i. estratificar los datos dentro de cada celda definida para cada valor particular de X; ii. Dentro de cada celda (i.e. condicionando en X) calcular la diferencias entre los resultados promedio entre el grupo de tratamiento y de control; iii. El promedio de estas diferencias con respecto a la distribución de X i en la población de unidades tratadas.  Esta estrategia genera las siguientes preguntas: ¿Esta estrategia es diferente de la estimación de una regresación lineal de Y sobre D controlando no parametricamente para todo el conjunto de principales efectos e intereacciones de las covariables X? ¿Es viable esta estrategia?

WBIFPSILACHDN 8  Es evidente, sin embargo, que la inclusión en una regresión de un conjunto completo de interacciones o-parámétricas entre todas las variables observables puede no ser factible cuando la muestra es pequeña, el conjunto de covariables es grande y muchas de ellas presentan múltiples valores, o, en el peor de los casos, continua.  El problema de dimensionalidad, es probable que también incorpore problemas en la estrategia de pareamiento descritas por las ecuaciones 8 y 9:  Con K variables binarias el número de celda es 2K y crece exponencialmente con K.  El número de celdas se incrementa más si algunas variables en X toman más de 2 valores.  Si el número de celdas es muy grande con respecto al tamaño de la muestra, es muy fácil encontrar situaciones en las cuales hay:  Celdas que contienen sólo unidades con tratamiento  Celdas que contienen sólo controles. ¿Es factible el pareamiento? El problema de dimensionalidad

WBIFPSILACHDN 9  Por lo tanto, el efecto promedio del tratamiento para estas celdas no puede ser calculado.  Rosenbaum y Rubin (1983) proponen una estrategia de estimación equivalente y factible basada en el concepto del Propensity Score y sobre sus propiedades que permiten reducir el problema de dimensionalidad.  Es importante darse cuenta que la regresión con un modelo no saturado no es una solución y puede conducir a conclusiones totalmente erróneas. ¿Son factibles el pareamiento y la regresión? El problema de dimensionalidad

WBIFPSILACHDN 10 Pareamietno basado en el “propensity score”  Definición: “Puntaje de Propensión” (Rosenbaum y Rubin, 1983): El “propensity score” es la probabilidad condicional de recibir el tratamiento dadas las variables observadas antes del tratamiento: p(X) Pr{D = 1|X} = E{D|X} (10)  El “propensity score” tiene dos propiedades importantes: Lema 1 Equilibrar las variables pre-tratamiento dado su “puntaje de propensidad” (Rosenbaum y Rubin, 1983) Si p(X) es el “propensity score” D  X | p(X) (11) Lema 2 Insesgamiento dado el “puntaje de propensidad” (Rosenbaum y Rubin, 1983) Suponer que la asignación del tratamiento es insesgada, i.e. Y (1), Y (0)  D | X Entonces, la asignación al tratamiento es insesgada dado el “puntaje de propensidad”, i.e Y (1), Y (0)  D | p(X) (12)

WBIFPSILACHDN 11 Efectos promedio del tratamiento y el “propensity score”  Utilizando el “puntaje de propensidad” y sus propiedades podemos ahora parear casos y controles en base a éste en lugar del vector multidimensionalidad de variables observables X. E{Y i (0)|D i = 0, p(X i )} = E{Y i (0)|D i = 1, p(X i )} = E{Y i (0)|p(X i )} (13) E{Y i (1)|D i = 0, p(X i )} = E{Y i (1)|D i = 1, p(X i )} = E{Y i (1)|p(X i )} (14)  Usando estas expresiones, podemos definir para cada celda denotada por p(X):  p(x)  E{  i |p(X i )} (15)  E{Y i (1) - Y i (0)|p(X i )}  E{Y i (1)|p(X i )} - E{Y i (0)|p(X i )} = E{Y i (1)|D i = 1, p(X i )} - E{Y i (0)|D i = 0, p(X i )} = E{Y i |D i = 1, p(X i )} - E{Y i |D i = 0, p(X i )}.

WBIFPSILACHDN 12 Efectos promedio del tratamiento y el “propensity score”  Usando la Ley de “Esperanzas iteradas/interactuadas”, el efecto promedio del tratamiento en las unidades tratadas está dado por:  = E{  i |D i = 1} (29) = E{E{  i |D i = 1, p(X i )}|D i = 1} = E{ E{Y i (1)|D i = 1, p(X i )} - E{Y i (0)|D i = 0,, p(X i )} |D i = 1} = E{p(x)|D i = 1}  Donde la esperanza externa está en la distribución de p(X i )|D i = 1.

WBIFPSILACHDN 13 Implementación de la estrategia de estimación  Para implementar la estrategia de estimación sugerida por el puntaje de propensidad y sus propiedades son necesarios 2 pasos secuenciales. i. Estimación del propensity score Este paso es necesario porque el puntaje de propensidad verdadero no se conoce y por tanto, el puntaje de propensidad tiene que ser estimado. ii. Estimación del efecto promedio de tratamiento dado el puntaje de propensidad Idealmente en este paso nos gustaría:  parear los casos y controles con exactamente el mismo puntaje de propensidad (estimado);  Calcular el efecto del tratamiento para cada valor del puntaje de propensidad (estimado) (ver ecuación 28).  Obtener el promedio de los efectos condicionales como en la ecuación 29.

WBIFPSILACHDN 14 Implementación de la estrategia de estimación  Esto no es factible en la práctica porque es raro encontrar 2 unidades con exactamente el mismo propensity score.  Hay, sin embargo, varias alternativas y procedimientos factibles para llevar a cabo este paso: Estratificación en la puntuación; Pareamiento por la unidad más próxima en la puntuación; Pareamiento por radio en la puntuación; Pareamiento de Kernel en la puntuación; Asignar un peso en base a la puntuación

WBIFPSILACHDN 15 Estimación del puntaje de propensidad  Aparentemente, el mismo problema de dimensionalidad que evita la estimación de los efectos de tratamiento debería evitar también la estimación de los puntajes de propensidad.  Sin embargo, este no es el caso gracias al “propiedad de balance” del puntaje de propensidad (Lema 1) de acuerdo al cual:  Las observaciones con el mismo “puntaje de propensidad” tienen la misma distribución de covariables observables independientemente del status de tratamiento;  Para un “puntaje de propensidad” dado, la asignación al tratamiento es aleatoria y por tanto, creada y las unidades de control son en promedio idénticas observacionalmente.

WBIFPSILACHDN 16 Estimación del “puntaje de propensidad”  Por lo tanto, cualquier modelo de probabilidad estándar puede ser utilizado para estimar el puntaje de propensidad, por ejemplo: un modelo logit: donde h(X i ) es una función de covariables con terminos lineales y de ordenes superiores.  La elección de cuál término de mayor orden incluir es determinada únicamente por la necesidad de obtener una estimación del puntaje de propensidad que satisfaga la “propiedad de balance”.

WBIFPSILACHDN 17  Así como la especificación de h(X i ), la cual satisface la propiedad de balance, tiene más parsimonia que el conjunto total de interacciones necesarias para parear casos y controles en base a las observables (como en las ecuaciones 8 y 9), el puntaje de propensidad reduce la dimensionalidad del problema de estimación.  Notar que, dado este propósito, la estimación de los puntajes de propensidad no necesitan una interpretación conductual. Estimación del “puntaje de propensidad”

WBIFPSILACHDN 18 Un algoritmo para estimar el puntaje de propensidad i. Iniciar con una función logit o probit con parsimonia para estimar la puntuación. ii. Clasificar los datos de acuerdo al puntaje de propensidad estimado (de menor a mayor). iii. Estratificar todas las observaciones en bloques, de tal manera que, en cada bloque los puntajes de propensidad estimados para los casos y los controles no sean estadísticamente diferentes: (a) Iniciar con 5 bloques de igual rango de puntuación” { ,..., }; (b) Probar si las medias de las puntuaciones para las unidades tratadas y los controles son estadísticamente diferentes en cada bloque; (c) De ser así, aumentar el número de bloques y probar de nuevo; (d)Si no, ir al siguiente paso. (continua en la diapositiva siguiente…)

WBIFPSILACHDN 19 Un algoritmo para estimar el puntaje de propensidad vi. Probar que la propiedad de balnace se mantiene en todos los blocks para todas las covariables: (a)para cada covariable, probar si las medias (y posiblemente momentos de mayor orden) para las unidades tratadas y para los controles son estadísticamente diferentes en todos los grupos; (b)si una covariable no está distribuida de manera equilibrada en un block, dividir el grupo y probar de nuevo dentro de cada “finer” block; (c)si una covariables no está distribuida de manera equilibrada en todos los grupos, modificar la estimación logit del “propensity score” añadiendo más interacciones y términos de mayor orden y probar de nuevo.  Notar que en todos estos procedimientos el resultado no tiene un rol.  Ver el Programa STATA pscore.ado descargable en:

WBIFPSILACHDN 20 Algunas herramientas de diagnóstico útiles  Como discutimos al inicio de esta sección, los métodos de puntaje de propensidad se basan en la idea de que la estimación de los efectos del tratamiento requiere un minucioso pareamiento de los casos y controles.  Si los casos y controles son muy diferentes en términos de las observables, este pareamiento no es suficientemente estrecho y confiable o incluso puede ser imposible.  La comparación de los puntajes de propensidad estimados en las unidades tratadas y de control provee una útil herramienta de diagnóstico para evaluar qué tan similares son los casos y los controles, y por tanto, qué tan confiable es la estrategia de estimación.

WBIFPSILACHDN 21  Específicamente, es aconsejable: Contar cuántos controles tienen un puntaje de propensidad menor al mínimo o mayor al máximo de los de las unidades tratadas.  Idealmente nos gustaría que el rango de variación de los puntajes de propensidad sea el mismo en los dos grupos. Generar histogramas de los puntajes de propensidad estimados para los casos y los controles con barras que correspondan a(con) los estratos construidos para la estimation de puntajes de propensidad.  Idealmente, desearíamos una frecuencia igual de unidades de tratamiento y controles en cada celda. Nótese que estos indicadores de diagnóstico fundamentales no son calculados en una regresión estándar, aunque también podrían ser útiles para este análisis. (Ver Dehejia y Wahba, 1999). Algunas herramientas de diagnóstico útiles

WBIFPSILACHDN 22 Estimación del efecto de tratamiento por estratificación de la puntuación  Este método está basado en el mismo procedimiento de estratificación utilizado para estimar el puntaje de propensidad. Por construcción, en cada estrato the covariates are balanced y la asignación al tratamiento es aleatoria.  Sea T el conjunto de unidades tratadas y C el conjunto de unidades de control, y sean Y i T y Y j T los resultados observados de las unidades de casos y controles, respectivamente.

WBIFPSILACHDN 23 Estimación del efecto de tratamiento por estratificación de la puntuación  Sea el índice q los estratos definidos sobre los intervalos del puntaje de propensidad, dentro de cada grupo podemos calcular donde I(q) es el conjunto de unidades en un grupo q mientras que N q T y N q C son los números de unidades de tratamiento y control en el grupo q.

WBIFPSILACHDN 24  El estimador de ATT es calculado con la siguiente fórmula: donde el peso para cada grupo está dado por la fracción correspondiente de unidades tratadas y Q es el número de grupos.  Asumiendo independencia de los resultados entre las unidades, la varianza de  S éstá dada por Estimación del efecto de tratamiento por estratificación de la puntuación

WBIFPSILACHDN 25 Comentarios adicionales  Controles irrelevantes Si el objetivo es estimar el efecto del tratamiento sobre el tratado el procedimiento debería ser aplicado después de haver descartado a todos los controles con un puntaje de propensidad más alto que el valor máximo o menor que el valor mínimo de los puntajes de propensidad de los casos.  Castigo for un número desigual de unidades tratadas y controles en un grupo  Nótese que si hay un grupo en el cual el número de controles es más pequeño que el número de unidades tratadas, la varianza aumenta y el castigo es mayor entre mayor sea la fracción de los tratados en ese grupo. Si N q T = N q C la varianza se simpifica a:

WBIFPSILACHDN 26 Comentarios adicionales  Alternativas para la estimación de los resultados dentro de los grupos.  En las expresiones anteriores, el resultado en caso de tratamiento en un grupo ha sido estimado como el resultado promedio de los casos en ese grupo (y de manera similar para los controles). Otra posibilidad es obtener estos resultados como valores predichos de la estimación de funciones lineales (o más sofisticadas) de los "propensity scores”. Los beneficios de usar estas técnicas más sofisticadas no parecen ser grandes. (See Dehejia and Wahba, 1996.)

WBIFPSILACHDN 27 Estimación del efecto de tratamiento pareando por unidad más próxima, por radio y Kernel  Idealmente, nos gustaría parear cada unidad tratada con una unidad de control que tenga exactamente el mismo puntaje de propensidad y viceversa.  Este pareamiento exacto es, sin embargo, imposible en la mayoría de las aplicaciones.  Para un pareamiento exacto, lo más que podemos hacer es parear cada unidad tratada con el control más cercano en términos del puntaje de propensidad.  Sin embargo, esto plantea la cuestión de qué hacer con las unidades para las cuales el par más cercano ha sido ya utilizado  Describimos aquí 3 métodos enfocados a resolver este problema.  Pareando por la unidad (individuo) más próxima con reemplazo;  Parear por radio con reemplazo;  Pareamiento de Kernel

WBIFPSILACHDN 28  Este método para estimar los efectos del tratamiento es sugerido por el siguiente lema, donde ATE es el efecto promedio de tratamiento (average effect of treatment) en la población.  Lema 3 ATE y asignación cierto peso sobre el puntaje de propensidad Suponemos que la asignación al tratamiento es insesgado, i.e. Y (1), Y (0)  D | X Luego Estimación del efecto de tratamiento asignando cierto peso a la puntuación

WBIFPSILACHDN 29 Estimación del efecto de tratamiento asignando cierto peso a la puntuación  Comprobación del Lema 3: usando la ley de “esperanzas iteradas/interactuadas”: lo cual puede se puede expresar como: Usar la definición de propensity score y el hecho de que el insesgamiento hace el condicionamineto en el tratamiento irrelevante en las dos esperanzas internas, esto es igual a: E{E{Y i (1)|X}- E{Y i (0)|X}} = E{Y i (1)} - E{Y i (0)} (25) QED.

WBIFPSILACHDN 30  Por tanto, substituyendo las estadísticas muestrales en el RHS de 22 obtenemos una estimación de ATE.  Un lema similar sugiere un estimador ponderado del ATT ATT.  Lema 4 ATT y ponderación en el puntaje de propensidad  Suponer que esa asignación al tratamiento es insesgado, i.e. Y (1), Y (0)  D | X Luego  = {E{Yi(1)|Di = 1} - E{Yi(0)|Di = 1}} (26) Estimación del efecto de tratamiento asignando cierto peso a la puntuación

WBIFPSILACHDN 31  Substituting sample statistics in the RHS of 26 we obtain an estimate of the ATT. Note the different weighting function with respect to the ATE.  Un problema potencial del métodos que asigna un peso es que es sensible a la forma en que es estimado el puntaje de propensidad.  En cambio, los métodos de estratificación y pareo no son sensibles a la especificación del “puntaje de propensidad” estimado.  En cambio, una ventaja del método de ponderación es que no depende de los procedimientos de estratificación o pareamiento. Estimación del efecto de tratamiento asignando cierto peso a la puntuación

WBIFPSILACHDN 32  Es aconsejable usar todos los métodos y compararlos: diferencias grandes entre ellos podrían ser resultado de: No especificación del puntaje de propensidad; Una falla en el supuesto de insesgamiento;  El cálculo del error estándar es problemático porque el puntaje de propensidad es estimado. Hirano, Imbens y Ridder (2000) muestran cómo calcular el error estándar. Ver también Heckman, Ichimura y Todd (1998) y Hahn (1998). Estimación del efecto de tratamiento asignando cierto peso a la puntuación

WBIFPSILACHDN 33 Referencias  Dehejia, R.H. and S. Wahba (1999), “Causal Effects in Nonexperimental Studies: Reevaluating the Evaluation of Training Programs”, Journal of the American Statistical Association, 94, 448,  Dehejia, R.H. and S. Wahba (1996), “Causal Effects in Nonexperimental Studies: Reevaluating the Evaluation of Training Programs”, Harvard University, Mimeo.  Hahn, Jinyong (1998), “ ON the role of the propensity score in efficient semiparamentric estimation of average treatment effects”, Econometrica, 66,2,

WBIFPSILACHDN 34 Referencias  Heckman, James J. H. Ichimura, and P. Todd (1998), “ Matching as an econometric evaluation estimator ”, Review of Economic Studies, 65,  Hirano, K., G.W. Imbens and G. Ridder (2000), “Efficient Estimation of Average Treatment Effects using the Estimated Propensity Score”, mimeo.  Rosenbaum, P.R. and D.B. Rubin (1983), “The Central Role of the Propensity Score in Observational Studies for Causal Effects”, Biometrika 70, 1, 41–55.