Estimación del Número de Desplazados en Colombia 1996 – 2006 Soledad Granada Mauricio Sadinle CERAC Jorge A. Restrepo Pontificia Universidad Javeriana.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

ANOVA DE UN FACTOR.
1.1 Contraste de Bondad de Ajuste para Datos Categóricos
Contraste de Hipótesis
Capítulo 10 Test de Hipótesis.
ESTUDIO DE MERCADO. MÉTODOS DE PROYECCIÓN
Inferencia estadística
} LISSET BÁRCENAS MONTERROZA
METODOLOGÍA Y TALLER DE INVESTIGACIÓN
PRUEBAS DE HIPÓTESIS Mercedes de la Oliva.
Estimación nivel potencial de desplazados en Colombia usando el Método de Marca y Recaptura CERAC.
KRIGING.
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I MULTICOLINEALIDAD
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
Estimación por Intervalos de confianza
CONCEPTOS BÁSICOS DE ESTADÍSTICA
DR. GLENN LOZANO ZANELLY
Conceptos básicos de inferencia
Nombre: Israel Espinosa Jiménez Matricula: Carrera: TIC Cuatrimestre: 4 Página 1 de 5.
ANOVA Modelo I: Comparación entre medias
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Inferencia Estadística
Clases 4 Pruebas de Hipótesis
1 Planteamiento del problema ¿Tenemos los humanos la capacidad de percibir si nos miran desde atrás? O, más exactamente: ¿Es defendible que existen otras.
HAWKES LEARNING SYSTEMS math courseware specialists Copyright © 2010 by Hawkes Learning Systems/Quant Systems, Inc. All rights reserved. Capítulo 12 Más.
ANALISIS DE DATOS CATEGORICOS
Pronósticos, Series de Tiempo y Regresión
Tema 17: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
Estadística Clase 3 Intervalos de confianza.
Bernardo Frontana de la Cruz Marco Antonio Gómez Ramírez Irene Patricia Valdez y Alfaro Junio de 2014.
ESTADISTICA TEMA 12.
Unidad V: Estimación de
ESTADISTICA TEMA y 223.
ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población.
Distribución Normal o gaussiana
Asistencia Técnica CMJ PROYECTO “FORTALECIMIENTO DE LOS PROCESOS DE PARTICIPACIÓN SOCIAL Y CONVIVENCIA PACIFICA DE LOS Y LAS JÓVENES VALLECAUCANOS” - COMPONENTE.
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Análisis Cuantitativo de Datos (Básico)
Titular: Agustín Salvia
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
Inferencia Estadística
Estadística para administradores
ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA
ESTADÍSTICA DESCRIPTIVA
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
Capítulo 1. Conceptos básicos de la Estadística
INFERENCIA ESTADÍSTICA
@ Angel Prieto BenitoMatemáticas 2º Bachillerato CS1 TEMA 15 * CONTRASTES DE HIPÓTESIS MATEMÁTICAS A. CS II.
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
Análisis de los Datos Cuantitativos
Septiembre  Responde a quienes y cuantas personas se aplicará el instrumento de recolección de datos.
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
LA SELECCIÓN DE LAS MUESTRAS EN EL PROCESO DE INVESTIGACIÓN
ESTIMACIÓN DE PARÁMETROS
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
NORMA INTERNACIONAL DE AUDITORÍA 530
Aspectos generales de la investigación educativa en el SNIT
CONTRASTE DE HIPÓTESIS Dimensiones Largo275mm. 169 mm 2 Ancho175mm.49 mm 2 Alto175mm.49 mm 2 Peso16 Kg.1 Kg 2. SITUACIÓN PROBLEMA.
INFERENCIA ESTADÍSTICA
BIOESTADÍSTICA Y ESTADÍSTICA BÁSICA CHILLÁN, SEGUNDO SEMESTRE PROF. SOC. M© KEVIN VILLEGAS.
PROCEDIMIENTO DE MUESTREO
METODOS DE REMUESTREO: JACKKNIFE Y BOOTSTRAP
PRUEBA DE SIGNIFICANCIA
ANALISIS DE VARIANZA.
INTERVALO DE CONFIANZA
Transcripción de la presentación:

Estimación del Número de Desplazados en Colombia 1996 – 2006 Soledad Granada Mauricio Sadinle CERAC Jorge A. Restrepo Pontificia Universidad Javeriana y CERAC 24 de Septiembre de 2007

El siguiente es un breve resumen de la metodología y los principales resultados en relación a la estimación de la población desplazada. Trabajo en curso realizado gracias al apoyo del Gobierno de Canadá

Contexto Ante la creciente problemática del desplazamiento forzado es importante saber la magnitud del problema con el fin de sugerir implantar políticas de solución y prevención de la misma. El desplazamiento forzado no solo afecta al desplazado y su familia, sino que desequilibra a la sociedad, la cultura y la economía. La diversidad de fuentes y su acceso hacen de esta pregunta un problema metodológico difícil de solucionar: ¿Cómo estimar? ¿Cómo conocer los “sesgos” o limitaciones de cada base y superarlos?

Desplazamiento Forzado

Fuentes de Información sobre Desplazamiento Secretariado Nacional de Pastoral Social –RUT- Acción Social de la Presidencia de la República –SIPOD- Potenciales: CODHES – SISDHES.

Secretariado Nacional de Pastoral Social –RUT- La base RUT cuenta originalmente con 242.565 registros, entre 1996 y 2004; después del proceso de depuración quedó con 236.795 registros, esto implica que el 2.37% de los registros presentan campos incompletos con información relevante para este trabajo. Una de las limitaciones de esta información, es que presenta un alto subregistro comparada con otras bases de datos del mismo tipo y con la magnitud de la problemática, esto se debe a que el registro en el RUT depende de la voluntad del desplazado.

Acción Social de la Presidencia de la Republica –SIPOD- La base de Acción Social, contiene 2.272.978 registros y cubre el período entre 1995 y octubre de 2006. Posee 38 variables, las cuales describen las características del desplazado, de tipo particular como su edad, estado civil, genero, posición que ocupa con respecto a la cabeza de familia; también tiene la información sobre el día y lugar exacto (municipio) del que se desplazó y al que llegó posteriormente. Se realizó un control de calidad de los registros de esta base, luego de la depuración la base quedó con 1.616.743 registros.

CODHES – SISDHES La base de datos del CODHES, corresponde a estimaciones de flujos de desplazados hechas desde el año 1992, esta información es recopilada a partir de recortes de prensa y noticias. También usa como fuente base el trabajo elaborado por la Conferencia Episcopal Colombiana en 1994 para construir su acumulado de personas desplazadas desde 1985. En 1995, con el documento CONPES 2804, en el que el gobierno colombiano reconoce su responsabilidad frente al desplazamiento forzado, se crea el sistema de registro de acciones violentas relacionadas al problema de desplazamiento denominada SISDHES.

Control de Calidad de los datos: Para garantizar que las estimaciones que realizáramos estuvieran blindadas en lo posible de errores, se realizó un exhaustivo control de calidad sobre los registros de todas las fuentes, eliminando registros incompletos o erróneos. También se eliminaron unos registros que a nuestra consideración podrían introducir distorsiones.

Acción Social La base de datos SIPOD que nos fue suministrada cuenta con registros hasta el 26 de junio de 2007, que constituyen 2.636.800 registros y 34 variables. Eliminamos los registros con las siguientes características: Luego de la eliminación de los registros que tuviesen alguna de estas características la base de datos quedó reducida a 2.378.436 registros, lo que representa una disminución del 10%. No obstante la estimación se hará para los desplazados que hayan salido entre 1990 y 2006 y que hayan llegado entre 1996 y 2006, lo cual corresponde a 2.300.798 registros.

Pastoral Social La última versión que tiene CERAC de la base RUT tiene registros hasta diciembre de 2007, cuenta con 107 variables y 401.782 registros. Eliminamos los registros con las siguientes características: Después de este procedimiento la base de datos quedó compuesta por 397.413 registros, lo que representa una disminución del 1%. La estimación se hace para los desplazados que hayan salido entre 1990 y 2006 y que hayan llegado entre 1996 y 2006, lo cual corresponde a 395.346 registros.  

Estimación con Múltiples Sistemas de Registro La estimación está basada en dos de las principales fuentes de registro de desplazados en Colombia. Debe tenerse en cuenta que ambas fuentes presentan subcobertura de la población y traslape entre ellas. Dadas estas condiciones y otras que se explicarán más adelante se decidió implementar estimaciones con Múltiples Sistemas de Registro –MSR- (también conocido como Marca y Recaptura) para estimar la población de desplazados para el periodo 1996 – 2006 en Colombia.

Lincoln-Petersen: Chapman: Estimadores * Estos dos estimadores necesitan el cumplimiento de los supuestos para su insesgamiento y eficiencia. Lincoln-Petersen: Chapman: Registros SUR Registros RUT Recapturados

Estimadores - Estratificación Sekar & Deming: No se garantiza igual probabilidad de inclusión para los individuos. Para corregir este problema, se propone una estratificación de la población para modelar las diferentes probabilidades de inclusión de los individuos. Se supone ahora que hay diferentes probabilidades de inclusión entre estratos, e iguales dentro de los estratos, independencia entre las muestras y población cerrada. La ventaja de estratificar es mejorar la estimación, ya que se reduce el sesgo generado por el no cumplimiento de los supuestos.

Supuestos El modelo básico de estimación con MSR permite hacer una estimación del total poblacional bajo los siguientes supuestos: Se cuenta como mínimo, con dos listas de registros. Todos los individuos tienen igual probabilidad de inclusión dentro de cada una de las listas. Las listas son independientes (entre si). Es posible identificar la intersección de las listas. La población es cerrada, es decir, que no cambia en el tiempo. El pionero en aplicar este sistema para indicadores de violencia y derechos humanos, fue Patrick Ball en la AAAS y mas recientemente en Benetech.

Variable identificadora Consta del día y lugar de salida y de llegada y el género. La estratificación de esta estimación es muy fina ya que es diaria municipal, por tanto es apropiado aceptar que dentro de cada estrato hay igual probabilidad de inclusión. Esta estimación está sujeta a errores en el registro de la fecha.

¿Cómo estratificar? Se realizó una comparación de estratos por las siguientes características: Espacial: para el periodo 1996-2004 entre los municipios. Temporal: para todos los municipios día a día y mes a mes, según la variable identificadora usada.

¿Cómo estratificar?: Pruebas de Hipótesis Separar los registros por alguna característica, de tal manera que si ésta tiene k categorías, tendremos k grupos Para cada grupo j estimar la probabilidad de inclusión en cada registro: Realizar una prueba de hipótesis donde se juzgue: Contra: Donde

El contraste de esta hipótesis se realiza utilizando una herramienta de la estadística no paramétrica llamada la Prueba Chi-Cuadrado para k Proporciones. El estadístico que se utiliza es: Donde: Y sabemos que:

Si se rechazan las hipótesis nulas, entonces quiere decir que esta característica puede ser un factor que induce diferencias en las probabilidades de inclusión. Por lo tanto estratificamos por esta característica. Aplicación: En este trabajo se hicieron dos ejercicios de este tipo utilizando Día de Llegada, Municipio de Llegada. Con un nivel de significancia del 10% se rechazaron las hipótesis nulas. Por lo tanto creamos estratos conformados por Día de Llegada y Municipio de Llegada.

Sobre-estratificación?: Municipios: estratos naturales Días: pueden presentar sobre-estratificación Solución: Prueba de hipótesis dentro de cada municipio para los días que fueran consecutivos: Se unen en un solo estrato los días en los que no se puede rechazar la hipótesis de que hay igual probabilidad de inclusión.

Intervalo de Confianza: El Remuestreo Bootstrap Se busca obtener una aproximación de la distribución muestral del estimador. Esta técnica consiste en obtener una muestra con reemplazo de una muestra determinada y conocida y a partir de esta nueva obtener un nuevo estimado. El sesgo que tenemos en nuestras estimaciones inducido por el estimador está dado por: Estimador corregido:

Resultados En las gráficas y mapas está representado el estimador de Chapman ya que tiene mejores propiedades estadísticas y por lo tanto adoptamos esta estimación.

Resultados Departamentales

Mapas Registrados RUT Registrados SUR Recapturados Población de Desplazados Estimada (llegada). Desplazados Registrados por salida (aproximación) Probabilidad de ser desplazado (Salida) Tasa de desplazados por 1.000 habitantes (llegada)

Registrados por Secretariado Nacional de Pastoral Social – RUT -

Registrados por Acción Social – SUR -

Recapturados

Población Desplazada Estimada 1996 – 2004

Desplazados Registrados por salida

Probabilidad de ser desplazado por municipio (salida)

Tasa de desplazamiento por 1.000 habitantes por municipio (llegada)

Comparación con otras cifras de Desplazamiento CODHES: Estimación (Enero 1985 a Junio 2006): 3.832.527* RUT: Estimación (1985 – 1994): 720.000 Registros (Enero 1995 a Junio 2004): 237.614 SUR: Registros (Enero 1995 a Junio 2005): 1.877.328 CEDE: Estimación (Enero 1995 a Junio 2005): 2.576.610 CERAC: Estimación (1996 - 2006): 3.911.782 * Incluye cifra Conferencia Episcopal periodo 1985 – 1994.

El objetivo es mejorar las estimaciones obtenidas con Múltiples Sistemas de Registro, incluyendo una nueva fuente de registros sobre desplazamiento.