La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

II CONTEO DE POBLACIÓN Y VIVIENDA 2005 REVISIÓN DE CONSISTENCIA DE LA INFORMACIÓN Eunice Bañuelos y Marcela Eternod Buenos Aires, Argentina Junio de 2006.

Presentaciones similares


Presentación del tema: "II CONTEO DE POBLACIÓN Y VIVIENDA 2005 REVISIÓN DE CONSISTENCIA DE LA INFORMACIÓN Eunice Bañuelos y Marcela Eternod Buenos Aires, Argentina Junio de 2006."— Transcripción de la presentación:

1 II CONTEO DE POBLACIÓN Y VIVIENDA 2005 REVISIÓN DE CONSISTENCIA DE LA INFORMACIÓN Eunice Bañuelos y Marcela Eternod Buenos Aires, Argentina Junio de 2006 INSTITUTO NACIONAL DE ESTADÍSTICA, GEOGRAFÍA E INFORMÁTICA

2 Revisión de consistencia de la información Datos imperfectos Validación Previsión y detección de errores Revisión de congruencia Aplicación de tratamientos lógicos (de acuerdo con los marcos conceptuales y metodológicos) que permiten rescatar información Validación Todo proceso de generación de información requiere un control de la calidad, control indispensable debido a los errores inevitables que suceden en las diferentes etapas del proceso de generación, principalmente en el trabajo de campo. Datos mejorados

3 Diseñar un cuestionario bien estructurado, de fácil llenado y universal entendimiento Utilizar un manual con instrucciones claras, impartir capacitación en tiempo y forma, con ejercicios prácticos Utilizar una estructura operativa con funciones de supervisión y revisión de datos Aplicar una campaña de sensibilización para la población Medidas que contribuyen a mejorar la calidad

4 Validación La validación es una actividad que acompaña todas las fases de un proyecto de generación de datos Contenido de esta presentación Primera sección Lineamientos rectores Procedimientos aplicados en la captura Secuencia de los procesos temáticos Segunda sección Tratamientos aplicados a los temas y preguntas. Criterios para resolver omisión e incongruencia.

5 Etapas del conteo Planeación Levantamiento de la información Concentración de cuestionarios Captura Codificación Validación automática Actualización cartográfica y preparación de archivos para explotación

6 Planeación y levantamiento Planeación Se definieron todas las estrategias de supervisión, revisión y adecuación de los datos que aplicarían en todo el proceso, las cuales están incluidas en las cinco etapas restantes. Levantamiento Supervisión en el llenado del cuestionario con especial interés en los datos de control (juegos de cuestionarios por hogar y vivienda, número de cuestionarios, viviendas y población contadas). Aplicación de criterios de revisión y procedimientos de corrección de errores. Control de la cobertura (tarea prioritaria)

7 Procesamiento y codificación Una vez levantada la información en campo, los cuestionarios fueron empaquetados y trasladados a 10 áreas regionales del INEGI. Se tuvieron estrictos mecanismos de control. Digitación de datos mediante teclado. Se resolvieron los casos simples de multirrespuesta. La codificación fue prácticamente automática y permitió facilitar el procesamiento y la explotación de la información.

8 Validación automática Desarrollo y utilización de programas informáticos con base en criterios definidos previamente y sustentados en los fundamentos conceptuales y metodológicos de cada variable para detectar datos incongruentes y omisiones, y al mismo tiempo aplicar tratamientos de corrección. Cuestionarios liberados de codificación Proceso de validación de información Cuestionarios validados Reportes para análisis Reportes para análisis

9 Criterios de validación Se acepta que a lo largo del proceso de generación de información se cometen errores y equivocaciones que pueden distorsionar los resultados emitidos, por ello es necesario aplicar un conjunto de normas de coherencia de revisión y establecer las medidas de corrección más apropiadas y acordes con los objetivos y metas del proyecto de generación estadística. Hay tres fuentes regulares de error: Informantes Entrevistadores Digitadores que capturan los datos en la computadora

10 Clases de error Omisión o falta de respuesta, debido a que se desconocen los datos, el entrevistador no aplicó la pregunta o no anotó la respuesta. Respuesta múltiple, provocada por incomprensión del informante, inadecuada formulación de la pregunta y falta de entendimiento por parte del entrevistador. Valor inverosímil o fuera del rango posible, el entrevistador equivoca al asentar el dato en el cuestionario, o bien el digitador comete errores al momento de insertar el dato en la computadora. No respetar pases en la aplicación de preguntas condicionadas, por problemas en el diseño del cuestionario o falta de comprensión de las instrucciones para llenar el cuestionario. Incongruencia entre las respuestas obtenidas de preguntas relacionadas, provocadas por errores de asentamiento por parte del entrevistador, desconocimiento de instrucciones de llenado y equivocaciones al momento de digitar los datos.

11 Los errores se generan en diferentes momentos del desarrollo del proyecto, principalmente: Por el diseño del cuestionario e instrumentos de recolección. Por imprecisiones o la falta de instrucciones en los manuales de levantamiento. Por una capacitación inadecuada, incompleta o inexistente. Por carencia de supervisión, revisión y corrección en el levantamiento. Por incomprensión del informante y poca capacidad o interés del entrevistador para hacer aclaraciones. Por hacer un registro incorrecto o incompleto de las respuestas debido a desconocimiento, ineptitud o cansancio. Por un inadecuado diseño u operación de los programas de captura y codificación. Diversas fuentes de error

12 Elementos rectores en el diseño de criterios Los criterios de validación establecidos para el II Conteo tienen las siguientes características: 1.Respetan las normas conceptuales y metodológicas establecidas, éstas se concretan en las instrucciones de llenado del instrumento de recolección (cuestionario). 2.Preservan la información recolectada en campo que fue correctamente captada. No pretender aumentar la cobertura, agregando unidades inexistentes. 3.Responden a una revisión de congruencia lógica sustentada en evidencias empíricas observadas en previos proyectos de generación.

13 4.La asignación de valores sólo se realiza si están sustentados en la información contenida en otras variables asociadas. 5.Son de aplicación universal y homogénea para todas las viviendas, hogares y población de todas las entidades federativas que integran el territorio nacional. 6.Casi en su totalidad son determinísticos, porque las soluciones se definieron previamente, con base en la experiencia empírica a partir de los problemas observados en las formas de registrar la información en los cuestionarios; así como en las posibles inserciones de errores durante la digitación de los datos en la computadora. Elementos rectores en el diseño de criterios

14 8.No son demasiado rígidos y no cubren todos los posibles errores o los que podrían ser interpretados como tales, para no eliminar situaciones que pueden presentarse en diversos contextos regionales y locales. 9.No implican un desarrollo de programas complejos y costosos en tiempo. En su mayoría los criterios son traducidos al método de vectores teóricos que permiten considerar todas las posibles combinaciones y facilitan la elaboración de programas informáticos. 10.Se aplican mediante programas informáticos que permiten el monitoreo y la generación de reportes de las modificaciones efectuadas con el propósito de cuantificar y evaluar el impacto de la aplicación de los criterios en cada variable. Elementos rectores en el diseño de criterios

15 Criterios de validación aplicados en captura Para garantizar un procesamiento de la información eficaz, oportuno y con un costo razonable, en la fase de captura se aplicaron procedimientos para lograr lo siguiente: 1.Controlar la inserción de valores fuera de un rango establecido para evitar la introducción de errores de digitación y reducir el tiempo de corrección posterior. 2.No capturar respuestas múltiples ya que la muy baja frecuencia observada en proyectos anteriores sugirió evitar su captura. 3.Verificar la captura con una muestra de cuestionarios (10%) y cuando se detectaron proporciones considerables de errores, los lotes completos se volvieron a capturar. 4.Aplicar procedimientos primarios de análisis para preservar la cobertura total de cuestionarios y eliminar los registros duplicados.

16 Control de códigos fuera de rango El programa de captura tenía establecidos los rangos válidos para cada variable con base en la cantidad y tipo de respuestas posibles en el cuestionario. Para la parte correspondiente a la carátula o portada del cuestionario, en donde se ubica centralmente la identificación geográfica, así como el control de cuestionarios por vivienda y por hogar:

17 Control de códigos fuera de rango Para las variables que identifican el tipo y clase de vivienda, así como las características de las viviendas particulares:

18 Control de códigos fuera de rango Para el apartado residentes, hogares y lista de personas:

19 Control de códigos fuera de rango Para la tercera sección del cuestionario que corresponde a las características de las personas:

20 Solución de respuesta múltiple en captura Los criterios para resolver la respuesta múltiple fueron: 1.Ante una respuesta dicotómica, es decir SI o NO, el criterio adoptado fue blanquear la información. 2.Para las preguntas con tres o más opciones de respuesta, se adoptó el código mayor o el menor, dependiendo de cada variable.

21 Aplicación de criterios en validación En esta fase se revisa que los valores que tienen las variables se encuentren dentro de los límites establecidos y que dichos valores sean congruentes con la información de otras variables que están relacionadas entre si. Asimismo, se les asigna un valor definitivo que permitirá generar el archivo para conformar las bases de datos de explotación.

22 Procesos de revisión y secuencia La validación del II Conteo se planteó en tres grandes secciones: 1.Una rutina inicial que revisa, principalmente, la información sobre ubicación geográfica, a la cual entran todas las viviendas. 2.La segunda sección corresponde a los procedimientos que se aplican a las preguntas sobre las características de las viviendas y actividades agropecuarias. 3.La tercera agrupa los procedimientos que permiten validar la información de hogares y su población.

23 Para aplicar la validación se estableció el siguiente orden y se definieron 22 procesos, considerando las variables que tienen una relación en las respuestas, así como las que utilizarían para validar la información de otras variables. Procesos de revisión y secuencia

24 Metodología de vectores Para elaborar los criterios de validación se utilizó la metodología de vectores que consiste en construir una función que relaciona las variables, donde cada combinación de variables genera una imagen y cada imagen recibe una solución específica. La función toma un conjunto de valores y cada valor tiene especificado su procedimiento. f(x) = Ax + By + Cz … Esta metodología es muy fácil de programar y muy rápida para procesar grandes cantidades de información.

25 Comentario final La historia de los criterios de validación utilizados en México para los censos y conteos de población y vivienda, refleja algunos de los problemas inherentes a la realidad de muchas de las oficinas de estadística en Latinoamérica y sirve para ilustrar la importancia de transparentar el proceso de validación de cada proyecto estadístico. En México el censo de 1980 se validó con dos metodologías complementarias y un corolario: Tomando como base una matriz de casos correctos, se imputaba la información faltante en aquellas situaciones que tenían similitud y semejanza, para determinadas variables: características económicas, número de hijos, etc. Teniendo un conjunto de datos específicos, se rescata información faltante de determinada pregunta o se acota la respuesta.

26 Comentario final El corolario es que todo lo que no se previó tuvo que decidirse sobre la marcha y se tuvieron que diseñar y rediseñar criterios. Aquí hubo problemas graves con la validación y en muchos casos está fue manual o sobre los propios archivos. No hay documentación de cuántos casos se imputaron, se reprocesaron, ni de cómo entró y cómo salió la información para la mitad de las entidades federativas del país. El censo de 1990 se validó todo con vectores, en esta ocasión se decidió lo que se iba a validar, se diseñaron los criterios y se llevó a cabo de manera automática; se tuvo cuidado de contabilizar cuántos casos se modificaron, porque se hizo la modificación (que criterio), y cómo quedó la información de salida. El ejercicio quedó documentado y se identificaron 7 rutinas de validación susceptibles de revisión y ajuste.

27 Comentario final En 1995 gran parte de la información se validó en campo, otra parte se resolvió en la captura y posteriormente, una vez capturada la información se decidió qué hacer con algunos casos concretos y con los no especificados, tomando decisiones de carácter puntual; por ejemplo para las áreas con hablantes de lengua indígena. A diferencia del censo de 1990 que, debido al shock del censo de 1980, documentó todo el ejercicio de validación, en 1995 no se documentó la validación en forma completa y exhaustiva. Aún hoy a pesar de la arqueología estadística que hemos realizado no podemos saber cuántos casos se validaron en campo, dónde fue necesario validar más datos, por qué, etc.

28 Comentario final Para el censo del 2000 se construyeron una serie de rutinas básicas de validación, dependiendo de lo que se iba encontrando se iba instrumentando una validación complementaria. Para este ejercicio se tienen documentados casi todos los criterios, no así las frecuencias de los errores, ni el número de casos reasignados de acuerdo con el código de asignación. Se conoce la decisión, pero no su monto. Otro aspecto que vale la pena comentar se centra en la evolución, el cambió de criterios y las diferentes decisiones que se toman para validar cada proyecto, es claro que los criterios y procedimientos de 1980 se abandonaron en 1990 y se cambiaron sustancialmente. Como ejemplo recuérdese la asignación directa del jefe a cualquier hombre de 12 años o más.

29 Comentario final En México cada proyecto estadístico en el área sociodemográfica hasta hace muy poco diseñaba sus criterios de validación, decidía acerca de las metodologías para operacionalizarlos, utilizaba las herramientas disponibles: a mano, con una tablita de asignación, por corrección directa, por medio de vectores, con secuencias fijas, etc. Las diferencias no se encuentran nada más entre censos, encuestas y registros, se encuentran entre un censo y otro, entre un conteo y un censo. Los equipos responsables de su diseño y del análisis cambian y los criterios no son iguales. Ante la carencia de documentación es complicada la reconstrucción, ya hablé de la arqueología estadística, ahí seguiremos trabajando. Sin embargo, con la idea de ir consolidando el esquema de soluciones de validación, nos comprometimos en 2005 a publicar los criterios de validación, uno a uno y las frecuencias de validación de cada variable.

30 Comentario final Con respecto a las imputaciones la posición del INEGI se está revisando. Creemos que es necesario tener una base de datos cruda, a imagen y sin alteraciones, tal cual se asienta la información en los instrumentos de recolección. La base validada debe quedar completamente documentada, para ello publicaremos los criterios de validación y el número de casos correctos y corregidos. Aquí nos gustaría saber quién publica sus criterios. Con la base lista para la explotación se hacen las imputaciones complementarias: hogares pobres, reasignación de ingresos con base en la encuesta de ingresos y gastos, índices de marginación, etc. Esta tarea la deben hacer las oficinas de estadística y los usuarios especializados.

31 Anexo con los criterios VALIDACIÓN DE VIVIENDA Y SUS CARACTERÍSTICAS

32 Clase de vivienda particular y pisos Clase de vivienda particular, se respondió con base en la observación del entrevistador. Para los locales no construidos para habitación, viviendas móviles y refugios, se indicó omitir las características de la vivienda. En pisos se preguntó por el material predominante. La omisión no estaba permitida, salvo en las clases de vivienda señaladas en el párrafo anterior.

33 Criterios de validación Los criterios de validación revisan la congruencia y corrigen las siguientes situaciones: Si la clase de vivienda es departamento en edificio o un cuarto en la azotea y tiene pisos de tierra, se asigna no especificado (9), en forma alterna a clase de vivienda particular y pisos. Si la vivienda es un local no construido para habitación, una vivienda móvil o un refugio, se blanquean las respuestas en las variables: pisos, número de cuartos, total de cuartos, bienes, disponibilidad de agua, excusado y drenaje. A los registros con blanco en clase de vivienda y en pisos se les asigna código 9 (no especificado).

34 Importante Durante la aplicación del PROCESO 2 (clase de vivienda particular y pisos) a los locales no construidos para habitación (5), viviendas móviles (6) y Refugios (7), se les blanquea la información de las características de la vivienda (imagen 7, procedimiento 5). De acuerdo con los criterios establecidos después del PROCESO 2 sólo se les da tratamiento a las viviendas que registran: CLASE DE VIVIENDA PARTICULAR = 1, 2, 3, 4 ó 9.

35 Electricidad: criterios de validación Al llegar a la etapa de validación automática sólo presentan registros con valores = 1, 2, blanco. En la validación no se revisa ningún tipo de congruencia con otras variables, ni se asignan datos. Cuando la respuesta está en blanco, se asigna código 9 (no especificado). Se captó la existencia de energía eléctrica independientemente de la fuente

36 Bienes: captación y registro Identifica la disponibilidad de cuatro bienes; la última opción sólo debió marcarse si no se disponía de ninguno de los cuatro bienes. A la validación automática la información puede llegar con uno, varios de los códigos marcados o en blanco.

37 Bienes: criterios de validación En la fase de validación automática se revisa la congruencia entre tener uno o varios bienes (códigos de 1…4) y no tener ningún bien (5). Cuando se presenta dicha inconsistencia, se privilegia el tener algún bien y por lo tanto se elimina el código 5. Cuando todos las respuestas están en blanco se asigna código 9 (no especificado) en la variable sin bienes.

38 Disponibilidad de agua: captación y registro Se captó la disponibilidad de agua entubada que proviene de la red pública, así como la forma en que se abastecen de agua cuando no se dispone del servicio público. A la fase de validación automática llegan los registros con valores entre {1…7} o en blanco. En la validación automática no se lleva a cabo ninguna revisión de congruencia con otras variables, ni se imputa información. Cuando la variable está en blanco, se asigna el código 9, que identifica el no especificado.

39 Número de cuartos: captación y registro En el manual del entrevistador se insistió para garantizar una contabilidad correcta del número de cuartos usados para dormir y del total de cuartos en la vivienda.

40 Número de cuartos: criterios de validación En la validación se establecieron tres criterios básicos: El número de dormitorios y el total de cuartos debe estar entre 1 y 25. El número de dormitorios debe ser menor o igual al total de cuartos. Asignar cuartos o dormitorios cuando alguna de las dos preguntas estuviera en blanco. Esta asignación se hizo con base en un análisis del comportamiento estadístico registrado en eventos censales anteriores.

41 Excusado o sanitario y drenaje: captación y registro Las preguntas de excusado captan la existencia del mismo y su tipo a partir de la posibilidad o no de admitir agua para eliminar los desechos. La pregunta de drenaje capta su disponibilidad y tipo de drenaje.

42 Excusado o sanitario y drenaje: criterios de validación Los criterios de validación revisan la consistencia entre las combinación excusado con admisión de agua y la disponibilidad de drenaje. En general se privilegia la información de drenaje. Si la vivienda tiene excusado (1) con admisión de agua (3 o 4), pero no tiene drenaje, se cambia la respuesta de admisión de agua por la de no se le puede echar agua (5). Cuando la vivienda tiene excusado (1) con admisión de agua (3 o 4) y no existe respuesta en drenaje, se asigna información en drenaje (1 a 4), con base en el dato que registra la vivienda inmediata anterior, siempre y cuando esta respuesta corresponda a tener drenaje. Cuando no existe información suficiente para asignar algún valor se asigna no especificado (9).

43 Actividades agropecuarias y forestales La pregunta identifica a las viviendas en donde alguno de sus ocupantes tiene o maneja terrenos en donde se realizan actividades agropecuarias o forestales. Antes de aplicar la validación sólo se registran valores = 1, 2 o blanco. En la validación automática no se revisa ningún tipo de congruencia con otras variables, ni se asignan datos a partir de la información contenida en otras preguntas. Cuando la respuesta está en blanco, se asigna código 9 (no especificado).

44 VALIDACIÓN DE HOGARES Y PARENTESCO

45 Hogares y parentesco Esta parte de la validación contempla un conjunto de variables que se considera están relacionadas y a las que se aplica tratamiento de manera secuencial, a partir de la composición de parentesco del hogar y la edad de los integrantes del hogar. La validación de hogares se divide en tres procesos: PARENTESCO, HOGARES I y HOGARES II. El orden de los procesos requiere que el parentesco y los hogares sean validados de forma secuencial, e incluye tratamientos para la vivienda, que se desprenden de la composición de parentesco del hogar. Los procesos de hogares se aplican antes de revisión de las características de la población

46 Preguntas consideradas en la validación

47 El propósito de este proceso es corregir los casos de multirrespuesta entre el parentesco y el otro parentesco, recuperar los casos con omisión o no especificado y hacer consistente el parentesco con la edad de las personas. Para este proceso de validación se consideraron las siguientes premisas: A.Identificación del número de personas en el hogar. Se contempla ya que existen hogares de una sola persona, lo cual facilita ampliamente la solución a los errores de la información en el parentesco. B.Límites de edad por parentesco. La edad mínima que pueden tener el jefe del hogar y el cónyuge es 12 años. A partir de este límite se han establecido algunos más para otros parentescos, que básicamente son intervalos intergeneracionales de 10 años en relación con la edad del jefe. Parentesco

48 C.Verificación de la primera persona del hogar. Según las instrucciones de llenado del cuestionario, la lista de personas debe iniciarse con el jefe del hogar, por ello cuando un registro presenta los códigos 101 (jefe) o 102 (persona sola), el proceso de validación revisa que sea la primera persona del hogar. D.En consecuencia se contemplan las siguientes situaciones.- Si hay una sola persona en el hogar y cualquier combinación de respuestas en parentesco y otro parentesco 1.Si hay dos o más personas en el hogar y el registro presenta: a.Omisión o no especificado, b.Multirrespuesta, o c.Respuesta en parentesco y omisión o no especificado en otro parentesco Parentesco

49 Para solucionar estos casos se utiliza la información de parentesco, edad, número de personas en el hogar, número de cuestionario del hogar y número de registro de la persona. Los criterios se resumen a continuación: 1.Si es un hogar de una persona, se asigna persona sola, no importa qué respuesta(s) tuviera. Estos casos, pasan directamente a HOGARES II. 2.Si en el hogar hay 2 o más personas a.Si parentesco y otro parentesco carecen de información válida, se asigna no especificado b.Si ambos presentan información válida, se realizan estos pasos: 1)Revisión de la edad, si no es congruente, se asigna el código )Si presenta los códigos 101 o 102 en otro parentesco, se verifica que sea la primera persona del hogar. De ser así, se asigna jefe del hogar (101). Parentesco: criterios aplicados

50 3)Si parentesco tiene el código 2 (cónyuge) y otro parentesco los códigos de cónyuge o de hijo, se da preferencia al otro parentesco sobre el parentesco. Si no tiene esos códigos se da preferencia a parentesco (cónyuge) y se asigna el código )Si parentesco tiene el código 3 (hijo) y otro parentesco los códigos de hijo, se da preferencia al otro parentesco sobre el parentesco. Si no tiene esos códigos se da preferencia a parentesco (hijo) y se asigna el código )Si parentesco tiene el código 4 (nieto), se da preferencia a parentesco sobre el otro parentesco y se asigna el código 609. Parentesco: criterios aplicados

51 El propósito de este proceso de validación es revisar y corregir el número de jefes y cónyuges al interior del hogar y de la vivienda, por ello se aplica sólo cuando hay más de una persona en el hogar. Sus premisas son las siguientes: A.En la vivienda particular no puede haber más de 5 jefes, personas solas o huéspedes. B.En cada hogar debe haber un único jefe y puede haber o no cónyuge, pero si la hay sólo puede haber una. C.Para estos dos parentescos se ha considerado como límite mínimo de edad 12 años. D.El criterio de la edad mínima se hace extensivo a otros parientes en el hogar, habiendo límites generales pero sobre todo teniendo como referencia la edad del jefe. Hogares I

52 Hogares: criterios aplicados Para solucionar estos casos se utiliza la información de parentesco y edad, así como el número de jefes, de personas solas, de huéspedes y de cónyuges. Los procedimientos se resumen a continuación: 1.El límite de hogares en la vivienda se hace extensivo al hogar, lo cual es concluyente para considerar particular o colectiva a la vivienda: ésta es colectiva si hay 6 ó más jefes, personas solas o huéspedes en un mismo hogar. 2.Cuando faltan el jefe o el cónyuge, o hay más de uno, se procede a asignar o mantener un jefe a partir de las personas en el hogar. 3.Se realiza una revisión de las diferencias de edad de los integrantes del hogar respecto de jefe y cónyuge. La validación genera reporte especial para los casos en que detecta edades incongruentes con la del jefe y del cónyuge respecto de los hijos y suegro(a) del jefe.

53 El propósito de esta rutina es revisar y corregir el número de hogares y de personas al interior de la vivienda, así como el número de cuestionarios por hogar. Es una rutina de verificación y sus premisas son las siguientes: A.El control de vivienda y cuestionarios se llena al término de la entrevista y debe indicar el número de hogares visitados, el de residentes habituales de la vivienda y el de cuestionarios utilizados. Sin embargo, se considera que su registro puede ser falible. B.Para tener certeza, se requiere contabilizar directamente el número de hogares en la vivienda, los cuestionarios por hogar y por vivienda, y las personas en la vivienda. C.En la vivienda particular no puede haber más de cinco jefes, personas solas o huéspedes. Hogares II

54 En consecuencia, se consideran los casos con un sólo hogar en la vivienda, con 2 a 5 y con 6 o más. Si hay incongruencia entre los resultados de la contabilización y los del cuestionario, estos últimos son sustituidos por los de aquella. Las viviendas con 6 o más hogares, pasan a viviendas colectivas y se les blanquea la información sobre características de la vivienda y parentesco. Hogares II

55 VALIDACIÓN PARA CARACTERÍSTICAS DE LA POBLACIÓN

56 Características de la población SEXO El sexo se considera como una característica básica y por lo tanto siempre se asigna un valor: hombre o mujer. Para el II Conteo se aplicaron los siguientes criterios: Para los hogares que registraron jefe y cónyuge: Si el jefe del hogar no registró sexo y tiene cónyuge con sexo especificado, se le asigna al jefe el sexo opuesto al cónyuge. Si el cónyuge del jefe no registró sexo y jefe del hogar tiene sexo especificado se le asigna al cónyuge el sexo opuesto al jefe. Los casos restantes, el sexo se asigna de manera alterna (mujer, hombre) a partir de cada unidad de proceso que es el lote.

57 EDAD La pregunta utilizada en el II Conteo hizo referencia a la edad en años cumplidos y los valores posibles de inician en 0 cuando la persona es menor de un año. Para evitar la inserción de valores fuera de rango el programa de captura solicitó al capturista una verificación de todos los valores que fueran mayores a 99 años. Esta decisión se fundamenta en que el número de personas que registran dichas edades es mínimo y por lo tanto se trató de impedir que el tercer dígito proviniera de una inserción errónea del capturista. En la etapa de validación se revisa y cuantifica el número de personas que hayan registrado más de 130 años y cuando eso sucede se codifica con código 999 que indica edad no especificada. Características de la población

58 DERECHOHABIENCIA La pregunta identifica a las personas que tienen derecho a los servicios médicos en instituciones de salud públicas o privadas. Características de la población Se formula para toda la población y admite varias opciones de respuesta por el hecho de que una persona puede tener derecho a recibir servicios médicos en varias instituciones. La pregunta admite respuestas precodificadas o la anotación de otras instituciones que proporcionan servicios de salud. Ello implicó disponer de un clasificador de respuestas y la codificación se realizó antes de la etapa de validación. Cabe señalar que la Clasificación de Instituciones de Salud 2005 contiene claves de cuatro dígitos para cada una de las instituciones de salud y/o seguridad social.

59 Por lo tanto, a la fase de validación sólo llegan valores numéricos. El procedimiento de validación aplicado revisa la consistencia entre las respuestas, limpia las respuestas no validas, duplicadas. A continuación se comentarán algunos ejemplos de los criterios aplicados: Eliminación de respuestas duplicadas Si se registró en otra institución una clave que hace referencia a una respuesta precodificada, se elimina la clave de otra institución. Por ejemplo IMSS (código 1) y en otra institución la clave indicaba una confirmación o duplicación (Clínica 8 del Seguro Social). Características de la población

60 Revisión de congruencia: Cuando se presentan respuestas contradictorias, i.g. ser derechoha-biente en alguna institución (código 1…5) y también que no tiene derecho en ninguna institución (código 6), se privilegia la situación de derechohabiencia eliminando el código de no derechohabiente. Se consideraron como clave válida en otra institución todas aquellas claves que corresponden a los servicios que proporcionan instituciones de salud estatal o especial: (Instituciones de seguridad social de los gobiernos estatales) (Otras instituciones de seguridad social) 2111 (Servicios médicos subrogados) 9111 (No especificado de institución de derechohabiencia Entonces, al salir de la fase de validación en la variable otra institución sólo permanecen las claves anteriormente señaladas. Cuando todas las respuestas estaban en blanco se asignó código de no especificado (9). Características de la población

61 LUGAR DE RESIDENCIA 5 AÑOS ANTES La pregunta para captar la migración se formula a las personas que tienen 5 años o más de edad y (edad no especificada), se diseñó de la siguiente manera: Características de la población La pregunta sitúa temporalmente el acontecimiento, refiriéndolo a una fecha específica octubre del año 2000, para determinar si la persona residía en la misma entidad federativa o en otra dentro del límite territorial nacional, o si vivía en los Estados Unidos de América o en cualquier otro país.

62 Características de la población Las posibles respuestas combinan opciones precodificadas con una descripción en donde se debería anotar el nombre de una entidad federativa diferente a la del lugar de residencia (actual) de la persona. Esto significa que se capturaron dos variables, una para alguno de los valores precodificados y otra para anotar una descripción. Esta última fue sometida a codificación antes de la validación, utilizando un clasificador previamente definido, que consideró los nombres de las entidades federativas, países, y dos claves especiales (entidad insuficientemente especificada y para la palabra México). Control de códigos fuera de rango y respuesta múltiple En la fase de captura se controló que la variable precodificada sólo aceptara algún valor igual 1, 2, 3 o blanco. Cuando el cuestionario presentó respuesta múltiple, se capturó el código mayor, es decir se le dio preferencia a la inmigración internacional.

63 Características de la población Revisión de congruencia Se revisan las respuestas registradas en las dos variables y se resuelve la multirrespuesta ya sea confirmatoria o contradictoria; así mismo, se asignan códigos definitivos a respuestas insuficientemente especificadas en la codificación. Se aplicaron los siguientes criterios: Combinaciones con respuestas Aquí en este estado y En otro estado, se prioriza la migración, es decir prevalece el código de otro estado siempre y cuando dicho código sea diferente a la entidad de residencia. Combinaciones con En otro estado (001 a 032) y una respuesta correspondiente a Estados Unidos de América u otro país, se prioriza la inmigración internacional. En las combinaciones entre EUA y otro país, prevalece este último.

64 Para la respuesta insuficientemente especificada México o Ciudad de México, se lleva a cabo una imputación directa de acuerdo al comportamiento del fenómeno migratorio en cuanto a su origen y destino, considerando los resultados en censos anteriores. (Cifras del año 2000 muestran que 65% de los inmigrantes recientes en el Distrito Federal en 1995 residían en el estado de México, y que 57% de los emigrantes recientes del Distrito Federal tuvieron como destino el estado de México. Si la entidad de la entrevista es el Distrito Federal, se considera que es un inmigrante del estado de México. Si la entidad de la entrevista es el estado de México, se considera que es un inmigrante del Distrito Federal. Cuando la entidad de la entrevista no corresponde al Distrito Federal ni al estado de México, se asigna Estado de México. Características de la población

65 Estas soluciones, introducen un matiz específico en el proceso de validación, ya que atienden al comportamiento del fenómeno migratorio. Por ejemplo, la importancia que mantiene el estado de México como lugar de atracción de migrantes, el volumen de inmigrantes recientes es casi del doble de la registrada en el Distrito Federal, además de que éste último presenta en el año 2000 un saldo migratorio neto negativo. En comparación con el Censo 2000, se aplicó una asignación proporcional, con base en el comportamiento de los inmigrantes reciente. Características de la población

66 ASISTENCIA ESCOLAR La captación se hizo para toda la población de 5 años y más. Control de códigos fuera de rango y respuesta múltiple Para evitar valores fuera de rango el programa de captura sólo permite valores de 1, 2 o blanco. La respuesta múltiple, se asume en la captura como si la pregunta apareciera en blanco. Características de la población Congruencia No se realiza ningún tipo de congruencia con otras variables, ni se imputan datos a partir de la información contenida en otras preguntas para las personas con edad de 5 a 89 años, ni con edad no especificada. Para las personas entre 90 y 130 años con omisión en asistencia o que registren sí asistir a la escuela, se asigna no asiste porque se consideran respuestas inverosímiles. Los casos en blanco ese convierten a código numérico (9) que indica no especificado.

67 NIVEL DE INSTRUCCIÓN O ESCOLARIDAD La pregunta de nivel de instrucción capta el último grado aprobado en el nivel de estudios más avanzado; mientras que con el antecedente escolar se trata de garantizar el nivel educativo para ciertos estudios. Características de la población

68 La experiencia en diferentes proyectos de generación señala que se trata de preguntas complejas tanto para el entrevistador como para el informante. A ello deben agregarse los cambios experimentados en el Sistema Educativo Nacional, la diversidad de modalidades educativas y la confluencia de generaciones con distintas historias escolares. Control de códigos fuera de rango y respuesta múltiple En la etapa de captura, para la parte correspondiente a grados aprobados y nivel académico, se aceptaron valores de 0 a 9 y blanco. Cuando se presentó en el cuestionario una respuesta múltiple se capturó la que estaba registrada en el nivel educativo más avanzado (código mayor). Para la pregunta sobre antecedente escolar los códigos posibles capturados fueron del 1 a 5 y blanco. Al igual que en la pregunta anterior, se adoptó el código mayor en caso de multirrespuesta. Características de la población

69 Revisión de congruencia Para verificar la congruencia de la información, la variable edad adquiere singular importancia, así como el antecedente escolar, para ciertos niveles educativos, por lo que la validación se realiza en dos procesos. Primero se revisan los grados y niveles de acuerdo a la edad, y después se relaciona con la información del antecedente escolar, con el fin de asegurar y ubicar adecuadamente a la población en el nivel que le corresponde: normal, carrera técnica o comercial, profesional, maestría o doctorado. Con el propósito de facilitar la comprensión de los tratamientos de consistencia aplicados se presentan unas tablas que indican los grados aprobados y el nivel educativo de acuerdo a la edad de las personas. Características de la población

70 Para las personas de 5 a 11 años, el máximo grado aprobado permitido es el siguiente: Esto significa por ejemplo que una persona de 7 años no puede tener más de 2 años aprobados en primaria y cuando eso sucede los grados se bajan al grado posible. Es preciso señalar que de acuerdo a la normatividad educativa y estricto sentido, un niño puede ingresar a primaria hasta que haya cumplido 6 años de edad, no obstante como existen casos (raros pero posibles) se decidió permitir un margen de un año (el criterio utilizado fue aprobado por la Secretaría de Educación pública). Características de la población

71 Para la población de 12 a 18 años que registra tener algún grado aprobado en secundaria o preparatoria (bachillerato) los grados y niveles máximos permitidos son los siguientes: Características de la población

72 Cuando el nivel educativo es normal, carrera técnica o comercial, profesional, maestría o doctorado, se revisa la congruencia entre edad, grados y antecedente escolar:

73 Características de la población Para las personas que tienen entre 18 y 22 años el grado y nivel máximo posible es:

74 Características de la población Para las personas con edad entre 23 y 28 años y presentan como último nivel educativo estudios de normas, profesional, maestría o doctorado, los valores válidos son los siguientes: Para la población que rebasa las edades establecidas sólo se efectúa una revisión de congruencia con el antecedente escolar cuando es procedente.

75 ALFABETISMO Para establecer la condición de saber leer y escribir se formula la siguiente pregunta a la población de 5 años y más: Control de códigos fuera de rango y respuesta múltiple Con el propósito de evitar la inserción de valores fuera de rango el programa de captura sólo permite valores igual a 1, 2 o blanco. La respuesta múltiple, como en otros casos se asume en la captura como si la pregunta apareciera en blanco. Características de la población.

76 Revisión de congruencia Se lleva a cabo una verificación de congruencia con la información de nivel de instrucción. Los cambios se realizan específicamente cuando alfabetismo está en blanco y para las personas que registraron no saber leer y escribir, como se describe a continuación: Si el nivel de instrucción de la persona es 4 grados o más años aprobados en educación primaria, se asigna que la persona sí sabe leer y escribir. Si en nivel de instrucción de la persona es menor a 4 años en primaria, a los casos en blanco se asigna no especificado (código 9). Asimismo, los casos que registran no saber leer y escribir, permanecen sin cambios. Posteriormente esta información se utiliza para validar la tercera pregunta (condición de habla española) en lengua indígena, tal y como se hará explícito más adelante Características de la población

77 LENGUA INDÍGENA La pregunta de lengua indígena se aplica para la población de 5 años y más y está integrada por tres partes. Con la primera se identifica a la población que habla lengua indígena; la respuesta en la segunda pregunta está condicionada a una respuesta afirmativa en la primera y debe anotarse una descripción. La tercera pregunta está condicionada a la respuesta afirmativa en la primera pregunta. Características de la población.

78 Control de códigos fuera de rango y respuesta múltiple Para la primera pregunta el programa de captura sólo permite valores igual a 1, 2 o blanco. En la tercera pregunta los códigos posibles de capturar fueron 3, 4 o blanco. Tanto en la primera como en la tercera pregunta por tener dos opciones de respuesta (dicotómica) la respuesta múltiple se consideró en la captura como si estuviera en blanco. Cabe señalar que el número de casos de multirespuesta es muy poco frecuente. Para la segunda pregunta se captura la descripción, la cual se somete a codificación semiautomática, utilizando un clasificador de lenguas indígenas. Características de la población

79 El catálogo de lenguas se divide en cinco partes: la primera es un lista de 94 lenguas indígenas de México (0111 al 1211); la segunda agrupa las lenguas indígenas que se hablaban en México pero que actualmente son consideradas extintas por los especialistas en el tema (5001 al 5136); la tercera corresponde a las lenguas indígenas que se hablan en América (5501 a 5602); la cuarta señala las lenguas no indígenas habladas en el mundo (7000). La quinta parte contiene claves especiales que se utilizan en la etapa de validación (1311, 6000, 8000 y 9999) Revisión de congruencia En la etapa de validación se lleva a cabo una revisión de congruencia entre los valores que registran las tres preguntas, en donde el código de la lengua indígena constituye el criterio básico para considerar a una persona como hablante y el segundo criterio es la condición de habla lengua indígena (primera pregunta). Características de la población

80 Si la condición de habla indígena está en blanco o registró que no habla y tiene una lengua indígena válida se asigna que si habla. Se consideran como lenguas indígenas válidas las 94 lenguas indígenas de México; las lenguas indígenas que se hablaban en México pero que actualmente son consideradas extintas por los especialistas y las lenguas indígenas que se hablan en América y los casos con código 6000 (que indica que no se pudo especificar el dialecto o la lengua indígena). Si el código de la lengua corresponde a una lengua no indígena (código 7000) o a una respuesta que indica que la persona no habla lengua indígena (código 8000), se asigna como no hablante, independientemente de lo que haya respondido en la condición de habla indígena. Los criterios de validación consideran la asignación de lenguas indígenas a partir de la lengua que habla el jefe o cónyuge, siempre y cuando se haya respondido que la persona si habla y no haya especificado la lengua. Si ninguno de los dos (jefe y cónyuge) especificaron qué lengua hablan, se asigna 9999, código definitivo que indica lengua indígena no especificada. Características de la población

81 Si la condición de habla indígena está en blanco o registró que no habla y tiene una lengua indígena válida se asigna que si habla. Se consideran como lenguas indígenas válidas las 94 lenguas indígenas de México; las lenguas indígenas que se hablaban en México pero que actualmente son consideradas extintas por los especialistas y las lenguas indígenas que se hablan en América y los casos con código 6000 (que indica que no se pudo especificar el dialecto o la lengua indígena). Si el código de la lengua corresponde a una lengua no indígena (código 7000) o a una respuesta que indica que la persona no habla lengua indígena (código 8000), se asigna como no hablante, independientemente de lo que haya respondido en la condición de habla indígena. Características de la población

82 Los criterios de validación consideran la asignación de lenguas indígenas a partir de la lengua que habla el jefe o cónyuge, siempre y cuando se haya respondido que la persona si habla y no haya especificado la lengua. Si ninguno de los dos (jefe y cónyuge) especificaron qué lengua hablan, se asigna 9999, código definitivo que indica lengua indígena no especificada. Este criterio se sustenta en el hecho de que algunos entrevistadores sólo anotan la información completa para la primera y segunda persona, cuando una de las características es común a todos los miembros, y omiten el registro de los otros los miembros del hogar. Además, algunos especialistas en el tema señalan que muchas de las características culturales se trasmiten en el hogar, entre ellas la lengua e indican que la probabilidad de que una persona hable la misma lengua del jefe del hogar o cónyuge es la más alta, que la que existe en a otros ámbitos (localidad, municipio, etc.). Características de la población

83 Si la descripción no es una lengua indígena pero indica claramente que la persona habla lengua indígena (por ejemplo, idioma indígena, dialecto, etc.), se asigna como hablante, independientemente de la respuesta en la condición de habla y de ser posible se asigna la lengua del jefe del hogar o de su cónyuge, en ese orden. Si la descripción es ambigua, de tal manera que no permite diferenciar si no habla lengua indígena o si no se conoce qué lengua habla (9999) o está en blanco (no se registró ninguna descripción), se aplica el siguiente tratamiento: Si la condición de habla indígena está en blanco se asigna no especificado a la condición de habla (9) y blanco a la lengua y a la condición de habla española. Si la condición de habla indígena señala que no es hablante, se asignan blancos a la lengua y a la condición de habla española. Características de la población

84 Dado que los especialistas en la temática indígena señalan que la lengua maya se habla tradicionalmente en la península de Yucatán y la lengua mayo en los estados de Sonora y Sinaloa, cuando aparece la lengua maya en Sonora o Sinaloa se asigna la lengua mayo (1022). Cuando las descripciones sean amuzgo, chontal o tepehuano, se revisa en la entidad del levantamiento para asignar amuzgo de Oaxaca (0483), amuzgo de Guerrero (0484), chontal de Oaxaca (0131), chontal de Tabasco (0932), tepehuano de Chihuahua (1014) o tepehuano de Durango (1015), según sea el caso. Características de la población

85 Para validar la tercera pregunta se toma en consideración la respuesta anotada en condición de alfabetismo, de tal forma que si una persona señaló no hablar español, o no especificó dicha condición, pero es alfabeto, se asigna que si habla español. Lo anterior debido a que no existen evidencias empíricas de personas que sólo hablan lengua indígena que sepan leer y escribir en su lengua. El Sistema Educativo Nacional y los programas de alfabetización en México están encaminados a enseñar a leer y escribir en español, fundamentalmente, y en algunos casos también en la lengua indígena. Este criterio está sustentado en las consultas realizadas a personal del sistema educativo bilingüe, a investigadores sociales y a lingüistas que realizan trabajo de campo en zonas indígenas. Características de la población

86 NÚMERO DE HIJOS NACIDOS VIVOS Y SOBREVIVIENTES Las preguntas se aplican para todas las mujeres de 12 años y más y se indica que debe anotarse un número. Si en la primera pregunta registra si haber tenido hijos, se aplica la segunda, en caso contrario, si no ha tenido hijos, la segunda pregunta debe quedar en blanco. Control de códigos fuera de rango En la captura, en ambas preguntas se admitieron valores de 0…99 y blanco, lo que significa que se dejó para la etapa de validación el ajuste en el límite del número de hijos. Revisión de congruencia En la etapa de validación se consideraron como variables básicas y determinantes el sexo y la edad de la persona: Características de la población

87 Para los registros con sexo masculino se eliminaron las respuestas en ambas preguntas. Este mismo tratamiento se aplicó a las mujeres cuya edad es menor de 12 años. La máxima paridez que puede tener una mujer se determino con base en la edad registrada. La regla aplicada fue: el máximo número de hijos es igual a la edad de la mujer menos 10. Esto puede ejemplificarse de la siguiente manera: una mujer de 25 años podría registrar como máximo 15 hijos; una mujer de 18 años, 8, una mujer de 12 a lo sumo podría registrar 2. El límite mayor aceptado fueron 25 hijos por mujer. Se revisó que el número de hijos sobrevivientes siempre fuera igual o menor al número de hijos nacidos vivos Características de la población

88 Si el número de hijos nacidos vivos presentaba información congruente con la edad y el número de sobrevivientes no cumplía con el límite de edad o era mayor al número de hijos nacidos vivos, el número de hijos sobrevivientes se asignó no especificado (99). Si el número de hijos nacidos vivos superaba los 25 hijos, estaba en blanco o el número registrado era incongruente con la edad de la mujer, pero el número de hijos sobrevivientes presentaba información congruente con la edad, se asignó a hijos nacidos vivos el mismo valor de hijos sobrevivientes. Si el número de hijos nacidos vivos superaba los 25 hijos o estaba en blanco y el número de hijos sobrevivientes era incongruente con la edad de la mujer, se asignó no especificado en hijos nacidos vivos y blanco en sobrevivientes. Características de la población

89 Si el número de hijos nacidos vivos y el número de hijos sobrevivientes superaban el límite permitido, se asignó no especificado al número de hijos y blanco a sobrevivientes. Si el número de hijos nacidos vivos era igual a cero y el número de hijos sobrevivientes era mayor a cero (0) y cumplía con el límite de edad, se le dio prioridad a hijos nacidos vivos, por lo que hijos sobrevivientes se blanqueó. Si el número de hijos nacidos vivos presentó información congruente con la edad y los hijos sobrevivientes presentaron blanco o rebasaron el límite de los 25 hijos, a hijos sobrevivientes se asignó no especificado (99). Para las mujeres con edad no especificada sólo se revisó que el número de hijos sobrevivientes no fuera mayor al número de hijos nacidos vivos. Características de la población


Descargar ppt "II CONTEO DE POBLACIÓN Y VIVIENDA 2005 REVISIÓN DE CONSISTENCIA DE LA INFORMACIÓN Eunice Bañuelos y Marcela Eternod Buenos Aires, Argentina Junio de 2006."

Presentaciones similares


Anuncios Google