La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

DELGADO DIAZ MINERVA PEREZ MUÑOZ ROMUALDA

Presentaciones similares


Presentación del tema: "DELGADO DIAZ MINERVA PEREZ MUÑOZ ROMUALDA"— Transcripción de la presentación:

1 DELGADO DIAZ MINERVA PEREZ MUÑOZ ROMUALDA
IMPUTACIÓN DE DATOS DELGADO DIAZ MINERVA PEREZ MUÑOZ ROMUALDA

2 OMISIÓN DE ELEMENTOS: Un entrevistador olvida preguntar algo.
El entrevistado se rehúsa a contestar alguna pregunta. El encuestado no puede proporcionar la información. Error de captura.

3 IMPUTACIÓN La imputación se utiliza para asignar valores a los elementos faltantes. La imputación disminuye el sesgo y produce un conjunto de datos completos (“rectangular”). Crear una nueva variable en el conjunto de datos.

4 TIPOS DE IMPUTACIÓN: Imputación deductiva.
Imputación de la media por celda. Imputación hot-deck. Imputación por regresión. Imputación cold-deck. Sustitución. Imputación múltiple.

5 Imputación deductiva Algunos valores se pueden asignar mediante relaciones lógicas entre variables. Por ejemplo: “Si una mujer tiene 2 hijos en cierto año y 2 hijos dos años después pero falta el valor del año intermedio el valor lógico para asignar es 2” “Si falta el género del encuestado y la persona tiene nombre femenino y está casada con un varón, se puede deducir que es de sexo femenino.

6 Imputación de la media por celda
Las personas que responden se dividen en clases con base en variables conocidas y se sustituyen los valores faltantes por la media de la clase: Esté método supone que los datos faltantes son completamente al azar.

7 Imputar con la media puede generar sesgos.
Aunque, preserva la media, pero distorsiona otros elementos de la distribución.

8 Imputación HOT-DECK Secuencial. Aleatoria. Vecino más cercano.
La muestra se divide en clases. La respuesta de alguno de los elementos de la clase se sustituye en cada respuesta faltante. Secuencial. Aleatoria. Vecino más cercano.

9 Imputación hot-deck secuencial
Se asigna el valor del mismo subgrupo leído por último vez. Nació como consecuencia de las computadoras de tarjetas perforadas (imputación se podía hacer con un único paso).

10 Imputación hot-deck aleatoria.
Se elige un donante al azar que contenga todos elementos faltantes. Para preservar las relaciones multivariadas, se emplean valores del mismo donante en todos los elementos faltantes de una persona.

11 Imputación hot-deck del vecino más cercano.
Se define una medida de distancia entre las observaciones. Se asigna el valor de la persona que respondió y está más cerca del individuo con el elemento faltante. La función, obviamente define la cercanía: Mikonwski, Gower, Jackard, etc.

12 Imputación por Regresión
Predice el valor faltante usando una regresión del elemento de interés sobre las variables observadas para todos los casos. En el caso no se tengan suficientes datos, se puede aplicar regresión logística.

13 La imputación por regresión produce valores más cercanos al verdadero.
La construcción de un buen modelo de regresión es costosa y lleva mucho tiempo. No se puede aplicar a todas las preguntas con datos faltantes.

14 Imputación Cold-Check
Los valores se asignan a partir de encuestas anteriores o datos históricos. No se garantiza la eliminación del sesgo.

15 SUSTITUCIÓN: En ocasiones, se permite a los entrevistadores elegir un sustituto cuando está en el campo. El problema es que la muestra ya no tendrá probabilidades conocidas de selección. Es necesario informar en los resultados si se emplea sustitución.

16 IMPUTACIÓN MÚLTIPLE: Cada valor faltante se asigna m veces distintas. Se crea m conjuntos de datos distintos, sin valores faltantes. Cada uno de los m conjuntos se analiza como si no hubiera imputación.

17 Es un proceso de simulación para la generación de datos faltantes.
Simula m>1 conjuntos de datos faltantes y los combina de manera conveniente para generar estimaciones insesgadas.

18 Ventajas y desventajas de la imputación
El futuro análisis no distingue entre las imputaciones y datos reales. Los valores imputados pueden ser buenas estimaciones, pero no son datos reales. Conjuntos rectangulares. Resultados consistentes. Se reduce el sesgo por ausencia de respuesta

19 BIBLIOGRAFIA Lohr Sharon L. Muestreo (diseño y análisis). Ed. Thomson
Fernando Medina H. Los métodos de imputación de datos en las encuestas de hogares: teoría y práctica. CEPAL. Pérez Salvador Blanca Rosa, De los Cobos Silva Sergio. El proceso de depuración de datos, provenientes de una encuesta. R. Platek. Métodos de Imputación.


Descargar ppt "DELGADO DIAZ MINERVA PEREZ MUÑOZ ROMUALDA"

Presentaciones similares


Anuncios Google