Escaneo de los datos.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

Monitoreo y detección temprana. Parte I Bases epidemiológicas para el control de la enfermedad – Otoño 2001 Joel L. Weissfeld, M.D. M.P.H.
Tema. 5. Variabilidad. Concepto
Tema. 6. Medidas de forma y valores atípicos. Asimetría y curtosis
ANALISIS DE DATOS CUANTITATIVOS
Lic. Cristian R. Arroyo López
Análisis previos de los datos
Introducción En toda investigación, y antes de extraer conclusiones acerca de los objetivos e hipótesis planteados, es necesario llevar a cabo un análisis.
ANÁLISIS EXPLORATORIO DE DATOS
ANÁLISIS PREELIMINAR DE LOS DATOS
Medidas de tendencia central y de variabilidad
Prueba de Hipótesis La Prueba t Carlos B. Ruiz-Matuk.
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Bioestadística Aplicada I
CURSO DE ESTADÍSTICA BÁSICA
Estadística descriptiva
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
ANÁLISIS EXPLORATORIO DE DATOS
Estadística Descriptiva
Clases 4 Pruebas de Hipótesis
FUNCIONES LOGICAS SI(PL;V_V;V_F)
Mt. Martín Moreyra Navarrete.
Análisis de Datos.
ESTADÍSTICA BÁSICA EN ECOLOGÍA EVOLUTIVA Juan J. Soler Cruz Estación Experimental de Zonas Áridas Almería.
DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.
ESTADÍSTICAS DESCRIPTIVA
Coeficiente de Variación
Métodos de calibración: regresión y correlación
ANÁLISIS EXPLORATORIO DE DATOS
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Análisis Cuantitativo de Datos (Básico)
SEMINARIO DE INVESTIGACIÓN IV Y TRABAJO DE GRADO
Clase 4a Significancia Estadística y Prueba Z
Estimación por intervalo en la regresión: Bandas de Confianza
Tratamiento de datos y azar
Herramientas básicas.
COLEGIO THOMAS JEFFERSON INGENIERO JOSE LUIS ZAMORA FERNANDEZ.
Analisis exploratorio INGRID TATIANA RODRIGUEZ GUZMAN DIANA COSTANZA BERMUDEZ GORDILLO.
¿QUÉ ES LA ESTADÍSTICA? La estadística es una disciplina que diseña los procedimientos para la obtención de los datos, como asimismo proporciona las herramientas.
Diseño de EXPERIMENTOS
UNIDAD 1.- EVALUACIÓN DE DATOS ANALITICOS
La Distribución Normal.
coeficientes de correlación de
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
Herramientas avanzadas. Lo primero: abrir el modelo.
Métodos Cuantitativos
SESION 5: MEDIDAS DE FORMA. Hasta el momento nos hemos enfocado en el análisis de datos a partir de los valores centrales y la variabilidad de las observaciones.
Estimación y contraste de hipótesis
ESTADÍSTICA Seminario V 15/04/2015. PUNTO 1  Abrimos el fichero y vamos a la vista variable.  cambiamos las escalas de los datos que nos dan.
Análisis de los Datos Cuantitativos
CLASIFICACIÓN SUPERVISADA
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Diferencias individuales y correlaciones
INTRODUCCIÓN A SPSS Statistic Package for Social Sciencies.
NORMA INTERNACIONAL DE AUDITORÍA 530
Características de las distribuciones estadísticas
20. Comparación de promedios entre grupos Módulo IV: Análisis de datos numéricos Análisis de Datos Aplicado a la Investigación Científica
Supuestos en el análisis de regresión
Supuestos en el análisis de regresión Miles, J. & Shervin, M. (2011). Applyng regression & correlation. A guide for students and researchers. London: Sage.
InfoStat. Software estadístico
Coeficiente de variación
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
UNIVERSIDAD DE COSTA RICA Sistema de Estudios de Posgrado Escuela de Salud Pública I Ciclo lectivo 2003 Epidemiología – (SP – 2216) Profesora: Carmen.
Estadística descriptiva
CAPACITACIÓN, INVESTIGACIÓN, ESTADÍSTICA Y MERCADEO
Estadística y probabilidad aplicada a los negocios
Ing. Leticia de la Torre González ESTADISTICA DESCRIPTIVA.
RECHAZO DE DATOS DE UNA SERIE
Curso bimodal de capacitación para docentes de III Ciclo y Educación Diversificada.
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
Transcripción de la presentación:

Escaneo de los datos

Respuestas no comprometidas Datos faltantes Métodos de imputación Respuestas no comprometidas Detección Outliers Normalidad: sesgo y kurtosis

Datos faltantes

Datos faltantes: Problemas lógicos Los datos faltantes sistemáticos pueden indicar un sesgo sistemático (formulación deficiente de los reactivos, sensitividad, etc.) Si es menos probable que las mujeres reporten su género, en comparación con los hombres, tendremos datos sesgados en cuanto al género. Ej., sólo 50% de las mujeres reportan su género y 95% de los hombres lo hacen. ¿Qué pasa si debemos usar el género como moderador (o en algún otro rol crítico)?

El manejo de los datos faltantes No hay mucho problema si se tienen <10% de datos faltantes de una variable (Preferible: 5%). Método para manejar los datos faltantes: >10% - no usar esa variable <10% - imputar, si no es categórica Precaución: Si eliminamos a demasiados participantes (o imputamos demasiado) , introduciremos sesgos de respuesta.

Métodos de imputación Opción 1: Usar sólo datos válidos No utilizar imputación, sólo usar casos o variables válidos. En SPSS: Exclude Pairwise: excluye datos faltantes por variable Listwise: excluye datos faltantes por caso.

Métodos de imputación Opción 2. Usar como reemplazo valores conocidos. Asociar los valores faltantes con valores de casos similares.

Métodos de imputación Opción 3. Usar valores de reemplazo calculados. Usar la media, mediana o modo de la variable. Regresión basada en relaciones conocidas. Se puede hacer para varias variables a la vez. Usar la media sólo cuando la distribución es normal. Mejor: la mediana, es más segura.

Imputación de datos faltantes con SPSS Para reemplazar los valores faltantes: Transformar Reemplazar valores faltantes Pasar la(s) variable(s) de interés a la ventana de New variable(s) (aquella en la que hay datos faltantes). Change si se ha decidido reemplazar la anterior. En la parte derecha indicar el método: Median of nearby points Puntos cercanos: todos OK StatWiki: statwiki.kolobkreations.com/wiki/Main_Page  Guidelines SPSS: Options. General: Display names / Displays labels

Mejor método: La prevención! Escalas más cortas (Psicológicamente, es mejor aplicar instrumentos no muy largos). Pilotear!!! Reactivos fáciles de entender y contestar. Pilotear!!! Asegurarse de que todos los reactivos sean contestados. Usar encuestas digitales (más que en papel) Poner las variables demográficas al principio del instrumento. Colocar los reactivos sensibles al final del instrumento.

Respuestas no comprometidas

Respuestas no comprometidas Síntomas Desviaciones estándar <0.500 o similares Patrones de respuestas: 1,2,3,4,1,2,3,4… o 1,1,1,1,2,2,2,2… Reactivos inversos contestados igual que los no inversos Detección Desviaciones estándar por caso para detectar mínima variabilidad Inspección visual Prevención Trampas de atención en el instrumento: “Si estás poniendo atención, por favor contesta ‘totalmente de acuerdo’”

Detección de respuestas no comprometidas https://www.youtube.com/user/Gaskination Detección de respuestas no comprometidas Llevar la base de datos de las escalas, con número de folio, a una base de Excel. Pedir desviación estándar (stdev) de todas las puntuaciones por caso. Colocarlas en la última columna.

Detección de respuestas no comprometidas Para identificar desviaciones estándar muy bajas (casos con mínima variabilidad): Conditional formating Highlight cells rules Less than: Anotar la cantidad (ej., 0.5). Los casos con desv. est. <.05 se marcan con un color. Analizar el caso. Considerar eliminarlo.

Outliers: Valores extremos

Outliers y su influencia Los outliers pueden modificar los resultados ya que alejan a la media de la mediana. Pueden afectar los supuestos de la distribución y con frecuencia reflejan respuestas falsas o erróneas. Tipos de outliers: Outliers para variables únicas (univariados): Valores extremos para una sola variable. Outliers para el modelo (multivariados): Valores extremos (no comunes) para una correlación.

Manejo de los outliers univariados Debe examinarse caso por caso. Si el outlier es verdaderamente anormal y no es representativo de la población en estudio, entonces hay que eliminarlo. Pero esto requiere un examen cuidadoso de los puntajes. Ej.: se está estudiando a perros, y se “coló” un gato. Ej.: alguien contestó “3” en todos los 75 reactivos de la escala. Sin embargo, no sólo porque un puntaje no encaje cómodamente en la distribución no implica que habrá que eliminarlo.

Detección de Outliers Analizar Descriptivos Explorar Estadísticos: Boxplots •Factor levels together/ Histogram /Normality plots with test Gráficos Pasar las variables de interés a la ventana Dependent List Reporta Sesgo y Kurtosis y sus errores estándar Gráficas: Histograma, Normal Q-Q, cajas y bigotes

https://www.youtube.com/user/Gaskination Detección de Outliers Revisar cada outlier en la base de datos y analizar la situación.

Normalidad

Prueba de sesgo y kurtosis Regla estándar: Sesgo > 1 = positivo (derecho) Sesgo < -1 = negativo (izquierdo) Sesgo entre -1 y 1 está bien. Regla estricta: Sesgo > 3*Error estándar = Sesgado (Hair) Igual para la kurtosis Propósitos prácticos… Los problemas surgen más allá de (+/-) 2.2 (Sposito et al., 1983)

Detección de normalidad Distribución bimodal: En ocasiones se espera una distribución bimodal. Ej.: cuando hombres y mujeres difieren; se trata, en realidad, dos grupos.