Calidad de datos: detección y corrección

Slides:



Advertisements
Presentaciones similares
PRECISIÓN Y EXÁCTITUD Isabel Ortega Maqueda
Advertisements

INTRODUCCIÓN A LA VERIFICACION Y VALIDACION
BizAgi - Business Agility
REQUISITOS GENERALES PARA LA COMPETENCIA DE LOS LABORATORIOS DE ENSAYO Y DE CALIBRACION NTG ISO/IEC 17025:2005 CURSO AUDITORES INTERNOS RELABSA UVG MAYO.
Taller de Bibmaster Nodo Nacional de Información en Biodiversidad – GBIF.ES Real Jardín Botánico - CSIC Aula de informática GBIF.ES-RJB Madrid, 12 y 13.
Principios sobre la calidad de datos
Exportación de datos a GBIF: - Servicio de alojamiento de datos de la Unidad de Coordinación - El modelo Darwin Core y su evolución - Exportar datos desde.
... © GBIF.ES Unidad de Coordinación, 2007 CALIDAD EN TODO EL PROCESO Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES
Taller básico de Bibmaster Real Jardín Botánico - CSIC Aula de informática GBIF.ES-RJB Madrid, 14 y 15 de marzo de 2005.
Calidad de datos: descriptores I Taller sobre calidad en bases de datos sobre biodiversidad septiembre Madrid. Francisco Pando Unidad de Coordinación.
Calidad de datos: nombres de personas I Taller sobre calidad en bases de datos sobre biodiversidad septiembre Madrid. Francisco Pando Unidad.
Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES
Taller de HERBAR para usuarios avanzados
Primera Asamblea de Participantes de GBIF en España Infraestructura Mundial de Información sobre Biodiversidad Global Biodiversity Information Facility.
Evaluaciones de Sistemas de Administración de la Seguridad SMSA
© 2010 Michigan State University and DQS-UL MSS, original at CC-BY-SA Acción Correctiva FSKN 12.
Sistema Información Geográfica
DOCUMENTOS DE ARCHIVO EN LA ADMINISTRACIÓN ELECTRÓNICA: necesidad de un modelo de gestión integrada
CONTROL DE DOCUMENTOS Y REGISTROS EN LOS CENTROS DE CONCILIACIÓN Y/O ARBITRAJE NTC-5906.
PRODUCTO NO CONFORME.
Medición, Análisis y Mejora
Enrique Cardenas Parga
Base de Datos Relacional.
© Manuel ColladoHerramientas software-1 Herramientas software Clasificación. Integración de herramientas.
Evaluación de Productos
VERBO + OBJETO + CONDICIÓN
XXI ASAMBLEA NACIONAL DE GRADUADOS EN CIENCIAS ECONÓMICAS Dra. Gabriela Di Stefano Lic.Norberto Caniggia Necesidad de la existencia de procedimientos.
Muestra: Recolección de Datos: Análisis de Datos:
Introducción a los Conceptos de Bases de Datos Docente: Ing. Marleny Soria Medina.
MUESTRA Implica DEFINIR la unidad de análisis (personas, situaciones, individuos, eventos, fenómeno, ensayo)
Documentación del Sistema de Calidad: III
Ayuda para la captura de los formatos R1, R2 y Anexos
SERVICIO DE INFORMACIÓN AGROLIMENTARIA Y PESQUERA Marzo 2009 MUESTREO NACIONAL MUESTREO POR SEGMENTACION.
Teoría de lenguajes y compiladores
Sandra Yazmín Betts Gómez Javier Arellano Sánchez
FACULTAD: Marketing CARRERA: Administracion de Empresas ASIGNATURA: GESTION DE INFORMACION WEB TÍTULO: TALLER AUTOR: DANILO NERVI PROFESOR: ERIKA ASCENCIO.
7. Prevención y Mejora de Errores LS Calidad de Software 3IM1 Universidad Antonio de Nebrija Justo Hidalgo.
UNIVERSIDAD DE CÓRDOBA VII Jornadas Técnicas de Calidad de las Universidades Andaluzas Evaluación de la Actividad Docente del Profesorado PROGRAMA DOCENTIA.
Módulo 12 Herramienta de aseguramiento de la calidad del PSA 1.
Fórum TIG-SIG Barcelona, 29 junio Criterios, definiciones y especificaciones de la calidad: ¿Existen? Dolors Institut Cartogràfic.
IMPLEMENTACIÓN DE UN SISTEMA DE GESTIÓN Y CONTROL DE CALIDAD BAJO LAS NORMAS ISO 9001:2000, 19113, 19114, y EN LA PRODUCCIÓN CARTOGRÁFICA Relator:
Integrantes Grupo 7 Controles de procesos de datos El aspecto principal de la evaluación que de los controles internos que haga el auditor, es determinar.
Company LOGO IMPLEMENTACIÓN DE UN SISTEMA DE GESTIÓN Y CONTROL DE CALIDAD BAJO LAS NORMAS ISO 9001:2000, 19113, 19114, y EN LA PRODUCCIÓN CARTOGRÁFICA.
Actividad 8. Gestión de las estructuras y bases de datos. M.C. Juan Carlos Olivares Rojas Syllabus May, 2009.
José Luis Tomás Navarro Sergio Pérez Paredes
Administración Proyectos Jorge Baracaldo Robin Ochoa.
DIGITALIZAÇÃO DE COLECÇÕES BIOLÓGICAS Braga, 5-7 de julio de 2006 Nodo español de GBIF: GBIF.ES Unidad de Coordinación del Nodo Español de GBIF
AUDITORIA DE LA OFIMATICA
Ingeniería del Software
Análisis y diseño detallado de aplicaciones informáticas de gestión
Pruebas de Software WebExamen GRUPO 5 Juan Marcelo Ferreira Aranda Silvano Christian Gómez
Quito, Ecuador, 6- 9 de noviembre de Socialización de Avances Quito, Ecuador, 6 de noviembre de 2012.
GESTION DE LA CONFIGURACION DEL SOFTWARE (GCS/SCM)
Procedimiento de Diseño y Desarrollo
Pruebas de Software WebExamen
I.- Introducción a los sistemas de información
SISTEMA DE INFORMACIÓN DE GEOGRÁFICA
Introducción al proceso de verificación y validación.
Protocolos de comunicación TCP/IP
Métodos para garantizar la calidad del software.
G ESTIÓN DE LA C ONFIGURACIÓN DEL S OFTWARE G ESTIÓN DE LA C ONFIGURACIÓN DEL S OFTWARE Daniel Eduardo Almeciga Angie Katterine Cruz O. Diego Fernando.
Evaluación interna Nivel superior (NS)
Proceso de desarrollo de Software
Documentos del Programa de Garantía de Calidad de Software
©Accenture 2006 Fundación Accenture Página 1 Ámbito: EstatalPeriodo: Del 1 de septiembre de 2010 al 24 de noviembre de 2010 Página 2 Estatal. Informe Global.
Aseguramiento de la Calidad. (Software Quality Assurance, SQA) Por. Ing. Ernesto Soto Roca.
Copyright © 2015 Banco Interamericano de Desarrollo. Esta obra está bajo una licencia Creative Commons IGO 3.0 Reconocimiento-No Comercial-Sin Obra Derivada.
Verificación y Validación del Software
OFICINA DE CONTROL INTERNO
Transcripción de la presentación:

Calidad de datos: detección y corrección I Taller sobre calidad en bases de datos sobre biodiversidad 13-14 septiembre 2007. Madrid. Francisco Pando Unidad de Coordinación GBIF-España

Guión Conceptos Ciclo de vida de los datos y detección Introducción de datos: interpretar, distorsionar, errar Captura de errores: validación y detección Diseño de base de datos y gestión de errores Virtualidad y realidad en las BBDD Casos La casa por los cimientos. Un ejemplo de Eslovenia

Información original y derivada Many uses, what are those uses? management, knowledege

Ciclo de vida de los datos y detección Chapman, A. D. 2005. Principles of Data Quality, version 1.0. Report for GBIF

Introducción de datos: interpretar, distorsionar, errar Una base de datos debe conciliar dos requisitos en extremo irreconciliables: Representar la realidad Que la información se encuentre, se pueda comparar y analizar ( estandarizar y normalizar  interpretar) Estándares (o referencias) explícitos usados con consistencia

Componentes de la validación Validación = detectar y corregir: Inexactitudes Falta de datos Potenciales errores (datos no razonables) La validación trata de garantizar la veracidad del registro

Captura de errores: validación y detección Validación: asegura que los datos se corresponden con el objeto. Incluye también el control de inexactitudes y pérdida de datos

Procedimiento Establecer procedimientos que no conlleven pérdida de datos Las reglas de normalización deben cubrir todos los casos Los procedimientos no deben bloquear el progreso del trabajo ante casos no contemplados o dudas

Procedimientos que permita que los errores detectados se corrijan en la base de datos

Por ejemplo: http://data.gbif.org/occurrences/76377384/ Proporcionar al usuario la posibilidad de reportar errores o comentarios http://data.gbif.org/occurrences/76377384/

Diseño de base de datos y gestión de errores Diseños normalizados de bases de datos

Diseño de base de datos y gestión de errores Recomendación: distintos formatos de la misma información debe calcularse de un campo a otro para su uso específico y no duplicar la información en campos paralelos Campo UTM: 30TUF345871 Campo UTM: 30TUF345871 Campo UTM10: 30TUF38 … Y si.. Campo UTM: 30TUF345871 Campo UTM10: 30TUF31 Campo UTM: 30TUF38 temporal calculado

Virtualidad y realidad en las BBDD Cuestión para debatir ¿Debe el objeto reflejar toda la información acumulada a partir del el? por ejemplo: ref. al Genbank, nombre de la camisa (Bot.) o de colección (Zool.)

Casos (1) “Misma especie, misma localidad, al mismo sobre” ¡no hacer en casa!

Casos (2) “Las malas identificaciones son errores que se han de corregir [i.e. eliminar]” ¡no hacer en casa!

Casos (3)

Casos (4)

Casos(3) Herbar 3.4 Herbar 3.5

Para terminar: La casa por los cimientos: Un ejemplo de Eslovenia