Curso sobre la publicación de datos sobre biodiversidad en la red de GBIF y su aptitud para el uso, edición 2011 Una introducción a la aptitud para el.

Slides:



Advertisements
Presentaciones similares
Como crear y usar una rúbrica
Advertisements

ESTADISTICA A ESTADISTICA A UNMSM - FQIQ
Diccionario de Datos (DD)
Gestión de la información
Principios sobre la calidad de datos
Cómo funciona un GPS El GPS utiliza el principio matemático de la triangulación: Triangulación Mediante la medición muy precisa de nuestra distancia (por.
Ruta de gestión de información para la elaboración de fichas de especies Equipo Coordinador del Sistema de Información sobre Biodiversidad de Colombia.
Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES
El papel de los metadatos en la gestión de información de especímenes.
Provisión de datos colombianos al GBIF en el marco del SiB Colombia Taller de trabajo 27 al 29 de mayo de Bogotá, D.C El papel del SiB Colombia como.
I Reunión de la Red CYTED, Buenos Aires, de noviembre de 2005 Colecciones Auxiliares: Conservación de los materiales y de las informaciones asociadas.
SISTEMAS DE INFORMACIÓN EN LAS ORGANIZACIONES
Ingeniería de Software II
Evaluaciones de Sistemas de Administración de la Seguridad SMSA
II TALLER SOBRE CONSERVACIÓN E INFORMATIZACIÓN DE HERBARIOS.
Técnicas para la elaboración de un instrumento
PLANIFICACIÓN Y CONTROL DE LA PRODUCCIÓN
COLEGIO DE BACHILLERES PLANTEL 13 XOCHIMILCO-TEPEPAN MATERIA:TIC EQUIPO:23 PRESENTACION: BASE DE DATOS ALUMNAS: Velazquez Corona Elsa Ponciano Antonio.
GESTIÓN DE LOS COSTOS DEL PROYECTO
Guía para la evaluación de seguridad en un sistema
IEEE-std Práctica Recomendada para la Especificación de Requerimientos de Software Fuente: IEEE Recommendad Practice for Software Requirements.
MÉTODOS DE INVESTIGACIÓN
Curso sobre la publicación de datos sobre biodiversidad en la red de GBIF y su aptitud para el uso, edición 2011 Herramientas y recursos para estimar y.
Auditoria de la seguridad de los datos y del software de aplicación Unidad IV.
Datos de herbarios y museos para estudios de biodiversidad
Calidad de los datos en… Banco de Datos de Biodiversidad de la Comunidad Valenciana Nuria Fabuel Ten
GESTION NIVELES DE SERVICIO.
UNIDAD I Conceptos Básicos.
DIAGNOSTICO ORGANIZACIONAL
Curso: Muestreo Básico (Resumen)
Población y Muestra.
Instituto Tecnológico de La Paz Ing. Fernando Ortiz Ahumada.
Guía para sobre la ley Patriot Act American Library Association Oficina de Washington 19 de enero del Traducción al español, resumen,
Importancia de las aplicaciones de estadística en el control de procesos Guatemala 2010.
Unidad 6 Sociología de las Organizaciones. Información.
Procedimiento para el establecimiento de indicadores de gestión
Punto de Posicionamiento Preciso y reingeniería
Curso sobre la publicación de datos sobre biodiversidad en la red de GBIF y su aptitud para el uso, edición 2011 Métodos para mejorar la aptitud para el.
SUBSECRETARÍA DE EDUCACIÓN SUPERIOR DIRECCIÓN GENERAL DE EDUCACIÓN SUPERIOR TECNOLÓGICA INSTITUTO TECNOLÓGICO DE ALTAMIRA Altamira, Tam. Enero del 2013.
Proceso administrativo Elementos de planeación Toma de decisiones
CICLO DE VIDA Y NORMAALIZACION DE UN SISTEMA DE BASE DE DATOS
DOCUMENTACIÓN DEL SISTEMA DE GESTIÓN DE LA CALIDAD
COLEGIO DE BACHILLERES PLANTEL 13 XOCHIMILCO-TEPEPAN MATERIA:TIC EQUIPO:21 PRESENTACION: BASE DE DATOS ALUMNAS: Adán Millán Sánchez.
Evaluación interna Nivel superior (NS)
Diseño Conceptual de Un GIS
DISEÑO CURRICULAR Presentado por: Cesar Augusto Sáenz María Alejandra Hernández 1.contenidos curriculares de competencia.
Experimento de laboratorio
Introducción al proceso de verificación y validación.
Elementos de información
Desarrollo de un Inventario de Biodiversidad en el Sur del Ecuador David Siddons MSc. Escuela de Biología, Ecología y Gestión UNIVERIDAD DEL AZUAY.
Gráfica de número de no conformes (np)
Introducción a FSSC
M.C. Meliza Contreras González
ANGIE PAOLA SOLANO CASTIBLANCO DAR SOPORTE A LOS PROCESOS NORMAS ISO DOC. JOHANA LÓPEZ CHAVEZ SENA 2010.
Instrumento AGREE II INSTRUMENTO PARA LA EVALUACIÓN DE LA CALIDAD METODOLOGICA DE LAS GUÍAS DE PRÁCTICA CLÍNICA Dra. Anggie Ramírez Dr. Mario Tristán.
Métodos de recolección
Proceso de desarrollo de Software
Implementación de proyectos de digitalización y preservación digital Lic. Marisol Zuñiga Coordinadora de colecciones Biblioteca Ludwig.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Taller de investigación 1
Procesos de Planeación
Georreferenciación de datos primarios sobre biodiversidad Dairo Escobar.
[IGN + UPM] con financiación de la AECI Madrid, junio-julio de 2006 Carmen Muñoz-Cruzado García Universidad Politécnica de Madrid Curso IDEs El Nomenclátor.
MÉTODO RADIO-PUNTO EQUIPO DE GEORREFERENCIACION INSTITUTO ALEXANDER VON HUMBOLDT.
PROCESO DE CONSULTA Y PARTICIPACIÓN DE ACTORES DE REDD Jenny Chimayco Ortega Coordinadora de Comunicaciones Dirección General de.
Importancia de la sistematización de colecciones biológicas Eduardo Rudas Burgos. Coordinador Programa Informática de la biodiversidad. Instituto de Ciencias.
Verificación y Validación del Software
Reunión del comite de nodos de GBIF Copenhague, Dinamarca 4 de octubre de 2009 La interfaz de usuario del IPT y las herramientas para la calidad de datos.
13/11/14. UNIDADES DEL SEMESTRE Este trabajo esta diseñado para saber los propósitos de los sistemas de información, así como el buen desempeño que le.
MARCO METODOLÓGICO. TIPOS DE INVESTIGACIÓN, DISEÑO, NIVEL. ENFOQUES
Transcripción de la presentación:

Curso sobre la publicación de datos sobre biodiversidad en la red de GBIF y su aptitud para el uso, edición 2011 Una introducción a la aptitud para el uso (fitness-for-use) de los datos de biodiversidad Manuel Vargas Del Valle Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad de Costa Rica (INBio) Buenos Aires (Argentina) 30 septiembre 2011

Resumen Esta charla presenta el concepto de aptitud para el uso (fitness-for-use) de los datos sobre biodiversidad: porqué es importante y cuáles son los distintos enfoques para definirlo y aplicarlo de manera eficiente. Los temas presentados aquí reflejan en gran parte las investigaciones realizadas por Arthur Chapman y John Wieczorek en los campos de aptitud para el uso, calidad de datos y curación de datos. Esta presentación es una traducción de la elaborada en inglés por Nicolas Noé y Meherzad Romer, y traducida también al francés por ellos mismos.

Contenidos El valor de los datos Definición de “aptitud para el uso” Aptitud para el uso en datos biológicos de ocurrencia Metadatos Datos taxonómicos Datos espaciales Datos del recolector y de las recolecciones Datos descriptivos Preguntas

Publicación de datos...pero, ¿para qué? ¿Vivimos en el "siglo de los datos"? La cantidad de datos disponibles está creciendo exponencialmente ¡La comunidad de GBIF es parte de este movimiento! Estos datos tienen el potencial de incrementar dramáticamente nuestro conocimiento y nuestras capacidades

Ejemplos de como los datos afectan nuestras vidas Política Mapas & geografía Publicidad...

Respuesta de OpenStreetMap al terremoto de Haití Antes...

Respuesta de OpenStreetMap al terremoto de Haití y unos pocos días después...

Cambio climático y parientes silvestres de plantas cultivadas Parientes silvestres Datos de GBIF 343 especies Global Modelos de cambio climático Riqueza actual Riqueza futura Cambio predicho

Objetivo: convirtiendo los datos en conocimiento Océanos de datos...

...ríos de información...

...arroyos de conocimiento...

... y gotas de entendimiento.

Usos de los datos de biodiversidad Investigación taxonómica, modelado/ predicción de distribución de especies, especies invasivas, pérdida de hábitat, relaciones interespecíficas,... Y también... Planificación de la conservación, administración del recurso hídrico, antiofídicos, ecotourismo, historia de la ciencia, caza y pesca, repatriación de datos, fotografía y cine naturalista,...

Aptitud para el uso Definición La calidad de los datos es un concepto relativo al uso que se les pretende dar... "La intención general de describir la calidad de un registro o de un conjunto de datos particular es describir la aptitud de ese conjunto de datos o de ese registro para un uso particular que uno tiene en mente para esos datos." Chrisman, 1991

Aptitud para el uso en acción - La especie 'A', ¿ocurre en Tasmania? - La especie 'A', ¿ocurre en el Parque Nacional 'X' ?

La pérdida de la calidad de los datos ocurre en todos los niveles Durante la recolección Durante la digitalización Durante la documentación Durante el almacenamiento Durante el análisis y la manipulación A la hora de la presentación Y a través del uso que les da

Cadena de información de la calidad de datos Debe asignarse responsabilidad por la calidad de los datos tan pronto como se pueda al momento de su creación.

Garantía de la calidad y control de la calidad Estimación de la calidad con base en estándares, procesos y herramientas internos o externos. ¡Ambos deben efectuarse si la calidad de los datos es una prioridad!

Es importante que las organizaciones cuenten con: Una visión acerca de tener datos de buena calidad o No reinventar la rueda y usar estándares o buscar ineficiencias (en la recolección de datos y en los procedimientos de control de calidad) y reducir la duplicación de esfuerzos o compartir (datos, información y herramientas) o ver más allá del uso inmediato o tomar en cuenta las necesidades de los usuarios o Invertir en buenos metadatos y documentación o... Una política para implementar esa visión Una estrategia de implementación

La responsabilidad con respecto a los datos es compartida entre: Recolectores: principal responsabilidad La información de la etiqueta es correcta, tan exacta como es posible y legible Las metodologías de recolección están completamente documentadas Las notas son claras y sin ambigüedades... Difícil (o imposible) de corregir después

La responsabilidad con respecto a los datos es compartida entre: Curador/custodio: responsabilidad en el largo plazo Calidad de la transcripción de los datos a la base de datos Los chequeos de validación son realizados y documentados (rutinariamente) Los datos son almacenados y respaldados Las versiones previas son almacenadas sistemáticamente Se garantiza el respeto (privacidad, PI, derechos de los proveedores indígenas,...) Se provee buena documentación (incluyendo los errores conocidos) La retroalimentación de los usuarios acerca de la calidad de los datos es tomada en cuenta... Responsabilidad de velar por el mantenimiento y por el potencial uso por parte de futuras generaciones..

La responsabilidad con respecto a los datos es compartida entre: Usuarios Proveer retroalimentación a los curadores/custodios: errores/omisiones en los datos y en la documentación establecer prioridades para el futuro.... Responsabilidad de los usuarios: determinar la aptitud de los datos para el uso que requieren y no utilizar los datos de manera inapropiada.

Exactitud y precisión Exactitud = “correctitud” Precisión: o Estadística = "repetición" o Numérica = "dígitos" Poca exactitud Mucha precisión Mucha exactitud Poca precisión Mucha exactitud Mucha precisión

Errores e incertidumbre Errores : tanto imprecisión como inexactitudes Aleatorios o sistemáticos No pretenda desaparecerlos (mídalos, calculelos, regístrelos, documentelos) Incertidumbre Siempre está presente (dificultad: entenderla, registrarla y describirla) ¡Habla más acerca del observador/recolector que de los datos mismos!

Aptitud para el uso y metadatos "Datos acerca de los datos (o conjuntos de datos)" contenido, accessibilidad, completitud,... en el nivel del conjunto de datos o en el nivel del registro documentan los errores documentan la validación de datos y la limpieza/corrección de errores Los datos deben estar documentados con el suficiente detalle como para que su uso sea posible por terceros sin tener que contactar a quién produjo el dato.

Datos taxonómicos Con frecuencia, los nombres son el punto de entrada a las bases de datos sobre biodiversidad. => Hay riesgo de propagación de errores Posibles errores: Identificación incorrecta (¡ouch!) Errores de deletreo Formato incorrecto

Datos taxonómicos ¿Qué son? Los datos taxonómicos consisten de: Nombres (científicos, comunes, jerarquías, rangos) Estado nomenclatural (sinónimo, aceptado,...) Referencia (autor, lugar y fecha de la publicación) Determinación (cuándo y por quién) Campos indicadores de calidad (exactitud de la identificación, calificadores)

Datos taxonómicos Problemas ortográficos - (parte 2) Chequeo de errores: Valores faltantes: i.e. subespecies sin especies Valores incorrectos: transposición de letras, valores en la columna incorrecta, valores como '??', valores fonéticos,... Valores “no atómicos”: por ejemplo, 'subsp. bicostasa' “Precaución excesiva”: especie: 'globulus?' => la incertidumbre se incluye en la columna de especies. Duplicación: varios nombres hacen referencia al mismo concepto (errores de ortografía, errores en los sinónimos, varios nombres válidos/aceptados,...) Datos inconsistentes: Ocurre cuando se fusionan bases de datos con listas diferentes.

Datos espaciales Introducción Es uno de los aspectos más cruciales para determinar la aptitud para los usos de los datos sobre biodiversidad: Modelado de distribución de especies Selección de áreas protegidas Planificación y administración ambiental...

Datos espaciales ¿Qué son? Registros de puntos (latitud/longitud) => Área representados como: Punto/radio Rectángulo limitante Polígono Línea de varios vertices Rejilla o cuadrícula (grid)

Ejemplo de datos basados en una rejilla (checklists)

Datos espaciales Definiciones Georreferencia: el código que representa una posición en la superficie de la Tierra, de acuerdo a un sistema de referencia espacial (SRS). Frecuentemente es un par ordenado de coordenadas del tipo latitud/longitud. Georreferenciar: es el proceso mediante el cual se le asignan coordenadas a un registro. Se conoce también como geocodificación.

Datum (geodésico)

Algunos hechos sobre el GPS La tecnología GPS usa triangulación y necesita un mínimo de 4 satélites. Dado que se conoce la posición en el tiempo y el espacio, la posición en la Tierra puede ser calculada. Históricamente, el número de satélites disponibles no siempre ha sido suficiente. Antes de mayo del 2000, la disponibilidad de satélites proporcionó una exactitud de 100 m o peor con la mayoría de los dispositivos. Ahora, la exactitud es generalmente de 10 m en áreas abiertas con 4 satélites. Al promediar los resultados se obtienen mejores resultados (algunos dispositivos hacen esto de forma automática). GPS Diferencial, WAAS, LAAS y GPS Diferencial en tiempo real son diferentes técnicas que usan estaciones base en posiciones bien conocidas para realizar correcciones. La precisión puede ser tan buena como de 1 cm. La altitud en el GPS se refiere al geoide en uso, no se refiere al nivel del mar.

Datos espaciales Errores comunes Inversión de los valores de latitud y longitud Valor cero (en uno o ambos valores) Datum no registrado SRS mal seleccionado Mal sentido de la precisión / problemas de conversión

Datos originales de EEUU en GBIF

Datos del recolector y de la recolección consiste de: recolector fecha de recolección información adicional: hábitat, suelo, condiciones climáticas... La importancia varía de acuerdo al tipo de datos recolectados: Colección estática de un museo: nombre y número del recolector, fecha, hábitat, método de recolección... Datos de observaciones: +duración de la observación, área de la observación, hora del día, actividad, sexo del animal observado... Datos de investigaciones localizadas: +método y tamaño de la investigación (cuadrícula), frecuencia, número de recolección (si se conserva el voucher)

Exactitud: de los nombres de los recolectores, fechas,... Consistencia: uso de una terminología estándar en campos como hábitat, suelos, especies asociadas... Completitud: raramente se logra en campos como hábitat, fenología... Esto hace que un estudio de hábitat sea difícil de realizar con solo datos de colecciones Datos del recolector y de la recolección

Datos descriptivos Morfológicos, fisiológicos, fenológicos,... Se usan cada vez más Variable de calidad y exactitud: datos que no pueden ser observados (históricos), imprácticos de observar (muy costosos), más percibidos que reales (abundancia, color,...) En muchos casos, almacenados en el nivel de taxonomía más que en el de espécimen. Completitud: generalmente no es posible en el nivel de especímenes (i.e. características de las flores VS características de los frutos) Consistencia: representación inconsistente del mismo atributo: o COLOR_FLOR = carmín o COLOR_FLOR = carmesí

Créditos Esta presentación está basada en documentos elaborados por Arthur Chapman, principalmente la presentación "Principios de Calidad de Datos" Parientes silvestres de especies cultivadas: Andy Jarvis(1), Samy Gaiji (2), Julian Ramirez (1) and Emmanuel Zapata (1) 1. The International Center for Tropical Agriculture (CIAT) 2. The Global Biodiversity Information Facility Secretariat (GBIF) Diapositiva de exactitud vs precisión: precision.html Imagen de playa de Lali Masrieta : Río: Johan J.Ingles-Le Nobel Arroyo: bterrycompton Referencia: Chapman, A.D. and J. Wieczorek (eds) Guide to Best Practices for Georeferencing. Copenhagen: Global Biodiversity Information Facility. Available online from or in French as Chapman, A.D. and J. Wieczorek (eds) Principes de la bonne pratique sur le géoréférencement, version 1.0. Trad. Chenin, C. Copenhague: Global Biodiversity Information Facility, 95 pp. Disponible en ligne sur

Preguntas ¡Gracias!

Curso sobre la publicación de datos sobre biodiversidad en la red de GBIF y su aptitud para el uso, edición 2011 Una introducción a la aptitud para el uso (fitness-for-use) de los datos de biodiversidad Manuel Vargas Del Valle Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad de Costa Rica (INBio) Buenos Aires (Argentina) 30 septiembre 2011