Aurelio Sanabria Analista/Desarrollador de software INBio, Costa Rica Buenos Aires (Argentina) 28 de setiembre de 2011 Curso capacitación sobre publicación de datos de biodiversidad y fitness-for-use en la Red GBIF. Edición 2011 Introducción a las nuevas opciones para publicar datos de biodiversidad.
Opciones para publicar datos
Glosario Data Publisher / Data Provider Data Resource / Data set Data resource type (e.g., Metadata, Occurrence, Taxon) Data record Data record element, term, field, column, property, attribute, concept (e.g., basisOfRecord, scientificName) Data value Estándares, Vocabularios
Proveedores de datos Instituciones con varias unidades organizacionales, cada una con múltiples recursos de datos. Instituciones, grupos o individuos con varios recursos de datos. Instituciones o individuos con un solo recurso de datos. (data set).
Tipos de recursos de datos Datos primarios de biodiversidad (Especímenes, Observaciones, ecología) El tipo de datos principal es la occurencia de un organismo. Catálogos taxonómicos*, y Checklist de especies El tipo de datos principal es un Taxon * Para distingir nuestros esfuersos de los del Catálogo de la vida – GBIF únicamente provee los medios. Metadatos enriquecidos – Principalmente enfocado en recursos de datos de Occurencias y Taxones.
Registros de datos Recurso de datos tipo: Taxon Recurso de datos tipo: Occurrencia
Campos de datos Recurso de datos tipo: Taxon Recurso de datos tipo: Occurrencia
Valores de los datos Recurso de datos tipo: Taxon Recurso de datos tipo: Occurrencia
Estándares para datos Datos primarios de Biodiversidad Datos taxonómicos Darwin Core 172 Términos Ratificado en el 2009 Archivos de texto Extensible Metadatos Lenguage para metadatos ecológicos (EML) Descripciones de recursos de datos GBIF Profile
Opciones para publicar datos
Si TAPIR permite 1000 registros por solicitud. Para transferir un recurso de datos de registros: 260 solicitudes / Tranferencia total de datos 500MB. Duración de la recolección: 2 horas. De esos 500 MB solo 32MB de los datos tranferidos son "utilizados". Ejemplo: Tapir
Opciones para publicar datos
Para tranferir un recurso de datos de registros: 1 solicitud / Transferencia total de datos: 3MB. Duración de la recolección: de minutos a segundos. Ejemplo: Archivo Darwin Core Archivo Darwin Core
Ejemplo: Archivo Darwin Core Archivo Darwin Core Comparado a Tapir/DiGIR/BioCASE: 260 solicitudes / Transferencia total de datos: 500MB. Duración de la recolección: 2 horas. Para tranferir un recurso de datos de registros: 1 solicitud / Transferencia total de datos: 3MB. Duración de la recolección: de minutos a segundos.
Utiliza un formato simple (texto plano) Almacenamiento eficiente (compressed) Recolección eficiente (un archivo) Fácil acceso (Sin software especializado) Extensible (varios archivos en un solo zip) Archivos Darwin Core: Beneficios Este es el formato recomendado para publicar datos en GBIF
Encontrado los datos
El registro de GBIF
GBIF: Portal de datos
GBIF: Centro de recursos en línea ( Bibliografía
Aurelio Sanabria Analista/Desarrollador de software INBio, Costa Rica Buenos Aires (Argentina) 28 de setiembre de 2011 Training course on biodiversity data publishing and fitness-for-use in the GBIF Network, 2011 edition Introducción a las nuevas opciones para publicar datos de biodiversidad.