Curso sobre la publicación de datos sobre biodiversidad en la red de GBIF y su aptitud para el uso, edición 2011 Métodos para mejorar la aptitud para el.

Slides:



Advertisements
Presentaciones similares
Como crear y usar una rúbrica
Advertisements

GUÍA PARA EL DESARROLLO DEL PRODUCTO Y PLAN DE MANUFACTURA
Ruta de gestión de información para la elaboración de fichas de especies Equipo Coordinador del Sistema de Información sobre Biodiversidad de Colombia.
Pruebas de Diseño Diplomado en Calidad en el Software NOTAS
LATINDEX.
LA PLANIFICACIÓN DE LA AUDITORÍA TEMA 4
MaNuaL APQP CAPITULO 1 EQUIPO # 1 Lucero Honorina Alderete Loera

Curso Administrativo OTEC/Empresa Unidad III: Revisión del Libro de Clases (Actualizado el ) Curso creado por : Libro de Clases Electrónico (LCE)
TIPOS O ENFOQUES DE INVESTIGACION
SISTEMA DE NACIMIENTOS MANUAL DEL USUARIO. El objetivo del presente manual es servir de guía al usuario final para interactuar con el Sistema, permitiéndole.
Cómo leer un artículo científico
PROCESO Y ESTRATEGIA DE BÚSQUEDA
12.4 Seguridad de los archivos del sistema
Formas de obtener Información para su Negocio
20 al 23 de junio de 2006 Buenos Aires, Argentina Primer Taller: Difusión de la evaluación conjunta de los resultados de la ronda 2000 de los censos de.
SISTEMAS DE DISEÑO ASISTIDO POR COMPUTADORA
Muestra: Recolección de Datos: Análisis de Datos:
Curso sobre la publicación de datos sobre biodiversidad en la red de GBIF y su aptitud para el uso, edición 2011 Herramientas y recursos para estimar y.
Capítulo 3 Etapas de un Proyecto de simulación
Características de un Data Warehouse
Buenas y Malas Localidades Razones por las que es importante tomar buenos datos de localidad.
Proceso investigativo
IMPLANTACIÓN Y MANTENIMIENTO DE SISTEMAS
Una biblioteca virtual es una biblioteca que no requiere de mobiliario ni amplios estantes, solo depende de un software y un servidor. Este tipo de biblioteca.
Guía para sobre la ley Patriot Act American Library Association Oficina de Washington 19 de enero del Traducción al español, resumen,
Sistemas de Información IS95872
Curso sobre la publicación de datos sobre biodiversidad en la red de GBIF y su aptitud para el uso, edición 2011 Una introducción a la aptitud para el.
Seminario-Taller Como escribir, presentar y publicar resultados científicos 07, 08 y 09 de Febrero, 2011.
(Organización y Manejo de Archivos)
RCA Capítulo 23 y las LCRIs
Escribiendo y publicando un artículo
SEO Los términos posicionamiento en buscadores, posicionamiento web u optimización de motores de búsqueda engloban todos los procesos que se encargan de.
INSTRUCTIVO PARA LA BUSQUEDA ACTIVA DE PERSONAS NO ALFABETIZADAS.
FIABILIDAD, CONFIDENCIALIDAD, INTEGRIDAD Y DISPONIBILIDAD
Georreferenciación & Geolocalización
Crear un formulario de lista personalizado
Tecnologías para el Aprendizaje
Criterios de Evaluación
INGENIERÍA DEL SOFTWARE GESTIÓN DE PROYECTOS
Estilo de Publicación de la APA
EVALUACIÓN DE LOS SISTEMAS Ing. José Manuel Poveda.
Diseño Conceptual de Un GIS
Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.
TIPOS DE AUDITORÍAS EN SISTEMAS DE INFORMACIÓN
Posgrado en Sistemas Computacionales Heurísticas de usabilidad MC Luz María Moreno Aguilar Noviembre 2009.
 Los datos son uno de los recursos más valiosos. Por lo cual se debe tener presente: 1. La responsabilidad de los datos es compartida. 2. Un problema.
BASE DE DATOS DISTRIBUIDAS
Aurora Tapia, Stephanie Infante, Carmen Pérez. -Página web de fácil actualización (unipersonales o grupales) -Son como un diario personal o bitácora de.
UBATIC: Entre proyectos DIGITALIZACIÓN Secretaría de Asuntos Académicos Rectorado de la Universidad de Buenos Aires.
Ciclo de Vida del Software
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE QUÍMICA Seminario de investigación en Ciencias de la Administración Marco Teórico TEMA 2.3.
M.C. Meliza Contreras González
Derechos de autor © 2008, Corporación Intel. Todos los derechos reservados. Intel e Intel  Educación son marcas comerciales o marcas registradas de la.
NORMA INTERNACIONAL DE AUDITORÍA 530
Francisco Vera Voronisky Marzo, 2013
Aurora Tapia, Stephanie Infante, Carmen Pérez. -Página web de fácil actualización (unipersonales o grupales) -Son como un diario personal o bitácora de.
Instrumento AGREE II INSTRUMENTO PARA LA EVALUACIÓN DE LA CALIDAD METODOLOGICA DE LAS GUÍAS DE PRÁCTICA CLÍNICA Dra. Anggie Ramírez Dr. Mario Tristán.
Bases de Datos y Sistemas de Gestión de Bases Relacionales.
6.6 Administración de defectos
I3N – PARAGUAY Red de Información sobre Especies Invasivas Secretaría del Ambiente (SEAM) Dirección General de Protección y Conservación de la Biodiversidad.
EI, Profesor Ramón Castro Liceaga IV. AREAS DE EVALUACIÓN DE LA AUDITORIA EN INFORMÁTICA. UNIVERSIDAD LATINA (UNILA)
Fundamentos de Computación
Algunas anotaciones sobre las TIC y los procesos de investigación Vivian Rivera R. Setiembre, 2015.
Georreferenciación de datos primarios sobre biodiversidad Dairo Escobar.
SEMINARIO DE LA INVESTIGACIÓN I Por : Erick Daniel Vildoso Cabrera EL MARCO TEÓRICO.
[IGN + UPM] con financiación de la AECI Madrid, junio-julio de 2006 Carmen Muñoz-Cruzado García Universidad Politécnica de Madrid Curso IDEs El Nomenclátor.
La Netiqueta. Introducción  Usos del correo electrónico Herramienta de trabajo Comunicación Intercambio de información.
Protocolo Estandarización de localidades Por: Srahyrlandy Rocío Díaz S.
13/11/14. UNIDADES DEL SEMESTRE Este trabajo esta diseñado para saber los propósitos de los sistemas de información, así como el buen desempeño que le.
Transcripción de la presentación:

Curso sobre la publicación de datos sobre biodiversidad en la red de GBIF y su aptitud para el uso, edición 2011 Métodos para mejorar la aptitud para el uso (fitness-for-use) de los datos de biodiversidad Manuel Vargas Del Valle Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad de Costa Rica (INBio) Buenos Aires (Argentina) 30 septiembre 2011

Resumen Esta charla presenta diversos métodos para mejorar la aptitud para el uso (fitness-for-use) de los datos sobre biodiversidad, desde el punto de vista taxonómico y geográfico. Los temas presentados aquí reflejan en gran parte las investigaciones realizadas por Arthur Chapman y John Wieczorek en los campos de aptitud para el uso, calidad de datos y curación de datos. Esta charla es una traducción de la elaborada en inglés por Nicolas Noé y Meherzad Romer, y traducida también al francés por ellos mismos.

Contenidos Datos taxonómicos Datos geográficos Datos “delicados de manejar” (Sensitive data)

Mejores prácticas Taxonomía

Datos taxonómicos Certeza de la identificación Perspectiva del diseño de la base de datos: Bandera de nivel de verificación, nombre, fecha Cuidado con términos como "aff.", "cf.", "s.lat",... Si la identificación no fue hecha por un experto, guarde la siguiente información: o claves taxonómicas o ADN o revisiones o...

Prácticas para la entrada de datos: Uso de checklists Uso de archivos de autoridad Chequeo de errores: Generalmente requiere expertisia taxonómica Los valores extremos (outliers)ambientales/geográficos pueden ayudar a priorizar Datos taxonómicos Certeza de la identificación

Datos taxonómicos Problemas de ortografía – Parte 1 Diseño de bases de datos: o “Atomizar” los datos (géneros, especies, autores, certeza,...) Usar archivos de autoridad o Listas globales (Catálogo de la Vida, Species2000,...) o Regionales o Taxonómicos (fishbase,...) Entradas duplicadas o Se requiere una interfaz específica para sugerir posibles duplicados y marcarlos cuando se importan fuentes secundarias

Datos taxonómicos Rangos infraespecíficos Database design: atomize fields, build scientific name later: GenusSpeciesInfra_rankInfra_value Stipiturusmalachurussubsp.parimeda => se evitan nombres ambiguos => permite chequeos en los rangos infraespecíficos (pocos valores)

Entrada de datos o Use listas de valores (pick-lists) o Permita un número limitado de valores: subsp.subespecie var.variedad subvar.subvariedad f.forma subf.subforma Chequeo de errores No debe hacerse mucho si la base de datos está bien diseñada Datos taxonómicos Rangos infraespecíficos

Datos taxonómicos Cultivos e híbridos Son casos muy complejos de manejar. La base de datos debe estar diseñada para manejar esos casos específicos Cultivos tienen su propio código nomenclatural Incluya un campo que indique si se trata de un cultivo o un híbrido (para así permitir más revisiones o atomización)

Datos taxonómicos Nombres no publicados – Qué debe evitarse Deje claro que se trata de un nombre no publicado – evite el uso de binomios que parezcan nombres publicados o Los usuarios podrían perder mucho tiempo buscando nombres que no existen Evite nombres como "Verticordia sp.1", "Verticordia sp.2". o => Esto puede causar mucha confusión, ya que puede hacer referencia a diferentes especies en instituciones diferentes

Datos taxonómicos Nombres no publicados – Qué hacer " sp. ( )" Prostanthera sp. somersbey (B.J. Conn 4024) Ventajas: Es claro para los usuarios que NO es un nombre publicado Evita la confusión entre especies/instituciones Cuando el taxón se describa apropiadamente puede ser usado como un sinónimo Hay poco peligro de confusión fuera de las publicaciones científicas

Datos taxonómicos Problemas ortográficos – Nombres comunes Son casi imposibles de estandarizar debido a qué: Un solo taxón puede tener varios nombres comunes (debido a que son particulares de una región, lenguaje o etnia) Inversamente, un mismo nombre común puede ser compartido por varios taxones No estandarize los nombres comunes, pero documéntelos tanto como sea posible NombreLenguajeRegiónFuenteComentarios

Datos taxonómicos Nombres de autores No siempre deben incluirse. Solamente deben incluirse cuando un mismo nombre se le da a varios taxones Si los incluye, use un campo separado Tome en cuenta las diferencias entre los formatos para nombres de plantas y nombres de animales (i.e. en la concatenación): o Los nombres de animales incluyen años:  Emydura signata Ahl, 1932  Macrotis lagotis (Reid, 1937) o Los de plantas no  Melaleuca nervosa (Lindley) GéneroEspecieAutorAño

Datos taxonómicos Nombres de autores – Chequeo de errores Para plantas, las abreviaturas de los nombres de autores siguen un estándar que puede usarse para las revisiones Revise con archivos de autoridad Use técnicas basadas en “Soundex” Si se usan los autores, todos los nombres publicados deben llevarlos

Datos taxonómicos Nombres de recolectores Hay listas de nombres de recolectores recopiladas para algunas áreas El formato debe estandarizarse. El estándar HISPID recomienda: "Primer apellido del recolector seguido de una coma y un espacio (, ) luego las iniciales (todas en mayúscula y separadas por puntos). Todas las iniciales y la primera letra del apellido deben ir en mayúscula. Por ejemplo, Chambers, P.F."

Datos taxonómicos Nombres de recolectores – Chequeo de errores Si el formato está estandarizado, es fácil "ordenar por recolectores" y buscar pequeñas variaciones (sin embargo, se debe tener mucho cuidado al renombrar) Se pueden emparejar los nombres de recolectores y las fechas de recolección con datos de los historiadores: itinerarios de barcos, descripción de expediciones científicas... Ambas bases de datos pueden ser mejoradas si se detectan las inconsistencias y los errores

Mejores prácticas Datos espaciales

Datos espaciales Diseño de bases de datos - 1/2 Debemos asegurarnos de que hay campos para recopilar adecuadamente la información que con frecuencia se pone en el campo de localidad Eurasia: throughout Europe to northernmost extremity of Scandinavia, except Iberian Peninsula, central Italy, and Adriatic basin; Aegean Sea basin in Matriza and from Struma to Aliakmon drainages; Aral Sea basin; Siberia in rivers draining the Arctic Ocean eastward to Kolyma. Widely introduced. Several countries report adverse ecological impact after introduction.(Distribución de Perca Fluviatilis, tomada de fishbase)

Datos espaciales Diseño de bases de datos - 2/2 Coordenadas en formato decimal Datum geodésico Exactitud reportada por los dispositivos Incertidumbre espacial: prefiblemente en metros "Lugar más cercano con nombre", "Distancia" y "Dirección" (+ Localidad). Todos estos elementos juntos ayudan a geocodificar y a limpiar los datos. Método de georreferenciación: GPS diferencial GPS “corrompido” por la Disponibilidad Selectiva (antes de mayo del 2000) Un mapa de referencia de escala 1: y triangulación Una referencia a un mapa y “navegación por estima” (dead reckoning) Obtenido automáticamente con software de georreferenciación

Datos espaciales Chequeo de errores en los datos existentes Chequeo contra el resto del registro: localidad, nombre del país Chequeo contra otros datos en la base de datos: ¿es el registro consistente con otros lugares que ha visitado el recolector? Chequeo contra datos externos mediante SIG: prueba del “punto en el polígono” - ¿el punto está en el mar o en el océano? Chequeo de valores geográficos “extremos” (outliers) de una especie Búsqueda de valores ambientales “extremos” (outliers) de una especie

Datos espaciales Mejores prácticas para georreferenciación – Recolección en el campo - Localidad Las descripciones de localidades más específicas usan una referencia inequívoca, corta, fácil de localizar y persistente a un objeto geográfico (un punto, una línea, un polígono) y desplazamientos ortogonales desde el centro de ese objeto. "2.1 km N and 0.5 km E of North Head Light House off Sydney Heads"

Mejores prácticas Datos “delicados” (Sensitive data)

Trabajando con datos “delicados” Deben presentarse “vagamente” - ¿Por qué? Para proteger especies amenazadas, económicamente importantes y reducir el impacto en poblaciones silvestres Para reducir las posibilidades de sabotaje, recolección por parte de recolectores comerciales o inescrupulosos, sobre explotación, control de la bioprospección... Proteger datos de terceros custodiados por la institución Permitir la publicación de los resultados de investigaciones y así mantener ventajas competitivas Por temor a que los usuarios le den un uso inadecuado a lso datos Por respecto a los deseos de los dueños de la propiedad intelectual de los datos (resultados de la encuesta en Internet de GBIF )

Trabajando con datos “delicados” Consideraciones generales Los problemas clave frecuentemente son sociales Hay aspectos regionales que deben tenerse en cuenta Algunos nunca compartirán datos “delicados” La documentación es esencial

Trabajando con datos “delicados” Como presentar datos de manera “vaga” o imprecisa Datos espaciales: o Con una cuadrícula espacial o Se recomiendan 3 niveles de generalización por Chapman & Wieczorek(2006): 0.1 grados (11-16 km) grados ( km) grados ( m) o En casos extremos, no los presente ni publique Datos no espaciales o Deben ser reemplazados con frases apropiadas o No elimine los datos de la colección

Trabajando con datos “delicados” La documentación es esencial Debe indicarse qué se ha hecho para presentar los datos “vagamente”, así como las razones, para que así el usuario pueda: saber que datos han sido modificados y como saber que hay más información que podría obtener decidir si debe ignorar esos datos, incluírlos tal como los obtiene o buscar más información

Trabajando con datos “delicados” Campos que deben presentarse “vagamente” Información de localidad y de georreferenciación Otros campos (información taxonómica, nombre del observador, información del hábitat, huéspedes, usos tradicionales,...)

Preguntas ¡Gracias!

Curso sobre la publicación de datos sobre biodiversidad en la red de GBIF y su aptitud para el uso, edición 2011 Métodos para mejorar la aptitud para el uso (fitness-for-use) de los datos de biodiversidad Manuel Vargas Del Valle Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad de Costa Rica (INBio) Buenos Aires (Argentina) 30 septiembre 2011