Taller de Bibmaster Nodo Nacional de Información en Biodiversidad – GBIF.ES Real Jardín Botánico - CSIC Aula de informática GBIF.ES-RJB Madrid, 12 y 13 de noviembre de 2007
Introducción Contexto del curso (GBIF) Planteamiento del curso Bibmaster ¿Para qué sirve? Un poco de historia Aspectos técnicos
¿Que es GBIF? Global Biodiversity Information Facility Infraestructura Mundial de Información en Biodiversidad Iniciativa internacional para hacer accesible por Internet toda la información disponible sobre los organismos vivos conocidos a nivel mundial A instancias de la OCDE (1996, MegaScience Forum) Los miembros ordinarios de GBIF son estados Los estados miembros se comprometen a establecer un nodo nacional de GBIF que –entre otras cosas – será portal de esta información, además contribuyen económicamente a la inciativa Contexto del curso
Programas temáticos de GBIF Contenido Informatización de las colecciones de Historia Natural Catálogo electrónico de nombres científicos “Species bank”: bases de datos con información sobre especies (descripciones, claves, imágenes, …) Biblioteca Virtual de la Biodiversidad Informática Tecnología e interoperabilidad de bases de datos (estándares, infraestructura informática) Formación y cooperación Nuevos miembros Convenios Internacionales (CBD) Formación Contexto del curso
GBIF en España Resolución del MCYT Contexto del curso Real Jardín Botánico Consejo Superior de Investigaciones Científicas Museo Nacional de Ciencias Naturales Nodo Nacional de GBIF Unidad de Coordinación Contexto del curso
GBIF en España Unidad de Coordinación Misión: apoyar a las colecciones, centros y proyectos relevantes sobre biodiversidad para que participen en GBIF Esta misión se plasma en las siguientes tareas: Proporcionar soporte técnico (información, formación, estándares, software y asesoramiento) Asegurar la coherencia entre las iniciativas nacionales y la arquitectura informática de GBIF, para garantizar la interoperabilidad Investigar como maximizar el valor de los datos, al desarrollar herramientas de análisis, validación y visualización de los mismos Recopilar y difundir información relevante para las colecciones y para el conocimiento y gestión de la información sobre biodiversidad
GBIF en España Participación: centros y proyectos 83 bases de datos 1.577.304 registros http://www.gbif.es/Participantes.php
Planteamiento del curso Objetivos Proporcionar una visión de las funciones de Bibmaster Dar una base de partida para trabajar de manera autónoma con Bibmaster Establecer el contacto útil entre los desarrolladores de Bibmaster y sus usuarios para beneficio mutuo
¿Para qué sirve Bibmaster? Información sobre biodiversidad Puntos de vista Un poco de historia
Información sobre biodiversidad Especimenes Colecciones Observaciones Citas Nombres Correctos y sinónimos Información del tipo Esquema taxonómico Literatura Referencias TL2 & BPH palabras clave Táxones Descripciones,claves, conservación, usos, distribución, habitat, etc. Adaptado de: Leenhouts, Regnum Veg. 58. 1968.
Puntos de vista Herbar Bibmaster (proyectos - investigadores) (gestión de herbarios) -captura de datos -transacciones préstamos intercambios -énfasis en colecciones Bibmaster (proyectos - investigadores) recopilación, gestión, publicación -énfasis en flexibilidad de implementación Nombres Especímenes Literatura Descripciones
Un poco de historia “de dBase III y varias aplicaciones a una aplicación en MS-Access”
Aspectos técnicos Ms-Access (+ MySQL) Acceso directo a datos 3 “MDBs”
Qué es una base de datos “conjunto de datos almacenados con una estructura lógica. Es decir, tan importante como los datos, es la estructura conceptual con la que se relacionan entre ellos. En la práctica, podemos pensar esto como el conjunto de datos más los programas (o software) que hacen de ellos un conjunto consistente”
Tablas y relaciones relaciones 1 a N relaciones N a M Integridad referencial (no nulos, no duplicados, c. primaria, c. candidatas) modelos extendidos (orientados a objetos): objetos, supertipos, subtipos, procedimientos, atributos
Códigos abreviaciones y estándares nombres entendibles para campos y tablas; fáciles de recordar y usar; abreviar lo mínimo y de manera consistente. códigos arbitrarios => problemas de compatibilidad y fuente de errores el coste: Razones para códigos en las claves primarias: cuando la clave primaria es muy larga o compleja (¿para salvar espacio en disco? quien se lo cree) estándares => compatibilidad => acceso unificado, interoperabilidad, soluciones comunes
Coste
Normalización y modelo lógico de los datos Al modelar una base de datos, desearemos evitar puntos que crean confusión, duplicación de la información y por ende, un mal funcionamiento y exploración de la información. Entre las propiedades indeseables en un diseño de bases de datos tenemos: Redundancia en la información. Incapacidad de representar cierta información. Registrar información que no sea identificable.
Primera forma normal Una relación está en primera forma normal (1FN) si y sólo si todos los dominios son atómicos. Un dominio es atómico si los elementos del dominio son indivisibles. Es decir, no tenemos grupos de repetición o un conjunto de valores asociados repetidos asociados a un misma registro. Datos separados en tablas, cada tabla con su clave primaria, no hay grupos repetitivos Ej.: nombres vernáculos en un registro o en una tabla...
Segunda forma normal Una relación está en segunda forma normal (2FN) si y sólo si está en 1FN y todos los atributos que no sean llaves dependen por completo de llave primaria. Quita todos los campos que no dependen de la clave principal o que dependen solo de parte de la clave principal Ej.: Tener una tabla para países y otra para provincias en vez de tener países y provincias en una sola tabla
Tercera forma normal Una relación están en tercera forma normal (3FN) si y sólo si están en 2FN y todos los atributos no llave dependen de manera no transitiva de la llave primaria. Se dice que existe una dependencia transitiva cuando tenemos el par de dependencias funcionales: 78#78 y 79#79, porque de ellas se sigue que 80#80. Elimina todo aquello en las tablas que que no dependa únicamente de la clave principal Ej. En una base de datos de citas donde para todos ellos disponemos de las coordenadas, los datos del sitio de recolección (pais, provincia, localidad, municipio, ...) en la tabla de especímenes
usuarios y palabras de paso recursos compartidos “Practicalities”: usuarios y palabras de paso recursos compartidos preguntas antes de empezar http://www.gbif.es/bibmaster/bibmaster.php
http://data.gbif.org/datasets/provider/57 GBIF-ES es el Nodo Nacional de Información sobre Biodiversidad patrocinado por el Ministerio Español de Educación y Ciencia, gestionado por el Consejo Superior de Investigaciones Científicas W W W . G B I F . E S
Unidad de Coordinación Francisco Pando Responsable Alberto G. Talaván Coordinador de proyectos Silvia Lusa Administradora del sistema informático y red de datos Isabel Ortega Soporte a usuarios y documentación GBIF-ES es el Nodo Nacional de Información sobre Biodiversidad patrocinado por el Ministerio Español de Educación y Ciencia, gestionado por el Consejo Superior de Investigaciones Científicas W W W . G B I F . ES