Taller sobre calidad en bases de datos sobre biodiversidad Aula de informática del Real Jardín Botánico (CSIC) Madrid, 13-14 septiembre 2007 Uso de tesauros.

Slides:



Advertisements
Presentaciones similares
TALLER HERRAMIENTAS WEB 2.0: Gestor de proyectos de Clase
Advertisements

Catalogación en contexto
PRECISIÓN Y EXÁCTITUD Isabel Ortega Maqueda
Claves para una adecuada definición conceptual
Taller de Bibmaster Nodo Nacional de Información en Biodiversidad – GBIF.ES Real Jardín Botánico - CSIC Aula de informática GBIF.ES-RJB Madrid, 12 y 13.
Plataformas y revistas científicas de acceso abierto en Chile
CSS Rogelio Ferreira Escutia. 2 Hojas de estilo cascada, mayo 2010 Definición La hojas de estilo en cascada (en inglés.
1 VIII CONGRESO NACIONAL DE CIENCIAS Y ESTUDIOS SOCIALES Universidad Earth Guácimo, Limón, Costa Rica Agosto 25 de 2006 Juan Carlos López G. Editor EDUTEKA.
La Biblioteca Compartida IAMSLIC Z39
1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN LAS EMPRESAS GALLEGAS (MICROEMPRESAS, resultados provisionales) 29 de julio de 2004.
1 LA UTILIZACION DE LAS TIC EN LAS PYMES GALLEGAS AÑO Resumen. 24 de Junio de 2005.
Nau Gran dHivern Intr. a la creación y gestión de páginas web Introducción a la web.
Herramientas informáticas
Tema 6. Evaluación de SRIs
Internet y tecnologías web
Principios sobre la calidad de datos
Exportación de datos a GBIF: - Servicio de alojamiento de datos de la Unidad de Coordinación - El modelo Darwin Core y su evolución - Exportar datos desde.
Taller básico de Bibmaster Real Jardín Botánico - CSIC Aula de informática GBIF.ES-RJB Madrid, 14 y 15 de marzo de 2005.
Exportación de datos a GBIF: - Servicio de alojamiento de datos de la Unidad de Coordinación - El modelo Darwin Core y su evolución - Exportar datos desde.
Calidad de datos: descriptores I Taller sobre calidad en bases de datos sobre biodiversidad septiembre Madrid. Francisco Pando Unidad de Coordinación.
Ruta de gestión de información para la elaboración de fichas de especies Equipo Coordinador del Sistema de Información sobre Biodiversidad de Colombia.
GBIF Publicación de datos en GBIF: Servicio de alojamiento, situación actual y futuro. Silvia Lusa 25 de abril de 2008, Real Jardín.
Taller de Herbar Alberto González Talaván Unidad de Coordinación de GBIF España Réplica del II Taller GBIF sobre Georreferenciación.
Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES
Taller de HERBAR para usuarios avanzados
El papel de los metadatos en la gestión de información de especímenes.
La Infraestructura Mundial de Información en Biodiversidad Global Biodiversity Information Facility Francisco Pando Consuelo Sendino
La Infraestructura Mundial de Información sobre Biodiversidad Global Biodiversity Information Facility Francisco Pando GBIF.ES, Unidad de Coordinación.
Metadatos en el SiB Colombia
Provisión de datos colombianos al GBIF en el marco del SiB Colombia Taller de trabajo 27 al 29 de mayo de Bogotá, D.C El papel del SiB Colombia como.
I Reunión de la Red CYTED, Buenos Aires, de noviembre de 2005 Colecciones Auxiliares: Conservación de los materiales y de las informaciones asociadas.
UNIDAD II DIAGNOSTICO ADMINISTRATIVO
Metodología de la Investigación Social
Septiembre METODOLOGÍA DE CREACIÓN DE CONTENIDOS PARA E-LEARNING.
Julio METODOLOGÍA DE CREACIÓN DE CONTENIDOS PARA E-LEARNING 1.Introducción 2.El material 3.Puntos destacados.
Programa informático para el
UNIDAD III: Semana No. 23 MARCO METODOLÓGICO
COMPETENCIA: Manejo de información
1 Archivo Electrónico del Patrimonio Digital Vasco Bilbao,
Taller de informatización de colecciones botánicas Sesión 9ª: perspectivas.
III Reunión Regional de la Biblioteca Virtual en Salud Puebla, México, 5 de mayo de 2003 Criterios de selección LATINDEX José Octavio Alonso Gamboa Dirección.
CLIMA EN ESPAÑA: PASADO, PRESENTE Y FUTURO.
LATINDEX.
La web semántica y su impacto en la recuperación de información
COMPETENCIAS PROFESIONALES DEL INGENIERO EN INFORMÁTICA

GAZETTEER Y SERVICIO WFS-G
Mag. Gabriela Cabrera, Lic. Anibal Carro, Lic. Patricia Schiaffino
Parte 2: Modelo de Análisis del Negocio
1 Programa de Formación de Usuarios/Biblioteca Central/Dora Villegas/
Base de Datos Relacional.
1.1.2 Sistemas de información para la gestión y para la ayuda en la toma de decisiones. Los SI contribuyen activamente a la consecución de los objetivos.
Introducción y conceptos generales
Cristina Villaverde Unidad de Coordinación GBIF España
Metodología Investigación Científica
ESTRATEGIAS DE BÚSQUEDA
Calidad de los datos en… Banco de Datos de Biodiversidad de la Comunidad Valenciana Nuria Fabuel Ten
S ERVICIOS DE INFORMACIÓN Adriana Hernández 14/04/
Quién es Quién: "La biblioteca universitaria y los servicios de apoyo a la docencia y la investigación" 29 de octubre de 2010 Cor-Ciencia: plataforma digital.
GBIF, portales de datos, IPT, artículos de datos, Francisco Pando Unidad de Coordinación de GBIF en España Universidad Metropolitana de Ciencias de la.
SISTEMAS DE INFORMACION GEOGRAFICA. LOS SIG DEFINICION DEFINICION Un SIG se define como un conjunto de métodos, herramientas y datos que están diseñados.
WORKSHOP: Digitalização de Colecções Biológicas Braga (Portugal), 5-7 Junio 2006 Alberto González Talaván Unidad de Coordinación de Nodo Nacional de GBIF.
Encuentro BioCAN: hacia una gestión sostenible de la Amazonía Nuestra Quito, Ecuador, 6- 9 de noviembre de 2012.
Web Semántica La Web Semántica es la nueva generación de la Web, que intenta realizar un filtrado automático preciso de la información. Para ello, es necesario.
Estrategias eficientes para buscar y encontrar
INTERFAZ DE ACCESS  Access es un sistema gestor de bases de datos relacionales (SGBD). Una base de datos suele definirse como un conjunto de información.
Sistema Integral de Información y Atención Ciudadana
[IGN + UPM] con financiación de la AECI Madrid, junio-julio de 2006 Carmen Muñoz-Cruzado García Universidad Politécnica de Madrid Curso IDEs El Nomenclátor.
Internet Infranet Protocolo World Wide Web Hipertexto Página web Sitio web Protocolo http Código HTML Editores HTML Portal Url Navegadores: A. Internet.
Reunión del comite de nodos de GBIF Copenhague, Dinamarca 4 de octubre de 2009 La interfaz de usuario del IPT y las herramientas para la calidad de datos.
Transcripción de la presentación:

Taller sobre calidad en bases de datos sobre biodiversidad Aula de informática del Real Jardín Botánico (CSIC) Madrid, septiembre 2007 Uso de tesauros y otros vocabularios controlados Alberto González Talaván Unidad de Coordinación de GBIF España

Tesauros y vocabularios controlados (1/22) Esquema 1.Definiciones 2.Beneficios del uso de tesauros 3.Fases del proceso de captura de información afectadas 4.Ámbitos afectados a)Taxonómico (¿Qué?) b)Geográfico (¿Dónde?) c)Autoría y tiempo (¿Quién?, ¿Cuándo?) d)Metodología y metadatos (¿Cómo?) Uso de tesauros y otros vocabularios controlados

Tesauros y vocabularios controlados (1/22) Esquema 1.Definiciones 2.Beneficios del uso de tesauros 3.Fases del proceso de captura de información afectadas 4.Ámbitos afectados a)Taxonómico (¿Qué?) b)Geográfico (¿Dónde?) c)Autoría y tiempo (¿Quién?, ¿Cuándo?) d)Metodología y metadatos (¿Cómo?) Uso de tesauros y otros vocabularios controlados

Tesauros y vocabularios controlados (2/22) Definiciones Véase: Un tesauro se podría definir (de manera algo informal como): Un listado de términos o temas (que pueden estar constituidos por más de una palabra), relacionados entre sí jerárquicamente, que en ciencias de la información se utilizan con fines de archivo y recuperación de documentos De manera general, debería incluir lo siguiente: 1. Un listado de términos preferidos 2. Un listado de sinónimos de esos términos (descriptores) 3. Una jerarquía o descripción de las relaciones entre los términos. 4. Una definición para los términos, de modo que se facilite su uso. 5. Un conjunto de reglas de utilización del tesauro. Como vocabularios controlados se entienden al conjunto de términos característicos de un determinado campo del saber, utilizados por los especialistas en esa área.

Tesauros y vocabularios controlados (3/22) Esquema 1.Definiciones 2.Beneficios del uso de tesauros 3.Fases del proceso de captura de información afectadas 4.Ámbitos afectados a)Taxonómico (¿Qué?) b)Geográfico (¿Dónde?) c)Autoría y tiempo (¿Quién?, ¿Cuándo?) d)Metodología y metadatos (¿Cómo?) Uso de tesauros y otros vocabularios controlados

Tesauros y vocabularios controlados (3/22) Esquema 1.Definiciones 2.Beneficios del uso de tesauros 3.Fases del proceso de captura de información afectadas 4.Ámbitos afectados a)Taxonómico (¿Qué?) b)Geográfico (¿Dónde?) c)Autoría y tiempo (¿Quién?, ¿Cuándo?) d)Metodología y metadatos (¿Cómo?) Uso de tesauros y otros vocabularios controlados

Tesauros y vocabularios controlados (4/22) Beneficios del uso de tesauros Entre los BENEFICIOS directos que pueden obtenerse del uso de los tesauros se pueden destacar: 1. Aumento de la calidad de los datos almacenados, pues aumentan los usos potenciales que se pueden dar a la información. 2. Aumento en la interoperabilidad de las bases de datos. Al cotejarse distintos grupos de datos de la misma naturaleza con los mismos parámetros las posibilidades de realizar análisis conjuntos de los datos aumenta. 3. Se crean bases de datos de conocimiento que pueden reutilizarse en otras disciplinas (ej: localidades históricas) 4. Facilitan la consulta y uso sistemático de datos, si se integran en los sistemas de explotación y consulta.

Tesauros y vocabularios controlados (5/22) Esquema 1.Definiciones 2.Beneficios del uso de tesauros 3.Fases del proceso de captura de información afectadas 4.Ámbitos afectados a)Taxonómico (¿Qué?) b)Geográfico (¿Dónde?) c)Autoría y tiempo (¿Quién?, ¿Cuándo?) d)Metodología y metadatos (¿Cómo?) Uso de tesauros y otros vocabularios controlados

Tesauros y vocabularios controlados (5/22) Esquema 1.Definiciones 2.Beneficios del uso de tesauros 3.Fases del proceso de captura de información afectadas 4.Ámbitos afectados a)Taxonómico (¿Qué?) b)Geográfico (¿Dónde?) c)Autoría y tiempo (¿Quién?, ¿Cuándo?) d)Metodología y metadatos (¿Cómo?) Uso de tesauros y otros vocabularios controlados

Tesauros y vocabularios controlados (6/22) Fases del proceso de captura de datos afectadas Captura y registro de los datos en el momento de la recogida/avistamiento Manipulación de los datos previa a la digitalización Identificación de la muestra y de su registro Digitalización de los datos Documentación de los datos (metadatos) Almacenamiento y archivo de los datos Presentación de los datos y publicación Analisis y manipulación de los datos (uso) Origen: A. Chapman, 2005 Identificación de la muestra y de su registro Digitalización de los datos Documentación de los datos (metadatos) Almacenamiento y archivo de los datos

Tesauros y vocabularios controlados (7/22) Esquema 1.Definiciones 2.Beneficios del uso de tesauros 3.Fases del proceso de captura de información afectadas 4.Ámbitos afectados a)Taxonómico (¿Qué?) b)Geográfico (¿Dónde?) c)Autoría y tiempo (¿Quién?, ¿Cuándo?) d)Metodología y metadatos (¿Cómo?) Uso de tesauros y otros vocabularios controlados

Tesauros y vocabularios controlados (7/22) Esquema 1.Definiciones 2.Beneficios del uso de tesauros 3.Fases del proceso de captura de información afectadas 4.Ámbitos afectados a)Taxonómico (¿Qué?) b)Geográfico (¿Dónde?) c)Autoría y tiempo (¿Quién?, ¿Cuándo?) d)Metodología y metadatos (¿Cómo?) Uso de tesauros y otros vocabularios controlados

Tesauros y vocabularios controlados (8/22) Ámbitos ¿Qué? ¿Dónde?¿Cuándo? ¿Quién?¿Cómo? Listados taxonómicos Nomenclator, gazeteers Protocolos de recogida y tratamiento de datos Directorios de investigadores/colectores Referencias temporales Registro Biológico

Tesauros y vocabularios controlados (9/22) Esquema 1.Definiciones 2.Beneficios del uso de tesauros 3.Fases del proceso de captura de información afectadas 4.Ámbitos afectados a)Taxonómico (¿Qué?) b)Geográfico (¿Dónde?) c)Autoría y tiempo (¿Quién?, ¿Cuándo?) d)Metodología y metadatos (¿Cómo?) Uso de tesauros y otros vocabularios controlados

Tesauros y vocabularios controlados (9/22) Esquema 1.Definiciones 2.Beneficios del uso de tesauros 3.Fases del proceso de captura de información afectadas 4.Ámbitos afectados a)Taxonómico (¿Qué?) b)Geográfico (¿Dónde?) c)Autoría y tiempo (¿Quién?, ¿Cuándo?) d)Metodología y metadatos (¿Cómo?) Uso de tesauros y otros vocabularios controlados

Tesauros y vocabularios controlados (10/22) Taxonomía: ¿Qué? La nomenclatura y la taxonomía son ámbitos en los que la utilización de tesauros o listas de referencia mejor demuestra su valor. Muchas iniciativas tienen como objetivo la realización de listados taxonómicos, de los que nos podemos beneficiar a la hora de determinar y aumentar la calidad de nuestros datos: RECURSOS GLOBALES Species 2000: Acceso a través de internet o en CD ITIS: Integrated Taxonomic Information System uBio: Universal Biological Indexer and Organizer

Tesauros y vocabularios controlados (11/22) Taxonomía: ¿Qué? RECURSOS restringidos por ÁREA GEOGRÁFICA y/o GRUPO TAXONÓMICO Euro+MED Plant Base FAUNA EUROPAEA: acceso a través de internet FLORA EUROPAEA MarBef

Tesauros y vocabularios controlados (12/22) Taxonomía: ¿Qué? RECURSOS restringidos por ÁREA GEOGRÁFICA y/o GRUPO TAXONÓMICO (cont.) FAUNA IBÉRICA: base de datos IBERFAUNA FLORA IBERICA Vean también

Tesauros y vocabularios controlados (13/22) Esquema 1.Definiciones 2.Beneficios del uso de tesauros 3.Fases del proceso de captura de información afectadas 4.Ámbitos afectados a)Taxonómico (¿Qué?) b)Geográfico (¿Dónde?) c)Autoría y tiempo (¿Quién?, ¿Cuándo?) d)Metodología y metadatos (¿Cómo?) Uso de tesauros y otros vocabularios controlados

Tesauros y vocabularios controlados (13/22) Esquema 1.Definiciones 2.Beneficios del uso de tesauros 3.Fases del proceso de captura de información afectadas 4.Ámbitos afectados a)Taxonómico (¿Qué?) b)Geográfico (¿Dónde?) c)Autoría y tiempo (¿Quién?, ¿Cuándo?) d)Metodología y metadatos (¿Cómo?) Uso de tesauros y otros vocabularios controlados

Tesauros y vocabularios controlados (14/22) Geografía: ¿Dónde? La multitud de ámbitos en los que se utiliza la INFORMACIÓN GEOGRÁFICA hace que los recursos donde se puede consultar esta información sean muy variados. Respecto a la información geográfica, los procesos más habituales a realizar son: Comprobación de las localidades registradas (ortografía, etc.) Asignación de datos geográficos precisos (coordenadas) a registros que carecen de esta información, lo que se denomina georreferenciación retrospectiva. RECURSOS GLOBALES

Tesauros y vocabularios controlados (15/22) Geografía: ¿Dónde? Infraestructuras de Datos Espaciales Comprende los portales web, los servicios, los datos y metadatos y otro tipo de información geográfica que se ofrecen de manera integrada, en general asociada a un determinada área geográfica Infraestructura de Datos Espaciales de España – IDEE: Incluye un servicio de nomenclátor, además de servidores de mapas y otros recursos geográficos. Otras infraestructuras de datos espaciales regionales: Andalucía: Asturias: Cataluña: Castilla y León: Galicia: Islas Canarias: Murcia: Navarra: La Rioja:

Tesauros y vocabularios controlados (16/22) Esquema 1.Definiciones 2.Beneficios del uso de tesauros 3.Fases del proceso de captura de información afectadas 4.Ámbitos afectados a)Taxonómico (¿Qué?) b)Geográfico (¿Dónde?) c)Autoría y tiempo (¿Quién?, ¿Cuándo?) d)Metodología y metadatos (¿Cómo?) Uso de tesauros y otros vocabularios controlados

Tesauros y vocabularios controlados (16/22) Esquema 1.Definiciones 2.Beneficios del uso de tesauros 3.Fases del proceso de captura de información afectadas 4.Ámbitos afectados a)Taxonómico (¿Qué?) b)Geográfico (¿Dónde?) c)Autoría y tiempo (¿Quién?, ¿Cuándo?) d)Metodología y metadatos (¿Cómo?) Uso de tesauros y otros vocabularios controlados

Tesauros y vocabularios controlados (17/22) Autoría y Tiempo: ¿Quién? ¿Cuándo? Es sin duda un campo mucho más restringido, y donde es más difícil encontrar listados de referencia. Sin embarso, es relativamente sencillo elaborar un listado restringido de las distintas personas que han contribuido en una determinada colección de historia natural, o proyecto de investigación: colectores, determinadores, etc. Es en trabajos sobre la historia de la biología o donde se analizan determinadas expediciones históricas o la biografía de un determinado investigador es donde esta información puede adquirir gran relevancia: cotejar los rangos temporales con la distribución geográfica de las muestras puede ayudarnos a localizar lagunas e inconsistencias.

Tesauros y vocabularios controlados (18/22) Autoría y Tiempo: ¿Quién? ¿Cuándo? Algunas referencias genéricas: García-Valdecasas, A., Bello, E. & Becerra, J M., Directorio de Taxónomos (DIRTAX). Graellsia. Monografía nº 1: Informe de colecciones de historia natural en España (BioCASE – GBIF España) Base de datos mundial de taxónomos ¿ Index herbariorum: a guide to the location and contents of the world's public herbaria, Part 2: Collectors. 7 volúmenes.

Tesauros y vocabularios controlados (19/22) Esquema 1.Definiciones 2.Beneficios del uso de tesauros 3.Fases del proceso de captura de información afectadas 4.Ámbitos afectados a)Taxonómico (¿Qué?) b)Geográfico (¿Dónde?) c)Autoría y tiempo (¿Quién?, ¿Cuándo?) d)Metodología y metadatos (¿Cómo?) Uso de tesauros y otros vocabularios controlados

Tesauros y vocabularios controlados (19/22) Esquema 1.Definiciones 2.Beneficios del uso de tesauros 3.Fases del proceso de captura de información afectadas 4.Ámbitos afectados a)Taxonómico (¿Qué?) b)Geográfico (¿Dónde?) c)Autoría y tiempo (¿Quién?, ¿Cuándo?) d)Metodología y metadatos (¿Cómo?) Uso de tesauros y otros vocabularios controlados

Tesauros y vocabularios controlados (20/22) Metodología y metadatos: ¿Cómo? A nivel de METODOLOGÍA podemos registrar información a distintos niveles del proceso de tratamiento de los datos, si disponemos de la misma: 1. Los métodos utilizados para construir cada juego de datos del sistema. 2. Los atributos registrados en cada juego de datos o para cada unidad biológica. 3. Los métodos que se han utilizado para obtener el valor de cada atributo. 4. Las personas responsables del desarrollo y/o ejecución de estos métodos.

Tesauros y vocabularios controlados (21/22) Metodología y metadatos: ¿Cómo? La página web del Sistema de Información sobre Biodiversidad de Colombia ofrece gran cantidad de información sobre métodología, pero también sobre los otros temas tratados en esta presentación: Permite una realizar una evaluación de la precisión del juego de datos, dependiendo de la descripción de sus métodos y atributos. Permite repetir una determinada metodología, y aceptar/rechazar los datos obtenidos con anterioridad. Puede convertirse en una referencia para otros estudios similares. Permite contactar con quien realiza este tipo de labores para obtener más información Esta información nos abre muchas posibilidades:

Tesauros y vocabularios controlados (22/22) Dos apuntes finales Los recursos utilizados a la hora de cotejar, corregir, ampliar… nuestros datos, merecen el debido reconocimiento y el respeto a sus derechos de propiedad intelectual. Las aplicaciones de software que se desarrollan en la Unidad de Coordinación de GBIF España disponen de herramientas de ayudas a la introducción de datos y de comprobación basadas en tesauros y vocabularios controlados. Sólo mencionar que:

Taller sobre calidad en bases de datos sobre biodiversidad Aula de informática del Real Jardín Botánico (CSIC) Madrid, septiembre 2007 Uso de tesauros y otros vocabularios controlados Alberto González Talaván Unidad de Coordinación de GBIF España Más información