Datos Enlazados en la BNE: datos.bne.es Daniel Vila Suero Asunción Gómez-Pérez Facultad de Informática, Universidad Politécnica de Madrid Campus de Montegancedo.

Slides:



Advertisements
Presentaciones similares
Catalogación en contexto
Advertisements

Usando las bibliotecas digitales Libros hechos bits Residencia de Estudiantes, 30 de marzo de 2006 Miguel Jiménez Madrid
21-23 DE NOVIEMBRE 2007 II PLAN ESTRATÉGICO LINEA Nº 2
La gestión de los recursos electrónicos en la Biblioteca Complutense
Libro Blanco XBRL Objetivos del grupo de Tecnología de XBRL España: Objetivo general: Facilitar a las entidades interesadas en implantar XBRL el acceso.
La BNE en VIAF VIAF en la BNE Departamento de Proceso Técnico Ricardo Santos Muñoz – Jefe de Sección de Autoridades Servicio de Coordinación y Normalización.
UNIDAD III La documentación bibliográfica en agroindustria
Guía del Catálogo de la Biblioteca Introducción Tutorial del catálogo de la Biblioteca El objetivo de esta guía es que el usuario conozca las herramientas.
Cómo consultar una base de datos en 5 minutos
Tutorial de Catálogo en Línea (OPAC) 2013
La web semántica y su impacto en la recuperación de información
Sistema desarrollado Control de la Producción
Servicios Web.
Servicios y recursos de información para profesores de español Biblioteca DÁMASO ALONSO Instituto Cervantes Dublín
Buscar bibliografía en
BIBLIOTECA VIRTUAL DE LA PROVINCIA DE MÁLAGA
Cómo consultar una base de datos o un catálogo en 5 minutos
Guía del Catálogo de la Biblioteca.
El portal de recursos electrónicos de la UAM
Instituto de Investigaciones Facultad de Cs. Económicas y Sociales Centro de Documentación Taller de ACCESO a la INFORMACIÓN ECONÓMICA Y SOCIAL.
El Buscón METABUSCADOR de la BNE Eduardo Anglada Monzón
Como usar el Catálogo Bello Guía práctica Acceso al catálogo  Se puede acceder al catálogo desde cualquier parte del mundo por Internet.  Es posible.
SFX: GESTOR DE ENLACES Marina Gómez García
CATÁLOGO AUTOMATIZADO
El portal de recursos-e de la Biblioteca de la Universidad de Navarra
Curso Linked Data para bibliotecas y repositorios digitales Daniel Vila Suero Ontology Engineering Group, Universidad Politécnica de Madrid.
Módulo 1.b Antecedentes: FRBR/FRAD
Introducción a Linked Data y conceptos básicos Daniel Vila Suero Ontology Engineering Group, Universidad Politécnica de Madrid Agradecimientos:
Importación de registros del repositorio institucional al catálogo (de DC a Marc21 y viceversa) Antonio Juan Prieto Jiménez Jordi Serrano-Muñoz Universitat.
Biblioteca de la Universidad de Málaga
Barbara B. Tillett, Ph.D. Policy & Standards Division, Library of Congress (División de Políticas y Estándares, Biblioteca del Congreso EE.UU. ) Traducción.
SPEDECE Barcelona Octubre Compartir libremente el conocimiento Jesús Arriaga García de Andoaín Universidad Politécnica de Madrid Barcelona,
Coordinación de Bibliotecas UAEM
OCLC Research: Proyectos particulares Eric Childress Larry Olszewski Conferencia organizada por: Dpto. Biblioteconomía y Documentación Universidad Carlos.
“Calidad de los Datos Espaciales”
Consulta Federada usando OA-Hermes Consulta Federada usando OA-HERMES Día Virtual: Avances y perspectivas de la Red Abierta de Bibliotecas Digitales (RABiD)
Almacenamiento de la información Conabio CNA INEGI Conanp Profepa INE Otras dependencias Conafor Semarnat.
Introducción a las Bases de Datos Relacionales Juan Alberto Sigüenza Escuela Técnica Superior de Informática Universidad Autónoma de Madrid.
CONTEXTA Introducción a FEDORA y modelos de extensión que provee Pablo Inostroza Valdera 11 de julio de 2007.
4º SIMPOSIUM INTERNACIONAL DE BIBLIOTECAS DIGITALES
1 Content Management Server for OpenCourseWare Guillermo de la Torre Oficina OCW-UPM Universidad Politécnica de Madrid.
Filiberto Felipe Martínez Arellano
UNIVERSIDAD NACIONAL DE CÓRDOBA CONSEJO DE DIRECTORES DE BIBLIOTECAS Curso Taller Metadatos para documentos digitales Biblioteca Manuel Belgrano Facultad.
Presenta: Lic. Gloria Concepción Tenorio Sepúlveda. Asesor Tutor: Mtro. Fernando Gustavo Lozano Martínez. Asesor Titular: Dra. María Soledad Ramírez Montoya.
APLICACIÓN DE NUEVAS TECNOLOGÍAS EN LA CONSERVACIÓN Y ANÁLISIS DEL PATRIMONIO CULTURAL Pensar Relacionalmente: Bases de Datos Relacionales (una visión.
Los catálogos.
SESIÓN DE INICIO A LOS RECURSOS BIBLIOGRÁFICOS Y LOS SERVICIOS DE LA BIBLIOTECA.
CATÁLOGO AUTOMATIZADO
Recursos en la UCM y principales plataformas en uso Novedades en los catálogos complutenses: Cisne, Compludoc, Complured y la plataforma de revistas electrónicas.
REPERTORIOS BIBLIOGRÁFICOS (BIBLIOGRAFÍAS)
Web Semántica La Web Semántica es la nueva generación de la Web, que intenta realizar un filtrado automático preciso de la información. Para ello, es necesario.
COLEGIO DE BACHILLERES “XOCHIMILCO TEPEPAN” Nº13  Tecnologías de la Información y comunicación 3.  Profa. Gabriela Pichardo Lazardo EQUIPO 25  Emmanuel.
María Magdalena Balbi FADU-UBA I Encuentro Nacional de Catalogadores el uso de metadatos para la recuperación de objetos digitales en el Portal Electrónico.
Biblioteca de Arquitectura. Universidad de Sevilla. Curso 13/14 Máster Universitario en Arquitectura y Patrimonio Histórico.
WEB 2.0 sitios web que facilitan el compartir información, la interoperabilidad, el diseño centrado en el usuario y la colaboración en la World Wide.
Análisis de una web semántica Pablo López Escobés Tecnologías emergentes en sistemas telemáticos MUI-TIC Noviembre 2009.
BIBLIOTECA DÁMASO ALONSO INSTITUTO CERVANTES-DUBLÍN Biblioteca DÁMASO ALONSO Instituto Cervantes Dublín Servicios y recursos.
CAMINANDO HACIA LA WEB SEMÁNTICA Jesualdo Tomás Fernández Breis Universidad de Murcia Taller sobre estándares Web W3C- 11 de noviembre de.
Software libre o gratuito de gestión bibliotecaria SIU – 6 y 7 de diciembre de 2011 Ministerio de Educación de la Nación A B C D Unidad de Biblioteca y.
UNIVERSIDAD EUROPEA DEL ATLÁNTICO Servicio de Biblioteca biblio.uneatlantico.es.
UBATIC: Entre proyectos DIGITALIZACIÓN Secretaría de Asuntos Académicos Rectorado de la Universidad de Buenos Aires.
INTERFAZ DE ACCESS  Access es un sistema gestor de bases de datos relacionales (SGBD). Una base de datos suele definirse como un conjunto de información.
Sistema de Alerta Rápida Interna SINAVEF. Alertas Sinavef Al ingresar a la parte privada del sistema de alerta nos encontramos con el menú principal el.
¿QUÉ ES EL MODELO ENTIDAD-RELACIÓN?  Como ya he comentado este modelo es solo y exclusivamente un método del que disponemos para diseñar estos esquemas.
INTRODUCCIÓN A LOS SERVICIOS BIBLIOTECARIOS Facultad de Farmacia UCM Curso
Recursos bibliográficos y gestión de la información
[IGN + UPM] con financiación de la AECI Madrid, junio-julio de 2006 Carmen Muñoz-Cruzado García Universidad Politécnica de Madrid Curso IDEs El Nomenclátor.
Internet Infranet Protocolo World Wide Web Hipertexto Página web Sitio web Protocolo http Código HTML Editores HTML Portal Url Navegadores: A. Internet.
Antonio de Jesús González Arce Matricula DHTIC.
La implementación de un repositorio institucional : procesos, retos y estrategias Seminario presentado en tres sesiones por Carol Hixson Jefa del Servicio.
Transcripción de la presentación:

Datos Enlazados en la BNE: datos.bne.es Daniel Vila Suero Asunción Gómez-Pérez Facultad de Informática, Universidad Politécnica de Madrid Campus de Montegancedo sn, Boadilla del Monte, Madrid Acknowledgements: M. Hernández Agustí, M. Jiménez Piano, A. Manchado, R. Santos, E. Escolano, B. Villazón, E. Montiel- Ponsoda II Jornada sobre la Reutilización de la Información del Sector Público Madrid, España 15 de Febrero de 2012

Indice 1.Los datos enlazados de forma intuitiva 2.Los fundamentos 3.El proceso 4.Marimba 5.Conclusiones 2

¿Quién ha traducido “El Quijote” a otros idiomas? Múltiples fuentes de datos multilingües La información local puede estar incompleta La información remota no es accesible de manera sencilla

Consultas complejas sobre diferentes fuentes de datos 4 / / ¿Cuántos obras escritas por Miguel de Cervantes Saavedra están registradas en La BNE y en la DNB?

Datos de las diferentes bibliotecas expuestos vía Web 5 BD de la BNE BD VIAF BD DNB BD DNB ¿Cuántos obras escritas por Miguel de Cervantes Saavedra están registradas en La BNE y en la DNB?

M. Cervantes Don Quixote Hebrew creator Translated into 1960 Year of publication VIAF located Integración de datos 6 M. Cervantes El Quijote Hebreo Autor Traducido en 1950 Año de Publicación BNE Ubicado en M. Cervantes Don Quijote Deutsch Autor Übersetzung 2011 P-Jahr Deutsche National Bibliothek M. Cervantes El Quijote Autor 1605 Año de Publicación BNE Ubicado en BD BNE BD VIAF BD DNB BD DNB

¿Qué necesitamos para responder a esa pregunta?

Indice 1.Los datos enlazados de forma intuitiva 2.Los fundamentos 3.El proceso 4.Marimba 5.Conclusiones 8

Utilidad de los datos enlazados Combinar datos de fuentes heterogéneas en diferentes formatos con diferente nivel de detalle en diferentes idiomas de diferentes países Facilitar la integración de datos © Slide adapted from “5min Introduction to Linked Data”- Olaf Hartig

Linked Open Data 10 Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch BNE

Los fundamentos Identificadores Unicos: URI identifican un nombre o un recurso en internet. Modelos en RDF(S) Cer El QuijoteCervantes Es autor Cer ObraPersona Es autor Es una Enlazar con otros datos Same As Cervantes Same As Cervantes Navegación a través de los datos

El modelo (Ontología) y los datos 12 Obra Lengua Traducción Año Fecha de Publicación Biblioteca Ubicado en Persona Es autor Tiene como materia El Quijote Cervantes Es autor Catalán Traducción 1960 Fecha de Publicación BNE Ubicado en Tiene como materia Vida de Cervantes Ontología Datos

El modelo (Ontología) y los datos Traducción Año Fecha de Publicación Ubicado en Es autor Tiene como materia Es autor Traducción 1960 Fecha de Publicación BNE Ubicado en Tiene como materia Vida de Miguel de Cervantes Saavedra Don Quijote de la Mancha Cervantes Saavedra, Miguel de Catalán Ontología Datos Lengua Obra Biblioteca Persona

Indice 1.Los datos enlazados de forma intuitiva 2.Los fundamentos 3.El proceso de transformación 4.Marimba 5.Conclusiones 14

Especificación Especficación Modelado Generación RDF Generación RDF Publicación Generación de enlaces Generación de enlaces Explotación Registros en formato MARC millones registros bibliográficos 4.2 millones registros autoridad Versión: Noviembre 2011

Modelado: FRBR Obras Expresiones Manifestaciones Obra 1 Obra 2 Obra 3 Expresión 1 Expresión 2 Manifestació n1 Manifestaci ón2 Especficación Modelado Generación RDF Generación RDF Publicación Generación de enlaces Generación de enlaces Explotación

Ontología basada en vocabularios de IFLA Especficación Modelado Generación RDF Generación RDF Publicación Generación de enlaces Generación de enlaces Explotación

Marimba utiliza la ontología para generar RDF BNE Especficación Modelado Generación RDF Generación RDF Publicación Generación de enlaces Generación de enlaces Explotación

Marimba enlaza con otros recursos : VIAF, DNB, SUDOC, LIBRIS, DBpedia BNE Same As LIBRIS SUDOC DNB DBpedia VIAF Especficación Modelado Generación RDF Generación RDF Publicación Generación de enlaces Generación de enlaces Explotación

Especficación Modelado Generación RDF Generación RDF Publicación Generación de enlaces Generación de enlaces Explotación Marimba enlaza con otros recursos : VIAF, DNB, SUDOC, LIBRIS, DBpedia

Publicación Publicación de los datos Publicar los metadatos sobre el dataset con VOID Para facilitar el descubrimiento del dataset Registrar el conjunto de datos en DataHub Generar el sitemap usando sitemap4rdf Cargar el sitemap en Google y Sindice Especficación Modelado Generación RDF Generación RDF Publicación Generación de enlaces Generación de enlaces Explotación

Explotación de los datos select distinct COUNT(?Obras) where { ?Obras } URI Cervantes Is author Consultas SPARQL: Interfaz web Especficación Modelado Generación RDF Generación RDF Publicación Generación de enlaces Generación de enlaces Explotación

Funcionalidades de Marimba Objetivo: Transformar registros MARC a RDF Funcionalidades principales: Generación de RDF: A través de plantillas de mappings Generación de enlaces owl:sameAs con otros datasets (A partir de VIAF) Valor añadido: Ayuda a mejorar y limpiar los datos de origen (registros MARC 21), gracias a la información contenida en las plantillas de mappings 23

Marimba: Proceso de transformación a RDF y mappings IDENTIFICA CIÓN ANOTACI ÓN RELACIÓ N MAPPIN G A MAPPIN G B MAPPIN G C Mapping Identificación de Entidades: Dada una etiqueta de campos y una combinación de subcampos, se determina a qué entidad FRBR se relaciona. Por ejemplo: 100 $a $d  Persona (FRBR Grupo 2) 100 $a $t  Obra (FRBR Grupo 1)

Marimba: Proceso de transformación a RDF y mappings IDENTIFICA CIÓN ANOTACI ÓN RELACIÓ N MAPPIN G A MAPPIN G B MAPPIN G C Mapping Anotación de Entidades: Dada una etiqueta de campos y de subcampo, se determina qué propiedad o atributo de la entidad se anota: Por ejemplo: 100 $d  Fecha asociada a persona 100 $t  Titulo de la obra

Marimba: Proceso de transformación a RDF y mappings IDENTIFICA CIÓN ANOTACI ÓN RELACIÓ N MAPPIN G A MAPPIN G B MAPPIN G C Mapping Relación entre Entidades: Dados dos tipos de entidades E1 y E2 (e.g. Persona y Obra), y dado un identificador de subcampo que representa la variación de subcampos entre E1 y E2 en su punto de acceso principal y sabiendo que el valor del punto de acceso de E1 está contenido en E2, se determina que tipo de relación existe entre E1 y E2. Por ejemplo: Persona-Obra $t  Persona es creadora de Obra Obra-Obra $n  Obra es parte de Obra

Marimba: “Mejoras en los datos de origen” Durante las sucesivas iteraciones para generar RDF, se han producido mejoras en los registros de origen. Algunos ejemplos son: Se han identificado combinaciones de subcampos NO válidas de acuerdo al estándar MARC 21: Ejemplo: 100 $a $d $1 Se han identificado errores en la codificación de ciertas cadenas de caracteres: Ejemplo: BiografÃas. Se han identificado errores en algunos campos de control: Ejemplo: Se ha hallado un indicador en el campo 001, que no de acuerdo al estándar no presenta indicadores. 27

Marimba: Descubriendo enlaces con otros datasets Marimba utiliza VIAF como fuente para generar enlaces de equivalencia (owl:sameAs) a otros conjuntos de datos bibliográficos. Para ello, utilizando un fichero que contiene las correspondencias entre VIAF y las bibliotecas que participan en VIAF: 1)Localiza los Ids de la BNE y almacena su correspondiente en VIAF. 2)A partir de los IDs correspondientes en VIAF, genera enlaces a otras bibliotecas que también tienen una correspondencia con dichos IDs. 28

Modelado: Open Metadata Registry Neon Toolkit Mapeado y generación: MARiMbA: Orientado a bibliotecarios, soporta y facilita todo el proceso de transformación de MARC21 a RDF Publicación: Virtuoso Universal Server Pubby CKAN registry Sitemap4rdf Explotación: Aplicaciones Web que visualicen los datos usando SPARQL Soporte tecnológico

Otras Iniciativas de datos enlazados de bibliotecas Biblioteca Nacional Francesa Biblioteca del Congreso de EEUU Biblioteca Nacional Alemana Biblioteca Británica España: Lista de Encabezamientos de Materia para Bibliotecas Públicas del Ministerio de Cultura En SKOS Enlazados con RAMEAU y materias del LOC Biblioteca Virtual de la Escuela de Salamanca Casos de uso en el W3C: Biblioteca Virtual de Polígrafos Ontología del Patrimonio Cultural de Cantabria 30

Resultados datos.bne.es Número total de registros de autoridad: Número total de registros bibliográficos: Número total de tripletas RDF: Número de enlaces (15% autoridades): Fuentes enlazadas: VIAF SUDOC (Sistema Universitario de Documentación) FR GND (Autoridades Biblioteca Nacional Alemana) GER LIBRIS Suecia DBPedia 31