Construyendo Bibliotecas Digitales Interoperables: Una Guía Práctica para crear Archivos Abiertos Ryan Richardson, Digital Library.

Slides:



Advertisements
Presentaciones similares
Diccionario de Datos (DD)
Advertisements

Los archivos e-prints como herramientas para la gestión del conocimiento Eugenio Tardón Seminario Archivos de eprints: nuevo campo de trabajo para bibliotecas.
Centro de Intercambio de Información del Protocolo de Cartagena Guía de aprendizaje Recursos del CIISB.
Nau Gran dHivern Intr. a la creación y gestión de páginas web Introducción a la web.
La Internet científica de libre acceso:
Internet y tecnologías web
Exportación de datos a GBIF: - Servicio de alojamiento de datos de la Unidad de Coordinación - El modelo Darwin Core y su evolución - Exportar datos desde.
CUPS Configuración y Uso de Paquetes de Software
ADELA TORRES JONATHAN BEJARANO
EL CANJE ELECTRÓNICO, UN NUEVO SERVICIO EN LA BIBLIOTECA DIGITAL
Hacia un sistema institucional de costos 04 / 12 / 09 Sitio Web para descarga de productos SC Dirección General de Planeación y Desarrollo en Salud.
CREACION DE ESPACIOS VIRTUALES PARA TRABAJO EN EQUIPO
Aplicación informática. formando parte de una red. pone sus recursos a disposición de las demás computadoras(clientes) de la red. Maneja información.
Servicios Web.
CCAA Salamanca, 20 y 21 de octubre 2008 Agrega: Repositorios de objetos de aprendizaje interoperables Antonio Sarasa, Manuel Canabal, Juan Carlos Sacristán,
Modelos de Datos Modelado y Diseño de Bases de Datos
Los alumnos, docentes e investigadores de las Universidades requieren acceso a información de calidad para llevar a cabo sus actividades academicas. Las.
"java del lado del servidor" Servlet y JSP Java Server Pages.
Interoperabilidad y difusión de contenido académico
INFOPATH.
An ACS development Parte 1 - Conceptos Historia de la web Web 1.0 Web 2.0 Web 3.0 Metadatos Dublin Core OAI-PMH Proveedores de datos Proveedores de servicios.
Características generales de un servicio Web.
Evaluación de Productos
Johanna Lizeth Rodríguez Lorena Fda. Chávarro Ramos
WOK para investigadores: Researcher ID Mayo 2010.
UNIVERSITAT DE BARCELONA Metadatos OAI-PMH Josep-Manuel Rodríguez-Gairín Màster Gestió Continguts Digitals
La recolección de metadatos y su aplicación en España Xavier Agenjo Francisca Hernández FESABID ª Jornadas Españolas de Documentación.
CGI.   Cuando el World Wide Web inició su funcionamiento como lo conocemos, empezando a tomar popularidad aproximadamente en 1993, solo se podía apreciar.
Centro de Recursos para el Aprendizaje y la Investigación – U.B. Proyecto SIRI Servicio de Recursos de Información para la docencia FESABID 2007 J. Casals,
Autor: Antonio Sarasa Cabezuelo Directora: María Antonia Huertas.
UNIDAD I Conceptos Básicos.
Juan Andrada Romero Jose Domingo López López.  Introducción  Conceptos  Arquitectura JXTA  Protocolos  Demostración  Alternativas  Conclusiones.
Koha-UDD y EBSCO Discovery Service
Biblioteca de la Universidad de Málaga
Gestión de recursos electrónicos en la Biblioteca de la Universidad Complutense de Madrid Inmaculada Fernández Ángeles Morillas Servicio de Tecnologías.
Instituto Politécnico Nacional Coordinación General de Servicios Informáticos REPOSITORIO DIGITAL INSTITUCIONAL (RDI)
Directrices DRIVER para proveedores de contenidos
OCLC Research: Proyectos particulares Eric Childress Larry Olszewski Conferencia organizada por: Dpto. Biblioteconomía y Documentación Universidad Carlos.
Servicios Web. Servicios web Son programas con funcionalidad accesible a través de protocolo http que permiten la ejecución remota de métodos y funciones.
InfoPath Ventajas y Uso.
Correo electrónico Internet
Consulta Federada usando OA-Hermes Consulta Federada usando OA-HERMES Día Virtual: Avances y perspectivas de la Red Abierta de Bibliotecas Digitales (RABiD)
OAI y Metalib El desarrollo de la biblioteca digital con CATIA. Por Enrique Martínez y Federico Portas.
Placa Apertura. PROGRAMA EDUCACION, FORMACION Y EMPLEO PARA LA SOSTENIBILIDAD Campus Mintur – Repotur - Educatur Comunidades Virtuales de Aprendizaje.
Modelos de Bases de Datos
DESARROLLO DE PÁGINAS EN EL WEB Preparado por Prof. Edgar Lopategui Corsino.
Tecnologías web. Es el método más común de intercambio de información en la world wide web, el método mediante el cual se transfieren las páginas web.
Placa Apertura. PROGRAMA EDUCACION, FORMACION Y EMPLEO PARA LA SOSTENIBILIDAD Campus Mintur – Repotur - Educatur Comunidades Virtuales de Aprendizaje.
PORTAL WEB PARA CONTRIBUIR EN LA VENTA, COMERCIALIZACIÓN Y DISTRIBUCIÓN DE LA ZEOLITA NATURAL USANDO AJAX Integrantes: Martha Isabel Correa Barrera Patricia.
Conceptos básicos sobre Internet
CICLO DE VIDA Y NORMAALIZACION DE UN SISTEMA DE BASE DE DATOS
Importancia en la efectividad del:
FESABID 2005 Mesa redonda: Gestión de contenidos y gestión documental: la integración de la información en la empresa Actuación de la Biblioteca en el.
Cybertesis: organizando una red en Chile y Latinoamérica
Teoría de Sistemas Operativos Sistemas Archivos de Red
REQUISITOS.
Modelo OSI Surgimiento del Modelo OSI ¿Que es el Modelo OSI?
Sistemas de Archivos Sistemas Operativos.  Se debe proporcionar un almacenamiento secundario que respalda a la memoria principal  El Sistema de archivos.
FACULTAD: CIENCIAS ECONÓMICAS Y EMPRESARIALES ASIGNATURA: GESTIÓN DE CONTENIDO ELECTRÓNICO TÍTULO: TINFOPATH - VENTAJAS Y USO. AUTORA: MARIA DANIELA TOMALÁ.
TRUCOS DE BUSQUEDA DE RESULTADOS DE CÁLCULOS MATEMÁTICOS Wolfram Alpha Es un buscador de respuestas desarrollado por la compañía Wolfram Research. Es.
DISEÑO CURRICULAR Presentado por: Cesar Augusto Sáenz María Alejandra Hernández 1.contenidos curriculares de competencia.
Punto 1 – Introducción al servicio Juan Luis Cano.
Internet Internet es una red de alcance mundial, compuesta por redes de datos privadas y públicas que se comunican entre si, independientemente del hardware.
/20 1 Registro e Identificadores Alejandra Sánchez Maganto.
Servicios Web Conjunto de aplicaciones o de tecnologías con capacidad para interoperar en la Web. Estas aplicaciones o tecnologías intercambian datos entre.
Repositorio Institucional de Tesis
Repositorios de recursos digitales educativos
GESTIÓN Y ADMINISTRACIÓN WEB. INTRODUCCIÓN A INTERNET Internet constituye una vía de comunicación y una fuente de recursos de información a escala mundial.
METADATOS QUE SON LOS METADATOS? SON LOS DATOS DE LOS DATOS Los metadatos forman parte de un elemento de ArcGIS. Archivo xml complementario En los metadatos.
CD. VICTORIA, TAMAULIPAS FEBRERO DEL  La interfaz del software es independiente y no está dentro del código.  Permite a los usuarios cambiar.
Transcripción de la presentación:

Construyendo Bibliotecas Digitales Interoperables: Una Guía Práctica para crear Archivos Abiertos Ryan Richardson, Digital Library Research Lab Virginia Tech

Amigos 2002 Slide 2 1. Introducción ¿Qué es la OAI? Motivación Caso de Estudio: NDLTD

Amigos 2002 Slide ¿Qué es la OAI ? ¿Qué es la Iniciativa de Archivos Abiertos (OAI)? Es una organización dedicada a resolver problemas de interoperabilidad en bibliotecas digitales, definiendo protocolos simples, últimamente aplicados al intercambio de metadatos. ¿Qué es el Protocolo para Recolección de Metadatos? Es un protocolo para pasar metadatos desde archivos fuentes a un archivo de destino.

Amigos 2002 Slide Motivación Existencia de archivos establecidos pero independientes Necesidad de servicios que involucran varios archivos (como buscadores) Falta de tecnologías interoperables de bajo precio Experiencia de proyectos anteriores (por ejemplo Dienst)

Amigos 2002 Slide Caso de estudio: NDLTD NDLTD es la Biblioteca Digital Interconectada de Tesis y Disertaciones Colecciones múltiples e independientes de documentos electrónicos, basadas en distintas universidades Virginia Tech Rhodes U. U.Waterloo Biblioteca Internacional de ETD OAI Protocolo Para Recolectar Metadatos

Amigos 2002 Slide 6 2. Definiciones / Conceptos Principios Básicos ¿Qué es un Archivo Abierto? Recolección frente a Federación Los metadatos frente a los datos Proveedores de los datos y servicios Tecnología subyacente HTTP y XML XML, espacios de nombres y esquema de XML Políticas de los Protocolos Unicidad y Persistencia ¿Qué es un registro? La multiplicidad de los metadatos Los conjuntos Los “matasellos” (datestamps) de fecha, recolección y control de flujo

Amigos 2002 Slide ¿Qué es un Archivo Abierto ? Cualquier sistema, basado en el WWW, que se puede acceder a través de la interfaz del Protocolo para Recolección de Metadatos … o sea, un Repositorio que cumple con OAI No tiene implicaciones en cuanto a: Almacenamiento físico de los datos Precio de los datos Formatos de los metadatos y datos Control de acceso al servidor

Amigos 2002 Slide Recolectar frente a Federación Dos enfoques diferentes de interoperabilidad Federación: Servicios que corren remotamente. La información está almacenada descentralizadamente (p. ej. búsquedas federadas) Recolección: Los datos/metadatos se transfieren de la fuente al punto donde los servicios están localizados (p. ej. unión de catálogos) Federación requiere más esfuerzo en cada fuente, pero es más fácil para el sistema local. Recolectar requiere más esfuerzo en el sistema local, pero es más simple para los proveedores de datos. Actualmente OAI se centra en recolectar

Amigos 2002 Slide Metadatos frente a Datos Los datos describen objetos digitales o representaciones digitales de objetos Los metadatos dan información acerca del objeto (e.g. título, autor, etc.) OAI se centra en los metadatos, con el acuerdo implícito que los metadatos normalmente contienen enlaces útiles a la fuente de los objetos digitales

Amigos 2002 Slide Proveedores de Datos y Servicios Los proveedores de datos son entidades que poseen datos/metadatos y que están dispuestos a compartirlos (interiormente o exteriormente) vía protocolos bien definidos de OAI (p. ej. servidores de bases de datos) Los proveedores de servicios son entidades que recolectan datos de proveedores para proporcionar servicios de alto nivel a usuarios (p. ej. buscadores) OAI usa estes nombres para definir su modelo de cliente/servidor (datos=servidor, servicios=cliente)

Amigos 2002 Slide HTTP y XML El Protocolo para Recolección de Metadatos es protocolo de solicitud/respuesta casi sin estado Solicitudes y respuestas se envían vía el protocolo HTTP Las solicitudes se codifican como operaciones de GET/POST Las respuestas son documentos en XML bien formados

Amigos 2002 Slide Espacios de nombre y esquema de XML La consistencia y calidad de datos se aseguran usando descripciones de esquemas en XML para cada respuesta posible Se usan espacios de nombre de XML donde sea necesario definir claramente qué partes de las respuestas son metadatos en sí mismos, y cuales apoyan el protocolo de recolección de metadatos.

Amigos 2002 Slide Unicidad y Persistencia Cada registro debe ser direccionable únivocamente por un identificador distinto. Cada entidad de metadatos debe ser persistente, para garantizar que proveedores de servicios siempre puedan referirse a la fuente.

Amigos 2002 Slide ¿Qué es un registro ? Un registro es una estructura independiente de XML que se puede ser asociada con objetos digitales o físicos. Los registros se asocian normalmente con metadatos, no con datos. OAI promueve y apoya la recolección de registros. Estos contienen los metadatos y campos adicionales necesarios para la operación de recolección.

Amigos 2002 Slide Un Ejemplo de un Registro oai:enc:tut El tutorial de OAI en Amigos Ryan Richardson Español oai:enc:tut3md

Amigos 2002 Slide Multiplicidad de Metadatos Los metadatos pueden tener múltiples formatos Dublin Core es obligatorio. Se permite cualquier otro formato, con tal que tenga una codificación en XML. E.g. MARC (Bibliotecas), IMS (Educación), ETDMS (tesis/disertaciones), RFC1807 (Bibliografías)

Amigos 2002 Slide Los conjuntos Mecanismo (como parte del protocolo) para permitir la recolección de sub-colecciones No tienen semántica bien definida – es completamente dependiente en los proveedores locales de datos. Puede ser definido por acuerdo entre los proveedores de datos y de servicios. Ejemplos: temas, años, nombres de autores, preguntas de búsqueda

Amigos 2002 Slide Los matasellos (datestamps) Cada registro necesita un “matasellos” que indica su fecha de creación o modificación Los datestamps se usan para tener la recolección por rangos de fechas, y así permitir transferencias incremental de los metadatos desde un proveedor de datos a un proveedor de servicios

Amigos 2002 Slide El control de flujo El mecanismo de HTTP “retry-after” puede ser usado para demorar las respuestas de un cliente Los marcadores de reanudación (resumption tokens) pueden ser usados para devolver resultados parciales –el cliente recibe un marcador que puede presentar al servidor para recibir más resultados

Amigos 2002 Slide Requisitos para ser un proveedor de datos Fuente de los metadatos Tecnología de los servidores Datestamps Supresiones Identificadores únicos Asociación de metadatos

Amigos 2002 Slide La fuente de los metadatos Una base de datos en formato particular Una colección de registros de metadatos en formatos bien definidos ficheros en disco Es posible extraer dinámicamente o estáticamente los metadatos Una colección sintética

Amigos 2002 Slide Tecnología de los servidores Un servidor de WWW Es posible implementar el protocolo de muchas maneras Un script de CGI (Perl, C++, Java) Java Servlet PHP Se requiere un mecanismo de acceso a los metadatos (p.ej. bases de datos) Véase para una lista de plantillas de software en el dominio públicowww.openarchives.org Véase para software experimental de VTwww.dlib.vt.edu

Amigos 2002 Slide Datestamps Son necesarios para cada registro, para soportar la recolección por incrementos. Deben ser actualizados en cada adición/modificación/supresión para asegurar que los cambios son propagados correctamente Son diferentes de las fechas dentro de los metadatos – datestamps se usan solamente para recolectar

Amigos 2002 Slide Identificadores únicos Cada registro tiene que tener un identificador único Los identificadores tiene que ser URIs válidos Ejemplo: oai: : Cada identificador tiene que asociarse a un sólo registro, y siempre al mismo registro (para un formato dado de metadatos)

Amigos 2002 Slide Las supresiones Los archivos deben mantener un historial de los registros suprimidos, por identificador y por datestamp. Todos de los conjuntos de resultados del protocolo pueden indicar registros suprimidos Las supresiones deben ser almacenadas indefinidamente para propagarlas correctamente a todos los proveedores de servicios que recolectan en diferentes horarios

Amigos 2002 Slide Asociación de metadatos El proveedor debe asociar metadatos a los formatos que elija proporcionar a través de su interfaz de OAI Se requiere Dublin Core no calificado La mejor práctica es incluir un enlace a una página en la etiqueta que una persona pueda leer Se recomiendan: formatos nativos formatos basados en cada comunidad

Amigos 2002 Slide Protocolo para recolectar los metadatos Respuestas para servicio Identify ListMetadataFormats ListSets GetRecord ListIdentifiers ListRecords Multiplicidad de los metadatos Rangos de Fechas Resumption Tokens

Amigos 2002 Slide Identify Propósito: Devolver información general acerca del archivo y sus políticas Parámetros: Ninguno Ejemplo en una URL:

Amigos 2002 Slide Identify – Una respuesta

Amigos 2002 Slide ListMetadataFormats Propósito: Dar una lista de los formatos de metadatos soportados por el archivo, así como las localizaciones de sus esquemas y espacios de nombre Parámetros: identifier – para un registro específico (O) Ejemplo de una URL:

Amigos 2002 Slide ListMetadataFormats – Una respuesta

Amigos 2002 Slide ListSets Propósito: Proporcionar un listado jerárquico de los conjuntos en los que se pueden organizar los registros Parámetros: Ninguno Ejemplo de una URL:

Amigos 2002 Slide ListSets – Una respuesta

Amigos 2002 Slide GetRecord Propósito Devolver los metadatos para un único identificador en la forma de un registro de OAI Parámetros: identifier – id único para un registro (R) metadataPrefix – formato de los metadatos (R) Ejemplo de una URL: verb=GetRecord&identifier=oai:test:123&metadataPrefix=oai_dc

Amigos 2002 Slide GetRecord – Una respuesta

Amigos 2002 Slide ListIdentifiers Propósito: Hacer una lista de todos identificadores únicos que corresponden a registros en el repositorio Parámetros: from (de) – la fecha inicial (O) until (hasta) – la fecha final (O) set (conjunto) – el conjunto a recolectar de (O) resumptionToken – el mecanismo del control de flujo (X) Ejemplo de una URL:

Amigos 2002 Slide ListIdentifiers – Una respuesta

Amigos 2002 Slide ListRecords Propósito: Recuperar los metadatos de múltiples registros Parámetros: from (de) – la fecha inicial (O) until (hasta) – la fecha final (O) set (conjunto) – el conjunto a recolectar de (O) resumptionToken – el mecanismo del control de flujo (X) metadataPrefix – el formato de los metadatos (R) Ejemplo de una URL: verb=ListRecord&metadataprefix=oai_dc&from=

Amigos 2002 Slide ListRecords – Una respuesta

Amigos 2002 Slide Una multiplicidad de metadatos

Amigos 2002 Slide Los rangos de fechas

Amigos 2002 Slide Resumption tokens

Amigos 2002 Slide Las herramientas y casos de estudio Convalidador de Esquema XSV Caso de estudio : ARC Caso de estudio: NDLTD

Amigos 2002 Slide Validador de Esquema XSV

Amigos 2002 Slide Caso de estudio : ARC

Amigos 2002 Slide Caso de estudio: NDLTD Virginia TechU. OldenbergHumboldt U. NDLTD ETD Catálogo Unión VTLS VirtuaMARIAN Buscadores RecomendadorRemisión Otros servicios … …

Amigos 2002 Slide ¿Y ahora? Receta El futuro de OAI Enlaces

Amigos 2002 Slide Receta ¿EN REALIDAD QUIERO HACER ESTO? ¿Tengo un fuente de metadatos accesible? 1. ¿Tengo un servidor para albergar el script/programa de OAI? 2. ¿Puedo satisfacer los requisitos para ser un proveedor de los datos? 3. ¿Puedo escribir el código o modificar una plantilla o contratar un programador para hacer uno de los dos?

Amigos 2002 Slide El futuro de OAI OAI es una defensa para permitir un acceso más fácil a la información. Nuevos protocolos y nuevas herramientas para apoyar esta misión. Proyectos de investigación para probar la teoría que sostiene la arquitectura actual, p.ej. Cyclades

Amigos 2002 Slide Enlaces Open Archives Initiative OAI Metadata Harvesting Protocol Virginia Tech DLRL OAI Projects Repository Explorer NDLTD

Amigos 2002 Slide Más enlaces ARC Cross-Archive Search Service XML Schema Validator Dublin Core Metadata Initiative E-Prints DL-in-a-box XML Tools at W3C

Amigos 2002 Slide 52 ¡Es todo !