5ta. Jornada sobre Bibliotecas Digitales Universitarias El ciclo del conocimiento en el entorno académico 8 y 9 de Noviembre de 2007 Una experiencia con.

Slides:



Advertisements
Presentaciones similares
Publicación de las colecciones en CD ROM
Advertisements

Publicaciones científicas apoyadas con tecnologías de información Jorge Walters Gastelu Marzo de 2004 Santiago, Chile.
Operaciones catalográficas
Centro de Intercambio de Información del Protocolo de Cartagena Guía de aprendizaje Recursos del CIISB.
Los modelos normalizados y el Depósito digital de Cuentas
Exposición. Plan de digitalización La Biblioteca Nacional se propone poner en marcha en 2005 un plan estratégico de digitalización, articulado en torno.
El proceso de búsqueda, cont. Prof. Marisol Gutiérrez Rodríguez Prof. Zulma Quiles Miranda Proyecto Graduados Día 2.
Resource Description Framework CI-2413 Desarrollo de Aplicaciones para Internet.
5a Jornada sobre la Biblioteca Digital Universitaria El ciclo del conocimiento en el entorno académico El aumento de la visibilidad y la preservación de.
Gestión descentralizada de un portal cooperativo para la difusión de contenidos digitales Dra. Dominique Babini Consejo Latinoamericano de Ciencias Sociales.
1 GUÍA DE SERVICIOS PARA ALUMNOS Todo lo que le interesa saber sobre la Biblioteca de la Universidad de León BIBLIOTECA DE LA UNIVERSIDAD DE LEÓN.
NOTA: Para cambiar la imagen de esta dispositiva, seleccione la imagen y elimínela. A continuación haga clic en el icono Imágenes en el marcador de posición.
Administración del sitio web de la DGB
Uso de metadatos Dublín Core en sistemas de información en España
Recursos electrónicos en Bibliotecas Públicas Provinciales de Andalucía Granada 8 de marzo de 2007 Carmen Méndez Martínez Biblioteca Pública Provincial.
La web semántica y su impacto en la recuperación de información
Conceptos Generales XML.
SQL Server Integration Services SSIS
3a Jornada sobre la Biblioteca Digital Universitaria (JBD 2005) Tesis electrónicas en la UBP 3a Jornada sobre la Biblioteca Digital Universitaria (JBD.
Gestión descentralizada de un portal cooperativo para la difusión de contenidos digitales Dra. Dominique Babini Consejo Latinoamericano de Ciencias Sociales.
IDES - 20 de Noviembre Gestión descentralizada de un portal cooperativo para la difusión de contenidos digitales Dra. Dominique Babini Consejo Latinoamericano.
Mag. Gabriela Cabrera, Lic. Anibal Carro, Lic. Patricia Schiaffino
XXI Reunión del Foro de Directores y Responsables de Unidades de Información Documental Julio/2005 La explotación cooperativa de contenidos en el contexto.
Sindicación de contenidos: RSS. Introducción La necesidad de información Internet nos proporciona una ingente cantidad de información. Cada vez nos interesa.
Lenguajes de Ontologías Gustavo Núñez, Alvaro Rodriguez, Oscar Sena.
Características generales de un servicio Web.
Desarrollo de una red de bibliotecas virtuales con software libre
Planificación de la Información.
Índice Sesión I Bloque I (09:30 a 10:30 Horas) Configuración Inicial
Los metadatos, el nuevo Metadoc y la página maestra
Proyecto Biblioteca Digital de Tesis
43ª Reunión Nacional de Bibliotecarios 6ª Jornada de Bibliotecas de Ciencia y Tecnología 19 de abril de 2011 Centro de Información Biblioteca “Eduardo.
Introducción Esta ponencia pretende aportar una visión crítica sobre las Bibliotecas Digitales en el marco de la segunda revolución Gutenberg que supone.
Como usar el Catálogo Bello Guía práctica Acceso al catálogo  Se puede acceder al catálogo desde cualquier parte del mundo por Internet.  Es posible.
CATALOGACIÓN DE RECURSOS ELECTRÓNICOS MEDIANTE EL DUBLIN CORE Prof. Manuel Diosdado BDCV, El Colegio de México 17 de mayo de 2006.
Autor: Antonio Sarasa Cabezuelo Directora: María Antonia Huertas.
UNIDAD I Conceptos Básicos.
Ma. Antonieta Rodríguez CED-CELE. Contenido  eXe - Learning  Recursos didácticos para ambientes web.
Ingeniero Anyelo Quintero
Acceso del usuario a la aplicación.
Web Semántica M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción
HTML HyperText Markup Language (Lenguaje de Marcas de Hipertexto)
Guía para la búsqueda en el catálogo en línea (OPAC)
Lenguaje de Marcado.
Greenstone Basado en el trabajo de Jesús Tramullas Depto. CC. Documentación /Univ. de Zaragoza
Contenido: 1- Que es el .Net Framework 2- Arquitectura en .Net
Bases de datos Unidad de Servicios Electrónicos de Información Coordinación General SUBA.
Definición de Etiquetas Semánticas Dentro de la Tesis Digital para Realizar Búsquedas de Información Pertinente Dra. Rocío Abascal-Mena DC-2006, México.
Guía para la búsqueda en el catálogo en línea (OPAC)
Placa Apertura. PROGRAMA EDUCACION, FORMACION Y EMPLEO PARA LA SOSTENIBILIDAD Campus Mintur – Repotur - Educatur Comunidades Virtuales de Aprendizaje.
Tecnologías web. Es el método más común de intercambio de información en la world wide web, el método mediante el cual se transfieren las páginas web.
ESTE ARTICULO EXAMINA: LOS COMPONENTES DE UN SISTEMA DE INFORMACIÓN DE GESTIÓN DEL CICLO DE VIDA.
Placa Apertura. PROGRAMA EDUCACION, FORMACION Y EMPLEO PARA LA SOSTENIBILIDAD Campus Mintur – Repotur - Educatur Comunidades Virtuales de Aprendizaje.
UNIVERSIDAD NACIONAL DE CÓRDOBA CONSEJO DE DIRECTORES DE BIBLIOTECAS Curso Taller Metadatos para documentos digitales Biblioteca Manuel Belgrano Facultad.
Los catálogos.
Catálogo y Repositorio de Producción Científica de la UGR 1 PRODUCCIÓN CIENTÍFICA UGR Por Antonio Fernández Porcel Juan José Sánchez Guerrero.
Using e-technology in production, proofing and printing, and in marketing and promotion Jorge Walters Gastelu Metodologías y Tecnologías de Información.
MANUAL DE USO BASES DE DATOS Por: EBSCO Information Services
María Magdalena Balbi FADU-UBA I Encuentro Nacional de Catalogadores el uso de metadatos para la recuperación de objetos digitales en el Portal Electrónico.
UBATIC: Entre proyectos DIGITALIZACIÓN Secretaría de Asuntos Académicos Rectorado de la Universidad de Buenos Aires.
Gestión Electrónica Documental (GED)
FORMATO MARC21 FORMATO MARC: UN FORMATO BIBLIOGRAFICO. AUTOMATIZAR INFORMACIÓN BIBLIOGRÁFICA La automatización ha demostrado ser el medio más adecuado.
INSTRUCTIVO PARA EL MANEJO DE ZOTERO
Catálogo de Objetos Geográficos
/20 1 Registro e Identificadores Alejandra Sánchez Maganto.
Jornadas LEXNET II Diciembre de PROGRAMAS Creación PDF Impresora Virtual Escáner Firma PDF.
Servicios Web Conjunto de aplicaciones o de tecnologías con capacidad para interoperar en la Web. Estas aplicaciones o tecnologías intercambian datos entre.
Repositorio Institucional de Tesis
Guía del Catálogo de la UGR Búsqueda avanzada Actualización septiembre 2014.
Biblioteca Digital: Colección Documentos Tec Propuesta Proyecto Ene-Jun 2002.
Transcripción de la presentación:

5ta. Jornada sobre Bibliotecas Digitales Universitarias El ciclo del conocimiento en el entorno académico 8 y 9 de Noviembre de 2007 Una experiencia con el estándar XMP de Adobe y el software de Biblioteca Digital Greenstone Daniel H. Biset, Alejandra T. Chávez Flores Centro de Información – Centro Atómico Constituyentes Comisión Nacional de Energía Atómica

Antecedentes : Primeras experiencias en digitalización para envío de documentos al INIS 2001: Escaneo de Tesis del Instituto Sábato. Participación en :Long Term Archiving of Digital Documents in Physics. Lyon, Francia. 2002: Bases para el proyecto de preservación a largo plazo 2003: Inicio del Proyecto Piloto de Preservación a Largo Plazo Colecciones seleccionadas: Boletín Informativo Informes CNEA Memorias CNEA

Flujo de trabajo Catálogo CNEA Impresión Visualización ConsultaSelección Control de calidad Captura (Salida de TIFF) Conversión a PDF/A PDF JB2 y OCR Normalización (XENA) Descripción (Incorporación de Metadatos) Almacenamiento (Back-Up) Procesamiento con software de BibDig (incorporación automática de metadatos) Provisión de acceso INIS NLNZ Metadata Extractor BD Hist. CNEA

Consignas para la preservación Incorporar metadatos en el propio documento TIFF (política de preservación) Procesar con un software de biblioteca digital PDFs con metadatos incorporados Que el software extraiga automáticamente los metadatos Los metadatos residen en un archivo XMP

XMP eXtensible Metadata Platform Codificado como XML, usando estándar RDF (Resource Description Framework) Estandariza la definición, creación y procesamiento de metadatos Tecnología open-source Provee: un modelo de datos, un modelo de almacenamiento, dentro de un marco de trabajo extensible que puede ser usado para representar cualquier número de esquemas

RDF Una estructura para describir recursos de la web Provee un modelo de datos y una sintaxis Está escrito en XML Es parte de la actividad del W3C por la Web Semántica Es una recomendación del W3C

Modelo de metadatos XMP XMP define propiedades básicas para registrar la historia y descripción de un recurso; permite la integración de esquemas de metadatos tanto existentes como personalizados XMP soporta tres clases de datos: Propiedades de los metadatos Esquemas y Espacio de Nombres (namespace) Valores de las propiedades

Propiedades de Metadatos Siempre asociadas a un recurso: las propiedades son sobre (about) el recurso Recurso: un archivo o porción significativa de él. Una propiedad tiene un nombre y un valor Forma: El nombre_de_la_propiedad del recurso es valor_de_la_propiedad Ejemplo: El autor de Moby Dick es Herman Melville

Esquemas y Espacio de Nombres Esquema: conjunto de nombres de propiedades de alto nivel acompañados por tipos de datos e información descriptiva. Define la estructura donde registrar la información. Un esquema en XMP es identificado por su Espacio de Nombres XML (xmlns), un URI El uso de Espacios de Nombres evita conflictos entre propiedades de diferentes esquemas que tienen el mismo nombre pero diferentes significados. Por ejemplo: la propiedad Subject en el esquema PDF se refiere al asunto o descripción, mientras que en DC se refiere a palabras claves.

Valores de las propiedades tres categorías básicas Tipos simples: es un valor literal simple: cadena de caracteres, booleanos, números reales y enteros. Estructuras: una propiedad estructurada consiste de uno o más campos. Por ejemplo, una propiedad MaxPageSize cuyo tipo es Dimensions, con tres campos: alto, ancho, unidad Arrays: consiste en un conjunto de valores. XMP soporta tres tipos de arrays: 1)Array sin ordenar: una lista de valores cuyo orden no es significativo (dc:subject). Es referido como un bag 2)Array ordenado: una lista cuyo orden es significativo (dc:creator). Es referido como un seq 3)Array alternativo: conjunto de uno o más valores, uno de los cuales debe ser seleccionado (dc:title). Es referido como un alt

<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:pdf=' <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:xap=' T16:47:28-04: T16:47:27-04: T16:47:28-04:00 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:xapMM=' uuid:1aa bfef-1dd39b9b9ed8 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:dc=' application/pdf Matthew Beacom Reed Beaman Preservación digital Archivos digitales Metadatos Instrucciones de procesamiento XML comprendidas en el envoltorio del paquete XMP

<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:pdf=' <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:xap=' T16:47:28-04: T16:47:27-04: T16:47:28-04:00 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:xapMM=' uuid:1aa bfef-1dd39b9b9ed8 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:dc=' application/pdf Matthew Beacom Reed Beaman Preservación digital Archivos digitales Metadatos El elemento más extremo contiene un elemento x:xmpmeta, el cual contiene un elemento simple rdf:RDF

<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:pdf=' <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:xap=' T16:47:28-04: T16:47:27-04: T16:47:28-04:00 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:xapMM=' uuid:1aa bfef-1dd39b9b9ed8 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:dc=' application/pdf Matthew Beacom Reed Beaman Preservación digital Archivos digitales Metadatos El elemento rdf:RDF contiene uno o más elementos rdf:Description

<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:pdf=' <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:xap=' T16:47:28-04: T16:47:27-04: T16:47:28-04:00 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:xapMM=' uuid:1aa bfef-1dd39b9b9ed8 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:dc=' application/pdf Matthew Beacom Reed Beaman Preservación digital Archivos digitales Metadatos ESQUEMAS

<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:pdf=' /'> <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:xap=' T16:47:28-04: T16:47:27-04: T16:47:28-04:00 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:xapMM=' uuid:1aa bfef-1dd39b9b9ed8 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:dc=' application/pdf Matthew Beacom Reed Beaman Preservación digital Archivos digitales Metadatos Espacio de Nombres

<rdf:Description rdf:about ='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:pdf=' <rdf:Description rdf:about ='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:xap=' T16:47:28-04: T16:47:27-04: T16:47:28-04:00 <rdf:Description rdf:about ='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:xapMM=' uuid:1aa bfef-1dd39b9b9ed8 <rdf:Description rdf:about ='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:dc=' application/pdf Matthew Beacom Reed Beaman Preservación digital Archivos digitales Metadatos El elemento rdf:Description requiere un atributo rdf:about que puede ser usado para identificar el recurso que el XMP describe. Puede estar vacío o ser una URI basada en una UUID abstracta UUID (Universal Unique IDentifier): número aleatorio, se crea por la combinación de tiempo y dirección de la tarjeta de red Ethernet.

<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:pdf=' <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:xap=' T16:47:28-04: T16:47:27-04: T16:47:28-04:00 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:xapMM=' uuid:1aa bfef-1dd39b9b9ed8 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:dc=' application/pdf Matthew Beacom Reed Beaman Preservación digital Archivos digitales Metadatos Propiedades XMP de tipo simple XAP(eXtensible Authoring and Publishing): metadatos internos que se usaban en versiones anteriores de Adobe, mantenidos por razones de compatibilidad

<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:pdf=' <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:xap=' T16:47:28-04: T16:47:27-04: T16:47:28-04:00 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:xapMM=' uuid:1aa bfef-1dd39b9b9ed8 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:dc=' application/pdf Matthew Beacom Reed Beaman Preservación digital Archivos digitales Metadatos Propiedades XMP de tipo array sin ordenar: una lista de valores en la cual el orden no es significativo

<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:pdf=' <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:xap=' T16:47:28-04: T16:47:27-04: T16:47:28-04:00 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:xapMM=' uuid:1aa bfef-1dd39b9b9ed8 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc b8b643' xmlns:dc=' application/pdf Matthew Beacom Reed Beaman Preservación digital Archivos digitales Metadatos Propiedades XMP de tipo array ordenada: una lista en la cual el orden es importante

<rdf:Description rdf:about='uuid:4cde4cb6-4e5e b4-52cddc17dede' xmlns:pdf=' Acrobat Web Capture 6.0 <rdf:Description rdf:about='uuid:4cde4cb6-4e5e b4-52cddc17dede' xmlns:xap=' T13:51:02-03: T13:51:02Z T13:51:02-03:00 <rdf:Description rdf:about='uuid:4cde4cb6-4e5e b4-52cddc17dede' xmlns:xapMM=' uuid:26df a-48cf-884b-1880c8b6e6be <rdf:Description rdf:about='uuid:4cde4cb6-4e5e b4-52cddc17dede' xmlns:dc=' application/pdf Preservation metadata [IYLIM ] Propiedad XMP de tipo array alternativa: conjunto de uno o más valores, uno de los cuales debe ser seleccionado. No hay una regla específica para la selección de alternativas. En algunos casos la aplicación puede hacer la elección, en otros casos puede hacerla el usuario. El primer ítem del array es considerado el valor por defecto por el RDF

Paneles de ingreso de metadatos (Adobe Acrobat 6.0 Professional ) Esquema PDF Esquema DC Ubicación y denominación de la caja Keyword Palabras clave (Archivo Propiedades de documento) SubjectPalabras clave (Avanzadas Metadatos de documento) SubjectDescription Asunto (Archivo Propiedades de documento) Descripción (Avanzadas Metadatos de documento) AuthorCreatorAutor* (Archivo Propiedades de documento) Autor** (Avanzadas Metadatos de documento) * Si hay más de uno, se cargan como una sola ocurrencia tanto en el esquema PDF como en el DC ** Si hay más de uno, se carga solo el primero en el esquema PDF y se abren las ocurrencias necesarias en el DC

Procesando con Greenstone Archivo de colección collect.cfg – creator Dirección electrónica del creador de la colección – maintainer Dirección electrónica del actualizador de la colección – public Determina si la colección va a ponerse a disposición del público o no – indexes Lista de índices por crear – languages Lista de lenguas en las que hay que crear los índices – collectionmeta Define los metadatos al nivel de la colección – plugin Especifica un conector que habrá de utilizarse durante la creación – format Cadena de formato – classify Especifica un clasificador que habrá de utilizarse durante la creación –..:

Configuración de PDFPlug... Plugin GAPlug Plugin HTMLPlug -smart_block Plugin PDFPlug -metadata_fields Title,Author, Subject,Keywords Plugin MetadataXMLPlug Plugin ArcPlug Plugin RecPlug...

No recupera los esquemas xap y dc. Etiquetas con más de dos datos en una sola ocurrencia (dc. Creator, dc. Subject)

Creación de un nuevo plugin Consulta a la lista John Thompson (DL Consulting): …el veredicto es que el PDFPlug no soporta los metadatos de XMP…, y por ello … … escribió un nuevo Plugin para extraer esos metadatos: el MetadataXMPPlug

Nuevo Plugin: MetadataXMPPlug pluginGAPlug pluginHTMLPlug -smart_block pluginMetadataXMPPlug pluginPDFPlug pluginMetadataXMLPlug pluginArcPlug pluginRecPlug

Recuperación de los esquemas xap y dc. Una ocurrencia para cada dato de un determinada etiqueta

Bibliografía Adobe Systems Incorporated. A managers introduction to Adobe eXtensible Metadata Platform : the Adobe XML metadata framework. Disponible en: [Consultado: 12 Jun. 2007]. Adobe Systems Incorporated. Extensible Metadata Platform (XMP). Disponible en: [Consultado: 12 Jun. 2007]. Adobe Systems Incorporated. PDF Reference : Adobe portable document format : version 1.6. Disponible en: [Consultado: 12 Jun. 2007]. Adobe Systems Incorporated. XMP Specification. Disponible en: [Consultado: 12 Jun. 2007] Bainbridge, David ; McKay, Dana; H. Witten, Ian. Guía del programador : Biblioteca Digital Greenstone. Disponible en: tml [Consultado: 12 Jun. 2007].

Bray, Tim. What is RDF?. Disponible en: [Consultado: 12 Jun. 2007]. Myers, Chuck. Adding intelligence to media : metadata Strategy Adobe XMP – PRIMEX. Disponible en: [Consultado: 12 Jun. 2007] Roszkiewycz, Ron. Metadata in context. Disponible en: [Consultado: 12 Jun. 2007] World Wide Web Consortium. RDF Primer : W3C Recommendation 10 February Disponible en: primer / [Consultado: 12 Jun. 2007]. World Wide Web Consortium. RDF Semantics : W3C Recommendation 10 February Disponible en: mt / [Consultado: 12 Jun. 2007].

¡Muchas Gracias por su atención!