La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

5ta. Jornada sobre Bibliotecas Digitales Universitarias El ciclo del conocimiento en el entorno académico 8 y 9 de Noviembre de 2007 Una experiencia con.

Presentaciones similares


Presentación del tema: "5ta. Jornada sobre Bibliotecas Digitales Universitarias El ciclo del conocimiento en el entorno académico 8 y 9 de Noviembre de 2007 Una experiencia con."— Transcripción de la presentación:

1 5ta. Jornada sobre Bibliotecas Digitales Universitarias El ciclo del conocimiento en el entorno académico 8 y 9 de Noviembre de 2007 Una experiencia con el estándar XMP de Adobe y el software de Biblioteca Digital Greenstone Daniel H. Biset, Alejandra T. Chávez Flores Centro de Información – Centro Atómico Constituyentes Comisión Nacional de Energía Atómica

2 Antecedentes 1999-2002: Primeras experiencias en digitalización para envío de documentos al INIS 2001: Escaneo de Tesis del Instituto Sábato. Participación en :Long Term Archiving of Digital Documents in Physics. Lyon, Francia. 2002: Bases para el proyecto de preservación a largo plazo 2003: Inicio del Proyecto Piloto de Preservación a Largo Plazo Colecciones seleccionadas: Boletín Informativo Informes CNEA Memorias CNEA

3 Flujo de trabajo Catálogo CNEA Impresión Visualización ConsultaSelección Control de calidad Captura (Salida de TIFF) Conversión a PDF/A PDF JB2 y OCR Normalización (XENA) Descripción (Incorporación de Metadatos) Almacenamiento (Back-Up) Procesamiento con software de BibDig (incorporación automática de metadatos) Provisión de acceso INIS NLNZ Metadata Extractor BD Hist. CNEA

4 Consignas para la preservación Incorporar metadatos en el propio documento TIFF (política de preservación) Procesar con un software de biblioteca digital PDFs con metadatos incorporados Que el software extraiga automáticamente los metadatos Los metadatos residen en un archivo XMP

5 XMP eXtensible Metadata Platform Codificado como XML, usando estándar RDF (Resource Description Framework) Estandariza la definición, creación y procesamiento de metadatos Tecnología open-source Provee: un modelo de datos, un modelo de almacenamiento, dentro de un marco de trabajo extensible que puede ser usado para representar cualquier número de esquemas

6 RDF Una estructura para describir recursos de la web Provee un modelo de datos y una sintaxis Está escrito en XML Es parte de la actividad del W3C por la Web Semántica Es una recomendación del W3C

7 Modelo de metadatos XMP XMP define propiedades básicas para registrar la historia y descripción de un recurso; permite la integración de esquemas de metadatos tanto existentes como personalizados XMP soporta tres clases de datos: Propiedades de los metadatos Esquemas y Espacio de Nombres (namespace) Valores de las propiedades

8 Propiedades de Metadatos Siempre asociadas a un recurso: las propiedades son sobre (about) el recurso Recurso: un archivo o porción significativa de él. Una propiedad tiene un nombre y un valor Forma: El nombre_de_la_propiedad del recurso es valor_de_la_propiedad Ejemplo: El autor de Moby Dick es Herman Melville

9 Esquemas y Espacio de Nombres Esquema: conjunto de nombres de propiedades de alto nivel acompañados por tipos de datos e información descriptiva. Define la estructura donde registrar la información. Un esquema en XMP es identificado por su Espacio de Nombres XML (xmlns), un URI El uso de Espacios de Nombres evita conflictos entre propiedades de diferentes esquemas que tienen el mismo nombre pero diferentes significados. Por ejemplo: la propiedad Subject en el esquema PDF se refiere al asunto o descripción, mientras que en DC se refiere a palabras claves.

10 Valores de las propiedades tres categorías básicas Tipos simples: es un valor literal simple: cadena de caracteres, booleanos, números reales y enteros. Estructuras: una propiedad estructurada consiste de uno o más campos. Por ejemplo, una propiedad MaxPageSize cuyo tipo es Dimensions, con tres campos: alto, ancho, unidad Arrays: consiste en un conjunto de valores. XMP soporta tres tipos de arrays: 1)Array sin ordenar: una lista de valores cuyo orden no es significativo (dc:subject). Es referido como un bag 2)Array ordenado: una lista cuyo orden es significativo (dc:creator). Es referido como un seq 3)Array alternativo: conjunto de uno o más valores, uno de los cuales debe ser seleccionado (dc:title). Es referido como un alt

11 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:pdf='http://ns.adobe.com/pdf/1.3/'> <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:xap='http://ns.adobe.com/xap/1.0/'> 2006-10-24T16:47:28-04:00 2006-10-24T16:47:27-04:00 2006-10-24T16:47:28-04:00 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'> uuid:1aa82404-7080-4651-bfef-1dd39b9b9ed8 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:dc='http://purl.org/dc/elements/1.1/'> application/pdf Matthew Beacom Reed Beaman Preservación digital Archivos digitales Metadatos Instrucciones de procesamiento XML comprendidas en el envoltorio del paquete XMP

12 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:pdf='http://ns.adobe.com/pdf/1.3/'> <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:xap='http://ns.adobe.com/xap/1.0/'> 2006-10-24T16:47:28-04:00 2006-10-24T16:47:27-04:00 2006-10-24T16:47:28-04:00 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'> uuid:1aa82404-7080-4651-bfef-1dd39b9b9ed8 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:dc='http://purl.org/dc/elements/1.1/'> application/pdf Matthew Beacom Reed Beaman Preservación digital Archivos digitales Metadatos El elemento más extremo contiene un elemento x:xmpmeta, el cual contiene un elemento simple rdf:RDF

13 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:pdf='http://ns.adobe.com/pdf/1.3/'> <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:xap='http://ns.adobe.com/xap/1.0/'> 2006-10-24T16:47:28-04:00 2006-10-24T16:47:27-04:00 2006-10-24T16:47:28-04:00 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'> uuid:1aa82404-7080-4651-bfef-1dd39b9b9ed8 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:dc='http://purl.org/dc/elements/1.1/'> application/pdf Matthew Beacom Reed Beaman Preservación digital Archivos digitales Metadatos El elemento rdf:RDF contiene uno o más elementos rdf:Description

14 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:pdf='http://ns.adobe.com/pdf/1.3/'> <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:xap='http://ns.adobe.com/xap/1.0/'> 2006-10-24T16:47:28-04:00 2006-10-24T16:47:27-04:00 2006-10-24T16:47:28-04:00 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'> uuid:1aa82404-7080-4651-bfef-1dd39b9b9ed8 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:dc='http://purl.org/dc/elements/1.1/'> application/pdf Matthew Beacom Reed Beaman Preservación digital Archivos digitales Metadatos ESQUEMAS

15 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:pdf='http://ns.adobe.com/pdf/1.3 /'> <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:xap='http://ns.adobe.com/xap/1.0/'> 2006-10-24T16:47:28-04:00 2006-10-24T16:47:27-04:00 2006-10-24T16:47:28-04:00 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'> uuid:1aa82404-7080-4651-bfef-1dd39b9b9ed8 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:dc='http://purl.org/dc/elements/1.1/'> application/pdf Matthew Beacom Reed Beaman Preservación digital Archivos digitales Metadatos Espacio de Nombres

16 <rdf:Description rdf:about ='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:pdf='http://ns.adobe.com/pdf/1.3/'> <rdf:Description rdf:about ='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:xap='http://ns.adobe.com/xap/1.0/'> 2006-10-24T16:47:28-04:00 2006-10-24T16:47:27-04:00 2006-10-24T16:47:28-04:00 <rdf:Description rdf:about ='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'> uuid:1aa82404-7080-4651-bfef-1dd39b9b9ed8 <rdf:Description rdf:about ='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:dc='http://purl.org/dc/elements/1.1/'> application/pdf Matthew Beacom Reed Beaman Preservación digital Archivos digitales Metadatos El elemento rdf:Description requiere un atributo rdf:about que puede ser usado para identificar el recurso que el XMP describe. Puede estar vacío o ser una URI basada en una UUID abstracta UUID (Universal Unique IDentifier): número aleatorio, se crea por la combinación de tiempo y dirección de la tarjeta de red Ethernet.

17 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:pdf='http://ns.adobe.com/pdf/1.3/'> <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:xap='http://ns.adobe.com/xap/1.0/'> 2006-10-24T16:47:28-04:00 2006-10-24T16:47:27-04:00 2006-10-24T16:47:28-04:00 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'> uuid:1aa82404-7080-4651-bfef-1dd39b9b9ed8 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:dc='http://purl.org/dc/elements/1.1/'> application/pdf Matthew Beacom Reed Beaman Preservación digital Archivos digitales Metadatos Propiedades XMP de tipo simple XAP(eXtensible Authoring and Publishing): metadatos internos que se usaban en versiones anteriores de Adobe, mantenidos por razones de compatibilidad

18 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:pdf='http://ns.adobe.com/pdf/1.3/'> <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:xap='http://ns.adobe.com/xap/1.0/'> 2006-10-24T16:47:28-04:00 2006-10-24T16:47:27-04:00 2006-10-24T16:47:28-04:00 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'> uuid:1aa82404-7080-4651-bfef-1dd39b9b9ed8 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:dc='http://purl.org/dc/elements/1.1/'> application/pdf Matthew Beacom Reed Beaman Preservación digital Archivos digitales Metadatos Propiedades XMP de tipo array sin ordenar: una lista de valores en la cual el orden no es significativo

19 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:pdf='http://ns.adobe.com/pdf/1.3/'> <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:xap='http://ns.adobe.com/xap/1.0/'> 2006-10-24T16:47:28-04:00 2006-10-24T16:47:27-04:00 2006-10-24T16:47:28-04:00 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'> uuid:1aa82404-7080-4651-bfef-1dd39b9b9ed8 <rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643' xmlns:dc='http://purl.org/dc/elements/1.1/'> application/pdf Matthew Beacom Reed Beaman Preservación digital Archivos digitales Metadatos Propiedades XMP de tipo array ordenada: una lista en la cual el orden es importante

20 <rdf:Description rdf:about='uuid:4cde4cb6-4e5e-4131-92b4-52cddc17dede' xmlns:pdf='http://ns.adobe.com/pdf/1.3/'> Acrobat Web Capture 6.0 <rdf:Description rdf:about='uuid:4cde4cb6-4e5e-4131-92b4-52cddc17dede' xmlns:xap='http://ns.adobe.com/xap/1.0/'> 2007-05-30T13:51:02-03:00 2007-05-30T13:51:02Z 2007-05-30T13:51:02-03:00 <rdf:Description rdf:about='uuid:4cde4cb6-4e5e-4131-92b4-52cddc17dede' xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'> uuid:26df1155-421a-48cf-884b-1880c8b6e6be <rdf:Description rdf:about='uuid:4cde4cb6-4e5e-4131-92b4-52cddc17dede' xmlns:dc='http://purl.org/dc/elements/1.1/'> application/pdf Preservation metadata [IYLIM 2003-2003] Propiedad XMP de tipo array alternativa: conjunto de uno o más valores, uno de los cuales debe ser seleccionado. No hay una regla específica para la selección de alternativas. En algunos casos la aplicación puede hacer la elección, en otros casos puede hacerla el usuario. El primer ítem del array es considerado el valor por defecto por el RDF

21

22

23 Paneles de ingreso de metadatos (Adobe Acrobat 6.0 Professional ) Esquema PDF Esquema DC Ubicación y denominación de la caja Keyword Palabras clave (Archivo Propiedades de documento) SubjectPalabras clave (Avanzadas Metadatos de documento) SubjectDescription Asunto (Archivo Propiedades de documento) Descripción (Avanzadas Metadatos de documento) AuthorCreatorAutor* (Archivo Propiedades de documento) Autor** (Avanzadas Metadatos de documento) * Si hay más de uno, se cargan como una sola ocurrencia tanto en el esquema PDF como en el DC ** Si hay más de uno, se carga solo el primero en el esquema PDF y se abren las ocurrencias necesarias en el DC

24 Procesando con Greenstone Archivo de colección collect.cfg – creator Dirección electrónica del creador de la colección – maintainer Dirección electrónica del actualizador de la colección – public Determina si la colección va a ponerse a disposición del público o no – indexes Lista de índices por crear – languages Lista de lenguas en las que hay que crear los índices – collectionmeta Define los metadatos al nivel de la colección – plugin Especifica un conector que habrá de utilizarse durante la creación – format Cadena de formato – classify Especifica un clasificador que habrá de utilizarse durante la creación –..:

25 Configuración de PDFPlug... Plugin GAPlug Plugin HTMLPlug -smart_block Plugin PDFPlug -metadata_fields Title,Author, Subject,Keywords Plugin MetadataXMLPlug Plugin ArcPlug Plugin RecPlug...

26 No recupera los esquemas xap y dc. Etiquetas con más de dos datos en una sola ocurrencia (dc. Creator, dc. Subject)

27 Creación de un nuevo plugin Consulta a la lista greenstone-users@list.scms.waikato.ac.nz John Thompson (DL Consulting): …el veredicto es que el PDFPlug no soporta los metadatos de XMP…, y por ello … … escribió un nuevo Plugin para extraer esos metadatos: el MetadataXMPPlug

28 Nuevo Plugin: MetadataXMPPlug pluginGAPlug pluginHTMLPlug -smart_block pluginMetadataXMPPlug pluginPDFPlug pluginMetadataXMLPlug pluginArcPlug pluginRecPlug

29 Recuperación de los esquemas xap y dc. Una ocurrencia para cada dato de un determinada etiqueta

30 Bibliografía Adobe Systems Incorporated. A managers introduction to Adobe eXtensible Metadata Platform : the Adobe XML metadata framework. Disponible en: http://www.adobe.com/products/xmp/pdfs/whitepaper.pdf [Consultado: 12 Jun. 2007]. Adobe Systems Incorporated. Extensible Metadata Platform (XMP). Disponible en: http://www.adobe.com/products/xmp/index.html [Consultado: 12 Jun. 2007]. Adobe Systems Incorporated. PDF Reference : Adobe portable document format : version 1.6. Disponible en: http://www.adobe.com/devnet/pdf/pdfs/PDFReference16.pdf [Consultado: 12 Jun. 2007]. Adobe Systems Incorporated. XMP Specification. Disponible en: http://www.adobe.com/devnet/xmp/pdfs/xmp_specification.pdf [Consultado: 12 Jun. 2007] Bainbridge, David ; McKay, Dana; H. Witten, Ian. Guía del programador : Biblioteca Digital Greenstone. Disponible en: http://www.greenstone.org/manuals/gsdl2/es/html/Develop_es_index.h tml [Consultado: 12 Jun. 2007].

31 Bray, Tim. What is RDF?. Disponible en: http://www.xml.com/pub/a/2001/01/24/rdf1.html [Consultado: 12 Jun. 2007]. Myers, Chuck. Adding intelligence to media : metadata Strategy Adobe XMP – PRIMEX. Disponible en: http://www.idealliance.org/primex/presentations/04/slides/myers.pdf [Consultado: 12 Jun. 2007] Roszkiewycz, Ron. Metadata in context. Disponible en: http://www.adobe.com/products/xmp/pdfs/seybold_metadata.pdf [Consultado: 12 Jun. 2007] World Wide Web Consortium. RDF Primer : W3C Recommendation 10 February 2004. Disponible en: http://www.w3.org/TR/2004/REC-rdf- primer-20040210/ [Consultado: 12 Jun. 2007]. World Wide Web Consortium. RDF Semantics : W3C Recommendation 10 February 2004. Disponible en: http://www.w3.org/TR/2004/REC-rdf- mt-20040210/ [Consultado: 12 Jun. 2007].

32 ¡Muchas Gracias por su atención!


Descargar ppt "5ta. Jornada sobre Bibliotecas Digitales Universitarias El ciclo del conocimiento en el entorno académico 8 y 9 de Noviembre de 2007 Una experiencia con."

Presentaciones similares


Anuncios Google