La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Introducción a los metadatos para las colecciones digitales

Presentaciones similares


Presentación del tema: "Introducción a los metadatos para las colecciones digitales"— Transcripción de la presentación:

1 Introducción a los metadatos para las colecciones digitales
José Manuel Barrueco

2 Contenidos: Los objetos digitales Identificadores de objetos digitales
XML: un estándar por encima de los estándares Metadatos Uso de metadatos en las colecciones del SBD

3 0.- Antes de empezar: Página del curso: Hacemos grupos de 3-4 personas Cada grupo un identificador Seleccionamos un espacio en disco/web Abrimos una carpeta usando como nombre el identificador de grupo

4 1.- Los objetos digitales:
Robert E. Kahn Robert Wilensky Repositorios Objeto digital = identificador + metadatos

5 1.- Los objetos digitales:
Objetos simples vs objetos compuestos Identificadores persistentes y su resolución En un repositorio lo que almacenamos no siempre es lo mismo que lo que vemos

6 1.- Los objetos digitales:
Ejercicio 1: Buscar al menos tres objetos digitales simples y uno compuesto. Los guardamos en nuestro repositorio

7 2.- Identificadores de objetos digitales:
Un identificador se compone de: Un nombre ( ) Una especificación (ISO 2108:2005, Information and documentation – International Standard Book Number) Una organización (International ISBN Agency) Características: Un identificador debe ser único Debe ser posible su resolución Debe ser interoperable Debe ser persistente

8 2.- Identificadores de objetos digitales:
Handles: Desarrollado por National Research Initiatives (CNRI) Especificación: RFC 3650 – RFC 3652 Sintaxis: <Handle Naming Authority (prefijo)>/<Handle Local Name (sufijo)> Prefijo y sufijo de cualquier longitud El sufijo puede incluir un identificador de otro sistema Ejemplo: /jan2005-rk 145.76/ISBN Universitat de València: 10550/17512 Resolución:

9 2.- Identificadores de objetos digitales:

10 2.- Identificadores de objetos digitales:
DOI (Digital Object Identifier): Implementación del sistema handle con funciones adicionales específicas de la industria editorial Gestionado por la International DOI Foundation y Agencias de Registro. La más conocida CrossRef. Especificación: ISO 26324:2010 Sintaxis: Igual que handle pero siempre empiezan por 10. El DOI Kernel Metadata Declaration (KMD) Universitat de València en proceso de obtención de un prefijo DOI (OJS).

11 2.- Identificadores de objetos digitales:
Ejercicio 2, resolviendo identificadores: / : / / / / : Truco: Podemos utilizar un plug-in de Firefox para resolver directamente handles/dois:

12 2.- Identificadores de objetos digitales:
Ejercicio 3, identificando nuestros documentos: Usamos esquema: 10550/01-GRUPO-DOC[-PARTE] 10550/ 10550/ Nombramos ficheros según este esquema Usamos nuestro propio resolutor: Preparamos nuestros datos para el resolutor: Fichero TXT llamado resolutor.txt En cada línea: handle url Lo colocamos en nuestro repositorio Usamos resolutor para recuperar alguno de nuestros documentos

13 3.- XML: un estándar por encima de los estándares
¿Por qué necesitamos XML? Es el esquema de representación usado por todos los formatos de metadatos Necesario para convertir formatos Uso extensivo en las aplicaciones que gestionan las colecciones digitales (DSpace) Nos da autonomía en la configuración de los servicios al usuario

14 3.- XML: un estándar por encima de los estándares

15 3.- XML: un estándar por encima de los estándares
Diferencias HTML vs XML XML se utiliza para almacenar datos estructurados, mientras HTML se utiliza para dar formato y visualizar esos datos. En estos momentos XML es la herramienta más común para la transmisión de datos entre cualquier clase de aplicaciones. En XML se pueden inventar etiquetas. Los documentos XML tienen una estructura jerárquica, donde la primera etiqueta se denomina raíz y el resto hijos. Todas las etiquetas deben ser cerradas <Para></Para> Las etiquetas diferencian mayúsculas de minúsculas. <Para>es diferente de <para>. Las etiquetas deben estar correctamente entrelazadas. Sería incorrecto: <b><i>texto</b></i>.

16 3.- XML: un estándar por encima de los estándares

17 3.- XML: un estándar por encima de los estándares
Un documento XML debe estar bien formado, no se permiten los errores. En caso de errores las aplicaciones que utilicen el documento no funcionarán. Además para ser válido debe ajustarse a una definición de tipo de documento específica DTD o, como alternativa, un esquema XML. Para saber si un documento XML es correcto podemos validarlo utilizando herramientas como:

18 3.- XML: un estándar por encima de los estándares

19 3.- XML: un estándar por encima de los estándares

20 3.- XML: un estándar por encima de los estándares
XSLT (Extensible Stylesheet Language Transformations ) Utilizado para procesar documentos XML Permite obtener una versión “legible” de un documento XML. Por ejemplo, convirtiéndolo en un documento XHTML Es un lenguaje de programación expresado en XML (también!). Espacio de nombres <xsl:> Permite trabajar con diferentes tipos de datos: números, cadena, operadores, etc. Acceso a datos específicos a través del uso de variables:<xsl:value-of> <xsl:value-of select=“root/item/dc:title” /> Dispone de control de flujos a través de estructuras: <xsl:if>, <xsl:for-each>, <xsl:choose>

21 3.- XML: un estándar por encima de los estándares

22 3.- XML: un estándar por encima de los estándares
Ejercicio 4, creando nuestra propia xslt Crear una hoja de estilo que haga un listado de nuestros libros utilizando la puntuación ISBD y añadiendo al final de cada uno un enlace para descargarlo. Por ejemplo: Aprendiendo XML en media hora / por Pepe Pérez . – [S.l.]:[S.n.], [Descargar]

23 4.- Metadatos Los metadatos son información estructurada que describe, explica, localiza o facilita la recuperación, el uso o la gestión de un recurso digital. Existen tres tipos básicos de metadatos: Metadatos descriptivos Metadatos estructurales Metadatos administrativos: Metadatos técnicos Metadatos para la gestión de derechos Metadatos de preservación

24 4.- Metadatos Conceptos importantes a tener en cuenta:
Esquemas de metadatos Diccionarios de elementos Esquemas de codificación Perfiles de aplicación Tabla de equivalencias Sintaxis y semántica Elementos opcionales vs obligatorios

25 4.- Metadatos Esquemas de metadatos descriptivos: Dublin Core
Nace en 1995 en Dublin (Ohio) en una conferencia OCLC/NCSA Inicialmente trece elementos caracterizados por: Simplicidad Interoperatividad semántica Consenso internacional Interdisciplinariedad Para cualquier formato Extensible Modular

26 4.- Metadatos Esquemas de metadatos descriptivos: Dublin Core

27 4.- Metadatos Esquemas de metadatos descriptivos: Dublin Core

28 4.- Metadatos Esquemas de metadatos descriptivos: Dublin Core
Más información en: Espacios de nombres: xmlns:dcterms="http://purl.org/dc/terms/" xmlns:dc="http://purl.org/dc/elements/1.1/"

29 4.- Metadatos Esquemas de metadatos descriptivos: Dublin Core
<?xml version="1.0" encoding="iso "?> <dc xmlns:dcterms="http://purl.org/dc/terms/" xmlns:dc="http://purl.org/dc/elements/1.1/"> <item> <dcterms:dateAccepted> T12:57:11Z</dcterms:dateAccepted> <dcterms:available> T12:57:11Z</dcterms:available> <dcterms:issued>2009</dcterms:issued> <dc:identifier type="dcterms:URI">http://hdl.handle.net/10550/16896</dc:identifier> <dcterms:abstract xml:lang="es"> Descripción del simulador RobotStudio para programación de robots industriales, y la simulación de la plataforma labserver </dcterms:abstract> <dc:language type="dcterms:ISO639-2" xml:lang="es">es</dc:language> <dcterms:hasPart xml:lang="es"> Manual de uso del robot industrial IRB140 (ABB) a través de la plataforma web para el control remoto </dcterms:hasPart> <dcterms:hasPart xml:lang="en">http://hdl.handle.net/10550/16890</dcterms:hasPart> <dcterms:hasPart xml:lang="en">http://hdl.handle.net/10550/16891</dcterms:hasPart> <dcterms:hasPart xml:lang="en">http://hdl.handle.net/10550/16892</dcterms:hasPart> <dcterms:hasPart xml:lang="en">http://hdl.handle.net/10550/16893</dcterms:hasPart> <dcterms:hasPart xml:lang="en">http://hdl.handle.net/10550/16842</dcterms:hasPart> <dc:subject xml:lang="es"> robot Industrial; automatización; laboratorio remoto; educación </dc:subject> <dc:title xml:lang="es"> Incorporación del simulador Robot Studio al entorno docente LABSERVER de programación de robots </dc:title> </item> </dc>

30 4.- Metadatos Ejercicio 5:
Describir utilizando dcterms los objetos que tenemos en el repositorio

31 4.- Metadatos Esquemas de metadatos descriptivos: MODS
Metadata Object Description Schema Basicamente MARC21 reducido y expresado en XML Etiquetas textuales en lugar de numéricas Estructura jerárquica en lugar de plana Más información en Espacio de nombres: xmlns:mods=http://www.loc.gov/mods/v3 Ejemplo: <originInfo> <place> <placeTerm type="code" authority="marccountry">nyu</placeTerm> <placeTerm type="text">Ithaca, NY</placeTerm> </place> <publisher>Cornell University Press</publisher> <copyrightDate>1999</copyrightDate> </originInfo>

32 4.- Metadatos Esquemas de metadatos descriptivos: MODS
<?xml version="1.0" encoding="iso "?> <modsCollection xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://www.loc.gov/mods/v3" xsi:schemaLocation="http://www.loc.gov/mods/v3 <mods version="3.3"> <titleInfo> <title>At Gettysburg, or, What a Girl Saw and Heard of the Battle: A True Narrative</title> </titleInfo> <name type="personal"> <namePart>Alleman, Tillie Pierce [ ]</namePart> </name> <typeOfResource>text</typeOfResource> <originInfo> <place> <placeTerm type="text">New York</placeTerm> </place> <publisher>W. Lake Borland</publisher> <dateIssued keyDate="yes" encoding="w3cdtf">1889</dateIssued> </originInfo> <physicalDescription> <internetMediaType>text/html</internetMediaType> <digitalOrigin>reformatted digital</digitalOrigin> </physicalDescription> <subject authority="lcsh"> <topic >Gettysburg, Battle of, Gettysburg, Pa., 1863</topic> </subject> <classification authority="lcc">E A42</classification> <location> <url usage="primary display" access="object in context"> </location> </mods> </modsCollection>

33 4.- Metadatos Esquemas de metadatos descriptivos: LOM
Learning Object Metadata IEEE (IEEE Standard for Learning Object Metadata) Primer nivel de nueve categorías, cada una con subelementos: General Educational Life Cycle Rights Meta-Metadata Relation Technical Annotation Classification Más información en:

34 4.- Metadatos Esquemas de metadatos descriptivos: LOM
<?xml version="1.0" encoding="iso "?> <lom:lom xmlns:lom="http://ltsc.ieee.org/xsd/LOM" xsi:schemaLocation="http://ltsc.ieee.org/xsd/LOM <lom:general><lom:identifier> <lom:catalog>http://repository-intralibrary.leedsmet.ac.uk/IntraLibrary-OAI</lom:catalog> <lom:entry>oai:com.intralibrary.leedsmet:2280</lom:entry> </lom:identifier> <lom:title> <lom:string language="en">Virtual Maths, Cuboid - Excavation quiz1</lom:string> </lom:title> <lom:description> <lom:string language="en">Interactive simulaton explaining how to calculate cubic capacity of a truck for carrying excavated materials</lom:string> </lom:description> <lom:language>en</lom:language> <lom:keyword><lom:string language="en">ukoer</lom:string></lom:keyword> <lom:keyword><lom:string language="en">Virtual Maths</lom:string></lom:keyword> </lom:general> <lom:technical> <lom:format>application/x-shockwave-flash</lom:format> <lom:size>190852</lom:size> <lom:location>http://repository-intralibrary.leedsmet.ac.uk/IntraLibrary?command=open-preview&learning_object_key=i3605n22801t</lom:location> </lom:technical> <lom:educational> <lom:learningResourceType> <lom:source>LOMv1.0</lom:source> <lom:value>exercise</lom:value> </lom:learningResourceType> <lom:context> <lom:value>higher education</lom:value> </lom:context> </lom:educational> </lom:lom>

35 4.- Metadatos Esquemas de metadatos técnicos: MIX
Metadata for Images in XML Colaboración entre LC y NISO Technical Metadata for Digital Still Images Standards Committee Representación en XML del diccionario de elementos definido en la norma: NISO Draft Standard Data Dictionary: Technical Metadata for Digital Still Images (version 1.2) Puede ser utilizado con otros estándares como METS como parte de un servicio de preservación digital Los elementos se agrupan en cinco categorías principales: Basic digital object information Basic image information Image capture metadata Image assessment metadata Change history Más información en:

36 4.- Metadatos Esquemas de metadatos técnicos: MIX
<mix xsi:schemaLocation="http://www.loc.gov/standards/mix/mix10/mix10.xsd"> <SourceInformation> <SourceType>text document or book</SourceType> <SourceID><SourceIDType>Millenium item number</SourceIDType> <SourceIDValue>i </SourceIDValue></SourceID> </SourceInformation> <GeneralCaptureInformation> <dateTimeCreated> </dateTimeCreated> <imageProducer>Microfilmaciones Codoñer, S.L.</imageProducer> <captureDevice>Digital still camera</captureDevice> </GeneralCaptureInformation> <DigitalCameraCapture> <digitalCameraManufacturer>Canon</digitalCameraManufacturer> <DigitalCameraModel><digitalCameraModelName>Eos 1Ds Mark III</digitalCameraModelName> </DigitalCameraModel> <cameraSensor>10'10 MP</cameraSensor> <CameraCaptureSettings> <ImageData> <exposureTime>1/3.3 seconds</exposureTime> <exposureProgram>3</exposureProgram> <isoSpeedRatings>100</isoSpeedRatings> <exifVersion>2.2.1</exifVersion> <brightnessValue>0</brightnessValue> <exposureBiasValue>0.0</exposureBiasValue> <meteringMode>Multispot</meteringMode> <lightSource>Day white fluorescent (N K)</lightSource> <flash>Flash did not fire</flash> <focalLength>0.054</focalLength> <sensingMethod>1</sensingMethod> <autoFocus>Auto Focus Used</autoFocus> </ImageData> </CameraCaptureSettings> </DigitalCameraCapture> <ImageProcessing><dateTimeProcessed> </dateTimeProcessed> <sourceData>Universitat de València</sourceData></ImageProcessing> </mix>

37 4.- Metadatos Esquemas de metadatos de preservación: PREMIS
PREservation Metadata Implementation Strategies Diccionario de elementos para dar soporte a la preservación digital a largo plazo Diferentes esquemas de representación en XML para describir: El objeto mismo (object), incluyendo identificadores, integridad, información sobre su creación y su relación con otros objetos. Eventos (events) asociados con él, tales como su creación y cómo y cuándo ha sido modificado a posteriori. Agentes (agents) asociados con su preservación (personas, organizaciones, software, etc) Derechos (rights) asociados con el objeto y los agentes. Más información en:

38 4.- Metadatos Dando unidad, el esquema METS
Metadata Encoding and Transmission Standard (METS) Norma para la codificación de metadatos descriptivos, administrativos y estructurales, así como otros datos esenciales para la preservación y recuperación de objetos digitales. Se compone de seis módulos (cabecera, metadatos descriptivos, metadatos administrativos, archivos, mapa estructural y comportamiento) Cabecera y mapa estructural son obligatorios. Los metadatos descriptivos, administrativos y la sección de comportamiento, pueden estar incluidos en el registro METS o de forma externa. Más información en:

39 4.- Metadatos Dando unidad, el esquema METS
Metadata Encoding and Transmission Standard (METS) Cabecera: <metsHdr CREATEDATE=" T15:00:00" RECORDSTATUS="Complete"> <agent ROLE="CREATOR" TYPE="INDIVIDUAL"> <name>Jerome McDonough</name> </agent> <agent ROLE="ARCHIVIST" TYPE="INDIVIDUAL"> <name>Ann Butler</name> </metsHdr> Metadatos descriptivos: <dmdSec ID="dmd002"> <mdWrap MIMETYPE="text/xml" MDTYPE="DC" LABEL="Dublin Core Metadata"> <xmlData> <dc:title>Alice's Adventures in Wonderland</dc:title> <dc:creator>Lewis Carroll</dc:creator> <dc:date>between 1872 and 1890</dc:date> <dc:publisher>McCloughlin Brothers</dc:publisher> <dc:type>text</dc:type> </xmlData> </mdWrap> </dmdSec>

40 4.- Metadatos Dando unidad, el esquema METS
Metadata Encoding and Transmission Standard (METS) Metadatos administrativos: <amdSec ID="AMD001"> <mdWrap MIMETYPE="text/xml" MDTYPE="MIX" LABEL="MIX"> <mix:CameraCaptureSettings> <mix:ImageData> <mix:fNumber>14</mix:fNumber> <mix:exposureTime>1/3.3 seconds</mix:exposureTime> <mix:exposureProgram>3</mix:exposureProgram> <mix:isoSpeedRatings>100</mix:isoSpeedRatings> </mix:ImageData> </mix:CameraCaptureSettings> </mdWrap> </amdSec>

41 4.- Metadatos Dando unidad, el esquema METS
Metadata Encoding and Transmission Standard (METS) Archivos: <fileSec> <fileGrp ID="VERS1"> <file ID="FILE001" MIMETYPE="application/xml" SIZE="257537" CREATED=" "> <FLocat LOCTYPE="URL">http://dlib.nyu.edu/tamwag/beame.xml</FLocat> </file> </fileGrp> <fileGrp ID="VERS2"> <file ID="FILE002" MIMETYPE="audio/wav" SIZE=" " CREATED=" " GROUPID="AUDIO1"> <FLocat LOCTYPE="URL">http://dlib.nyu.edu/tamwag/beame.wav</FLocat> <fileGrp ID="VERS3" VERSDATE=" "> <file ID="FILE003" MIMETYPE="audio/mpeg" SIZE=" " CREATED=" " GROUPID="AUDIO1"> <FLocat LOCTYPE="URL">http://dlib.nyu.edu/tamwag/beame.mp3</FLocat> </fileSec>

42 4.- Metadatos Dando unidad, el esquema METS
Metadata Encoding and Transmission Standard (METS) Mapa estructural: <structMap TYPE="logical"> <div ID="div1" LABEL="Oral History: Mayor Abraham Beame" TYPE="oral history"> <div ID="div1.1" LABEL="Interviewer Introduction" ORDER="1"> <fptr FILEID="FILE001"></fptr> </div> <div ID="div1.2" LABEL="Family History" ORDER="2"> <fptr FILEID="FILE002"></fptr> <div ID="div1.3" LABEL="Introduction to Teachers' Union" ORDER="3"> <fptr FILEID="FILE003"></fptr> </structMap>

43 4.- Metadatos Ejercicio 6:
Elaborar un fichero METS para dar unidad al objeto digital complejo que se ha descargado.

44 4.- Metadatos Perfiles de aplicación de metadatos
Los perfiles de aplicación de metadatos se caracterizan por: Pueden basarse en uno o varios esquemas existentes y tomar elementos de varios de ellos, pero no puede crear elementos nuevos. Si fuera necesario crear elementos nuevos sería necesario crear un esquema nuevo y asegurarse el mantenimiento del mismo. Se pueden especificar valores específicos para un elemento particular. Por ejemplo se puede especificar un vocabulario controlado para algún elemento o formatos concretos para fechas, etc. Un perfil de aplicación debe indicar los esquemas en los que se basa y una relación de los elementos que utiliza con la descripción de los mismos.

45 4.- Metadatos Perfiles de aplicación de metadatos
La descripción de cada uno de los elementos puede ser más o menos detallada pero es recomendable consignar al menos los siguientes datos: Identificador del elemento. El nombre dado al elemento tal y como va a figurar en la base de datos Etiqueta. Un nombre asociado al identificador destinado a ser interpretado por una persona. Definición. Especifica el tipo de información requerida por el elemento que se está describiendo. En la mayor parte de los casos se tratará de la misma definición que se aporta en el esquema del que se toma el elemento. Obligación. Indica si el elemento debe ser incluido o puede ser omitido. En general una obligación se puede especificar con alguno de los siguientes tres valores: Obligatorio (siempre debe ser incluido aunque haya que crear valores específicos en caso de no existir la propiedad), Requerido si existe (se debe incluir si la propiedad existe) y Opcional (no es obligatorio). Repetible. Indica si se debe usar un valor único o múltiple para el elemento. Tipo de datos. Establece listas de términos o códigos de clasificación de la que se van a extraer los valores del elemento Mapeo al esquema correspondiente.

46 4.- Metadatos Perfiles de aplicación de metadatos
Ejemplos de perfiles de aplicación: OhioLINK Digital Media Center (DMC) Metadata Application Profile. Learning Resource Exchange Metadata Application Profile Repositori de Preservació digital de la Biblioteca de Catalunya : Informe descriptiu i de situació.

47 4.- Uso de metadatos en las colecciones del SBD

48 4.- Uso de metadatos en las colecciones del SBD
¿Qué es RODERIC? RODERIC (Repositori d'Objectes Digitals per a l'Ensenyament, la Recerca i la Cultura) es el repositorio de acceso abierto de la Universitat de València. RODERIC se concibe como una ventanilla única para el acceso y la difusión de la producción digital de la Universitat. Servirá como plataforma para su distribución en agregadores de contenidos tales como: Recolecta, Dialnet, BASE, etc. RODERIC responde al compromiso de la Universitat con el movimiento de acceso abierto al conocimiento adquirido con su adhesión a la Declaración de Berlín (30 Septiembre de 2008). RODERIC es fruto de la integración de varias iniciativas llevadas a cabo por personal y servicios de la Universitat: producción de materiales y recursos para la docencia y el aprendizaje localización, difusión y preservación de materiales de investigación patrimonio cultural: fondo antiguo digitalizado de la Biblioteca La gestión, mantenimiento y preservación del material depositado en RODERIC es responsabilidad del Servicio de Bibliotecas y Documentación en estrecha colaboración con el Servicio de Informática.

49 4.- Uso de metadatos en las colecciones del SBD
Proceso de carga de metadatos en RODERIC CREAM SOMNI MARC dcterms MMedia CSV dcterms porCada registro en fuente obtener firma (MD5 checksum) obtener id en fuente si el id es nuevo convierte y AÑADE registro a DSpace de lo contrario si firma id actual = firma id anterior registro no modificado registro modificado, convierte y MODIFICA registro en DSpace marca id como gestionado almacena firma nueva fin porCada porCada id si id no marcado como gestionado registro no en fuente actual BORRAR registro en DSpace MediaUni CSV dcterms TDX OAI_DC dcterms

50 4.- Uso de metadatos en las colecciones del SBD
Ejemplos de registros en RODERIC Introducidos por CREAM: Procedente de TDX: Procedente de MediaUni: Procedente de MMedia: Procedente de Somni:

51 4.- Uso de metadatos en las colecciones del SBD
Tratamiento de objetos complejos en RODERIC dcterms RODERIC Imágenes master Fichero texto con datos adicionales Visualizador xslt Imágenes master Fichero texto con datos adicionales CONVERSION mets MARC21 Imágenes master Fichero texto con datos adicionales Valerii Maximi De Dictis et Factis Memorabilius uv_ms_0612

52 José Manuel Barrueco


Descargar ppt "Introducción a los metadatos para las colecciones digitales"

Presentaciones similares


Anuncios Google