Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porMercedes Agüero Valverde Modificado hace 7 años
1
Grupo de trabajo iris-index Jornadas Técnicas RedIRIS-97
2
Índice Repaso de las actividades realizadas en el grupo iris-index
Metainformación, formatos de metainformación Herramientas de generación de metainformación Actividades restantes en el grupo iris-index Proyectos relacionados con iris-index
3
Fase 1. Objetivos Elección de centros participantes Software a usar
Instalación harvest 1.5 Información a indexar Páginas de prueba Estructura del sistema Creación de gatherer y broker en cada nodo (g1,b1) Creación de broker global en rediris (b0) Creación de interface de consultas a ese broker final g1,b1 b0
4
Fase 1. Resultados obtenidos
Problemas Índices generados muy grandes Información en los índices de diferentes tipos No se han indexado correctamente las páginas con los caracteres "á,é,í,ó,ú,ñ" Falta de metainformación en casi todas las páginas Posibles soluciones Modificar HTML.Sum.Tbl, RunGatherer, RunBroker Incorporar metainformación
5
Fase 2. Expansión otro nivel
Estructura del nuevo sistema Gatherer local en los centros en el nivel 2 Broker basado en ese gatherer Broker en el nivel 1 que apunte a todos los brokers de los centros en el nivel 2 y al propio en el nivel 1 1 2 g1,b1 b0 b2
6
Fase 2. Resultados Obtenidos
Consultas desde el nivel superior con resultados favorables Posibilidad de expansión de la estructura Problemas Escasa colaboración de centros para el nivel 2
7
Fase 3. Metainformación ¿ Qué metainformación necesitamos ?
Análisis de conjuntos de metainformación existentes Desarrollo de una herramienta que permita introducir metainformación en las páginas
8
Metainformación Beneficios de uso
Facilita la recuperación de información Identifica las diferentes características de los recursos (autor, claves, título,...) Identifica documentos que de otra forma pasarían desapercibidos para los buscadores (imagenes, BD, documentos PDF, ...) Posible creación de repositorios de ficheros de metainformación para facilitar las tareas de recolección de recursos
9
Esquemas de Metainformación
Dublin Core Aproximación minimalista 15 elementos Aproximación estructuralista Utilización de cualificadores TYPE Refina el significado del campo creator.name, creator. , creator.name.address SCHEME Explica el significado del valor contenido en el campo ejemplo: la fecha
10
Conjunto de metadatas de Dublin Core
title Nombre del recurso creator Persona, organización responsable de la creación del recurso subject Claves description Descripción textual del contenido del recurso publisher Entidad responsable de que el recurso esté disponible en la red contributor Colaboradores en la creación del recurso date Fecha en la que el recurso fue editado en su forma actual type Categoría del recurso (página, novela, poema ...) format Formato del recurso, hardware necesario para verlo, identifier Cadena para identificar unívocamente el recurso source Cadena para identificar el orígen del recurso language Idioma en que está escrito el recurso relation Relaciones de este recurso con otros coverage Localización espacial y temporal del recurso rights Enlace a una nota de copyright
11
Ejemplos <meta name=“DC.Creator.PersonalName”
content="martin hamilton"> <meta name=“DC.Creator. ” <meta name=“DC.Creator.PersonalName.Address” content=“Avda. la Hispanidad, 5. Sevilla”> <meta name=“DC.Date.Creation_of_intellectual_content” content=“ ”> <meta name="DC.form" scheme="IMT" content="text/html"> <meta name="DC.language" scheme="ISO639” content="en"> <meta name="DC.identifier" scheme="URL" content="
12
Herramientas de generación de metainformación
Necesidad de introducir metainformación No a la generación manual de metainformación No a la modificación manual de las páginas ya existentes Generación basada en ficheros de plantilla para los valores comunes a una serie de recursos ¿ Qué necesitamos ?
13
MetaWebber ¿ Qué hace ? ¿ Que más debería hacer ? ¿ Donde está ?
Introduce líneas con metainformación Se basa en ficheros de plantilla No modifica la apariencia de la página ¿ Que más debería hacer ? Usar una plantilla distinta para cada página Páginas origen y destino distintas Especificar qué metainformación ha de incluir Extracción de información clave del propio documento para la inclusión automática en el meta DC.Subject ¿ Donde está ?
14
MetaWebber. Ejemplo Actualización al conjunto de metadatas a usar
<!-- Start metawebber --> <Meta name="keywords" content="Boletín de rediris"> <Meta name="description" content="Versión electrónica del boletín 40 de rediris"> <Meta name="date" content=" "> <Meta name="reply to" <Meta name="organization" content="CSIC/rediris"> <Meta name="locality" content="Madrid. España"> <Meta name="author" content="Servicios de difusión"> <Meta name="lang" content="es"> <!-- End metawebber --> Actualización al conjunto de metadatas a usar
15
Actividades restantes
Decidir el conjunto de metadatas a usar (DC) Software Kits con binarios de harvest para varias plataformas Actualizar metawebber al conjunto de metainformación de Dublin Core Ampliar metawebber hasta llegar a un webber Extracción de claves del documento Documentación a generar Documentación cómoda para la instalación y configuración de harvest Normativa de publicación para la inclusión de metainformación en las páginas web de la rediris
16
Proyectos relacionados con iris-index
TF-CHIC (Cooperative Hierarchical Indexing Coordination) Coordinación de la recolección e indexado de los recursos de la red para la construcción de una base de datos de recursos Reunión en Mayo en Edimburgo Consultas a los buscadores Amplio ancho de banda usado por las consultas Hacer caché de las búsquedas que más se repitan Indexación basada en robots Creación de scripts para ver el % de tráfico debido a robots Desarrollo de harvest no comercial (1.5) Indexado distribuido, búsquedas y réplicas de servers Distribuir información en RDM, SOIF,...
17
Otros Temas Comentarios ...
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.