Grupo de trabajo iris-index Jornadas Técnicas RedIRIS-97

Slides:



Advertisements
Presentaciones similares
Herramientas informáticas
Advertisements

Internet y tecnologías web
5a Jornada sobre la Biblioteca Digital Universitaria El ciclo del conocimiento en el entorno académico El aumento de la visibilidad y la preservación de.
UNIVERSIDAD NACIONAL DE CÓRDOBA CONSEJO DE DIRECTORES DE BIBLIOTECAS Curso Taller Metadatos para documentos digitales FAUD – UNC 13 de agosto de 2013 ©2013/SMM.
Servicios y procesos en una biblioteca virtual El caso de la Biblioteca Virtual de CLACSO Lic. Fernando López CLACSO, 2008.
SGT3 Arquitectura y Normas Antonio Rodríguez. 2004/02/20SGT32 Normas de Metadatos ISO19115 MetadatosIS 2003 ISO Extensión ráster+malla DIS 9/2005.
UBATIC: Entre proyectos DIGITALIZACIÓN Secretaría de Asuntos Académicos Rectorado de la Universidad de Buenos Aires.
Plataforma electrónica RAEE Estado de situación y desarrollo informático 15 de junio de 2016.
Curso de Aptitud Pedagógica 2006/2007 OpenOffice Base Introducción a las Bases de Datos.
Centro Nacional de Referencia de Aplicación de las TIC basadas en fuentes abiertas "Un modelo para evaluar el futuro de Proyectos Open Source” 01/09/2007.
Blog para el diseño instruccional del Curso: Tecnología de Redes del Postgrado en Redes de Computadoras de la (UCLA) Participante: Aura Villegas Prof.
Procedimiento de Intercambio Grupo de Trabajo “Modelo de Datos” Madrid, 29 de Octubre de 2009.
Actualización de la gestión de la información del Clúster de Nutrición de [País] [Fecha de la reunión] [Nombre del Responsable de gestión de la información]
Herramientas de la Web 2.0 Wiki. La palabra “wiki-wiki” significa “rápido” en hawaiano  Expresión repetida entre los remeros de las canoas que conocen.
COMUNICACIÓN Y TIC Ángela Espinosa Hayler Peñaranda.
Informática Empresarial Docente – Carlos Andrés Bonil Mariño INFORMATICA EMPRESARIAL  CARLOS ANDRES BONIL MARIÑO  INGENIERO DE SISTEMAS.
Didáctica en el Uso de Recursos Informáticos Lic. Wilder J. Mayta Vega Manual de Usuario.
BASE DE DATOS EN LA WEB POR- OSIRYS MARCIAGA JESUS NIETO.
ALFRESCO.
Soluciones Nomina Digital
Conferencia 2. Herramientas generales y especializadas de Internet
Sistema Nacional de Información Básica en Materia de Salud - SINBA
Calidad de metadatos y visibilidad académica en repositorios institucionales de universidades peruanas ALHUAY-QUISPE, Joel* ; QUISPE-RIVEROS, David**
MANEJO DE TEXTO Y OBJETOS AVANZADOS ENCABEZADOS Y PIES DE PÁGINA
Desarrollo de herramientas y funcionalidades para potenciar
I Jornadas Gestión de Patrimonio Bibliográfico
Presentación de la plataforma de soporte a las webs de los departamentos en entorno DRUPAL
Educación Online Instituto HG.
Comercio Electrónico Tienda Virtual.
Indicaciones de uso del Gestor documental
Herramienta de Gestión de Inventario de Activos
CENTRO DEL PROFESORADO DE MÁLAGA
CENTRO DEL PROFESORADO DE MÁLAGA
BÚSQUEDA DE INFORMACIÓN EN LA WEB
U.T. 11: Introducción A Las Bases De Datos
METODOLOGÍA.
SISTEMA DE DICTAMINACIÓN DE ESTRUCTURAS ORGÁNICAS
Estrategias de Búsqueda
ACUERDO DE COLABORACIÓN KOMPASS
Situación Actual del Proyecto
Inscripción Programa de investigación:
¿Qué es un ODE? Los Objetos Digitales Educativos (en adelante ODE) constan de tres elementos: los archivos binarios que componen el Objeto (imágenes, texto...)
Ricardo Ferrís Castell
Tema 4 Lenguaje HTML Parte 1.
CENTRO DEL PROFESORADO DE MÁLAGA
La Web Semántica Equipo: 3 Efrain Hernandez Salazar
Metodología de la programación
Búsquedas en Internet ¿Qué es un buscador?
ORGANIGRAMA METODOLOGIA PARA LA IMPLANTACION DE UN PROYECTO EDI
Ingeniería del Software
Las revistas de Biblioteconomía y Documentación en Internet
Conceptos Relacionados Unidad I. Parte A.
Un proyecto en marcha para el Servicio de Publicaciones UCM
Gabriel Alonso Navarro Altamar
1. Internet Introducción Navegadores y buscadores Buscar información Descargas Otras actividades en internet 2. Mantenimiento.
MODELO ADDIE Profesor: Msc. Juan Martínez Integrantes
Lea toda la información Microsoft Noticias de SharePoint
Manual del Usuario Todos los derechos reservados ©.
Documento y Expediente electrónico INSIDE
Procesos editoriales: evaluación de la revista
LICENCIATURA EN SISTEMAS COMPUTACIONALES EN ADMINISTRACION
SEMANTIC WEB TOOL Nicolás Amador Griñolo Agustín Domínguez Alvera
Tema: Administración de la configuración de software UNIVERSIDAD TECNOLÓGICA ISRAEL CALIDAD DE SOFTWARE.
Importancia de los sistemas de información administrativo
Taller OcenDocs Latinoamericano
Gestión de la información para el aprendizaje y la investigación
Portafolio de Membresías.
Implementación de cursos virtuales para la disciplina Sistemas de Telecomunicaciones en la Plataforma Moodle Autor:. Pytsou-Guychel Engoua Tutor:. Yudisleidy.
INDICE Y MOTIVACIÓN OBJETIVOS ESTUDIO DE MERCADO ESTRUCTURA PORTAL WEB
ICI 502 Procesos de Software
Transcripción de la presentación:

Grupo de trabajo iris-index Jornadas Técnicas RedIRIS-97

Índice Repaso de las actividades realizadas en el grupo iris-index Metainformación, formatos de metainformación Herramientas de generación de metainformación Actividades restantes en el grupo iris-index Proyectos relacionados con iris-index

Fase 1. Objetivos Elección de centros participantes Software a usar Instalación harvest 1.5 Información a indexar Páginas de prueba Estructura del sistema Creación de gatherer y broker en cada nodo (g1,b1) Creación de broker global en rediris (b0) Creación de interface de consultas a ese broker final http://www.rediris.es/harvest/brokers/i1-index/ g1,b1 b0

Fase 1. Resultados obtenidos Problemas Índices generados muy grandes Información en los índices de diferentes tipos No se han indexado correctamente las páginas con los caracteres "á,é,í,ó,ú,ñ" Falta de metainformación en casi todas las páginas Posibles soluciones Modificar HTML.Sum.Tbl, RunGatherer, RunBroker Incorporar metainformación

Fase 2. Expansión otro nivel Estructura del nuevo sistema Gatherer local en los centros en el nivel 2 Broker basado en ese gatherer Broker en el nivel 1 que apunte a todos los brokers de los centros en el nivel 2 y al propio en el nivel 1 1 2 g1,b1 b0 b2

Fase 2. Resultados Obtenidos Consultas desde el nivel superior con resultados favorables Posibilidad de expansión de la estructura Problemas Escasa colaboración de centros para el nivel 2

Fase 3. Metainformación ¿ Qué metainformación necesitamos ? Análisis de conjuntos de metainformación existentes Desarrollo de una herramienta que permita introducir metainformación en las páginas

Metainformación Beneficios de uso Facilita la recuperación de información Identifica las diferentes características de los recursos (autor, claves, título,...) Identifica documentos que de otra forma pasarían desapercibidos para los buscadores (imagenes, BD, documentos PDF, ...) Posible creación de repositorios de ficheros de metainformación para facilitar las tareas de recolección de recursos

Esquemas de Metainformación Dublin Core http://purl.oclc.org/metadata/dublin_core_elements Aproximación minimalista 15 elementos Aproximación estructuralista Utilización de cualificadores http://www.loc.gov/marc/dcqualif.html TYPE Refina el significado del campo creator.name, creator.email, creator.name.address SCHEME Explica el significado del valor contenido en el campo ejemplo: la fecha

Conjunto de metadatas de Dublin Core title Nombre del recurso creator Persona, organización responsable de la creación del recurso subject Claves description Descripción textual del contenido del recurso publisher Entidad responsable de que el recurso esté disponible en la red contributor Colaboradores en la creación del recurso date Fecha en la que el recurso fue editado en su forma actual type Categoría del recurso (página, novela, poema ...) format Formato del recurso, hardware necesario para verlo, identifier Cadena para identificar unívocamente el recurso source Cadena para identificar el orígen del recurso language Idioma en que está escrito el recurso relation Relaciones de este recurso con otros coverage Localización espacial y temporal del recurso rights Enlace a una nota de copyright

Ejemplos <meta name=“DC.Creator.PersonalName” content="martin hamilton"> <meta name=“DC.Creator.email” content="martin@net.Lut.Ac.Uk"> <meta name=“DC.Creator.PersonalName.Address” content=“Avda. la Hispanidad, 5. Sevilla”> <meta name=“DC.Date.Creation_of_intellectual_content” content=“19971005”> <meta name="DC.form" scheme="IMT" content="text/html"> <meta name="DC.language" scheme="ISO639” content="en"> <meta name="DC.identifier" scheme="URL" content="http://purl.oclc.org/metadata/DC">

Herramientas de generación de metainformación Necesidad de introducir metainformación No a la generación manual de metainformación No a la modificación manual de las páginas ya existentes Generación basada en ficheros de plantilla para los valores comunes a una serie de recursos ¿ Qué necesitamos ?

MetaWebber ¿ Qué hace ? ¿ Que más debería hacer ? ¿ Donde está ? Introduce líneas con metainformación Se basa en ficheros de plantilla No modifica la apariencia de la página ¿ Que más debería hacer ? Usar una plantilla distinta para cada página Páginas origen y destino distintas Especificar qué metainformación ha de incluir Extracción de información clave del propio documento para la inclusión automática en el meta DC.Subject ¿ Donde está ? http://www.rediris.es/si/iris-index/herramientas/metawebber

MetaWebber. Ejemplo Actualización al conjunto de metadatas a usar <!-- Start metawebber --> <Meta name="keywords" content="Boletín de rediris"> <Meta name="description" content="Versión electrónica del boletín 40 de rediris"> <Meta name="date" content="19971027"> <Meta name="reply to" content="Boletin@rediris.Es"> <Meta name="organization" content="CSIC/rediris"> <Meta name="locality" content="Madrid. España"> <Meta name="author" content="Servicios de difusión"> <Meta name="lang" content="es"> <!-- End metawebber --> Actualización al conjunto de metadatas a usar

Actividades restantes Decidir el conjunto de metadatas a usar (DC) Software Kits con binarios de harvest para varias plataformas Actualizar metawebber al conjunto de metainformación de Dublin Core Ampliar metawebber hasta llegar a un webber Extracción de claves del documento Documentación a generar Documentación cómoda para la instalación y configuración de harvest Normativa de publicación para la inclusión de metainformación en las páginas web de la rediris

Proyectos relacionados con iris-index TF-CHIC (Cooperative Hierarchical Indexing Coordination) Coordinación de la recolección e indexado de los recursos de la red para la construcción de una base de datos de recursos Reunión en Mayo en Edimburgo Consultas a los buscadores Amplio ancho de banda usado por las consultas Hacer caché de las búsquedas que más se repitan Indexación basada en robots Creación de scripts para ver el % de tráfico debido a robots Desarrollo de harvest no comercial (1.5) Indexado distribuido, búsquedas y réplicas de servers Distribuir información en RDM, SOIF,...

Otros Temas Comentarios ... iris-index@listserv.rediris.es