Greenstone Basado en el trabajo de Jesús Tramullas Depto. CC. Documentación /Univ. de Zaragoza

Slides:



Advertisements
Presentaciones similares
Publicación de las colecciones en CD ROM
Advertisements

Búsqueda de una frase exacta
Bases de conocimiento colaborativas
1 Curso Básico de C.I.O. Light Sección 4 Grupos y Subgrupos Sección 4 - Grupos y Subgrupos.
Configurar un curso (Función del profesor) Editar el nombre, el nombre corto y el informe (que se muestra en la portada) Escoger la formato del curso y.
Jorge de Nova Segundo UD 6:
Formas fáciles de creación. Muchos textos económicos contienen gráficos y, sobre todo, ecuaciones. Probablemente, si debemos traducir alguno, nos será
LICENCIATURA EN SISTEMAS COMPUTACIONALES EN ADMINISTRACION
Tecnologías para desarrollo de aplicaciones web. Un caso de uso
DEPARTAMENTO DE EDUCACI Ó N SECRETAR Í A AUXILIAR DE SERVICIOS ACAD É MICOS Y SERVICIOS EDUCATIVOS A LA COMUNIDAD UNIDAD DE TECNOLOGÍA Y CURRÍCULO PROYECTO.
Actividad Portafolio Descripción de la actividad
LATINDEX.
Perfil Agente de Aduana
Facultad de Traducción y Documentación
Utilidades de compresión / descompresión de archivos
Buscar bibliografía en
VENTAJAS, DESVENTAJAS, CARACTERISTICAS Y CONFIGURACION
DE LAS CUENTAS DE USUARIO Y OPCIONES DE CARPETA
Windows es un sistema operativo
CURSO DE OFIMATICA BASICA
Buscador Es un sistema informático que busca archivos almacenados en servidores web HERRAMIENTAS DE COMPUTACION I.
Ingeniero Anyelo Quintero
Acceso del usuario a la aplicación.
Java Server Faces.
TRINO ANDRADE G UNIVERSIDAD ECOTEC. PRESENTACIÓN DE OUTLOOK EXPRESS Microsoft Outlook Express es una herramienta necesaria que le permite administrar.
 Elaborar un documento en Word que contenga, marcadores, enlaces y gif animados.
InfoPath Ventajas y Uso.
WESTWIND SYSTEMS COMPONENTE: CONFIGURACION. WESTWIND SYSTEMS n El componente de Configuración le permite al Hospital o Clínica definir los parámetros.
LabTIG – Facultad de Humanidades – Universidad Nacional del Nordeste Universidad Nacional del Nordeste Facultad de Humanidades CARRERA DE ESPECIALIZACION.
Windows es un sistema operativo
“Diseño de base de Datos Alquicira Jiménez Carolina 303
BIBLIOTECAS DIGITALES
Ingeniería en Sistemas de Información Diseño de Sistemas (3K1)
El mundo de Word.
Moodle es un entorno de aprendizaje que está basado en los principios pedagógicos constructivistas, con un diseño modular que hace fácil agregar contenidos.
INTRODUCCIÓN Se lo define como un programa para PRESENTACIONES. En sus orígenes estaba orientado a la creación de diapositivas para esquematizar contenidos.
TRABAJO DE INFORMATICA
Introducción al Lenguaje. ¿ Qué es PHP ? O Hypertext Pre-processoes (PHP) es un lenguaje de "código abierto" interpretado, de alto nivel, embebido en.
Universidad Metropolitana Introducción a la Computación
Es un programa sorprendente con un diseño mejor y más eficaz que el de las versiones anteriores. Pero quizás le resulte poco familiar. Por ese motivo.
MANUAL DE USO BASES DE DATOS Por: EBSCO Information Services
Clase 7 Tecnología de la Comunicación II Lics. en Com. Social y Periodismo F AC. DE C S. H UMANAS. UNSL. Sitio Web: construcción en In Design.
C OLEGIO DE B ACHILLERES N O.13 X OCHIMILCO, T EPEPAN C ARRASCO G ARCÍA L ORENA T ORRES H EREDIA C ARLA P ALMIRA G RUPO : 308 M ATUTINO E QUIPO : 12.
LE, EI, Profesor Ramón Castro Liceaga UNIVERSIDAD LATINA (UNILA) LENGUAJES DE PROGRAMACIÓN PARA EL DESARROLLO DE INTERFACES.
Portafolio de Evidencias
Título Calibri 28 puntos 2015 Subtítulos: Calibri mínimo 18 ptos y máximo 23 ptos.
¿QUE SON LAS ACTUALIZACIONES?  Las actualizaciones son adiciones al software que pueden evitar problemas o corregirlos, mejorar el funcionamiento del.
PARCIAL 1.
MOTORES DE BUSQUEDA.
Unidad 2: Tareas básicas de InfoPath 2010
Internet y Navegadores Unidad 5. Fecha: 1 de agosto de 2011 Periodo# : 2 Objetivo: identificar el contenido de una dirección web Tema: Elementos de una.
Photoshop.
Desarrollo de una biblioteca virtual con software libre Greenstone: una experiencia en América Latina Esta presentación esta en la página web de Clacso.
Sala de Lectura de la Red de Bibliotecas Virtuales Red de Bibliotecas Virtuales de América Latina y El Caribe de la Red de Centros Miembros de CLACSO septiembre.
UNIDAD II CREACION Y EDICIÓN DE AUDIO Y VIDEO
Colegio de Bachilleres Plantel 13 Xochimilco - Tepepan
TUTORIAL DE POWERPOINT
INSTALACIÓN Y ADMINISTRACIÓN DEL
Sistema de Alerta Rápida Interna SINAVEF. Alertas Sinavef Al ingresar a la parte privada del sistema de alerta nos encontramos con el menú principal el.
Proceso de desarrollo de Software
INSTRUCTIVO PARA EL MANEJO DE ZOTERO
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
I.LENGUAJE DE PROGRAMACIÓN JAVASCRIPT. El JavaScript es un lenguaje de programación interpretado, lo que significa que no necesita ser compilado. Proviene.
En el presente trabajo, se explica los diferentes elementos que nos ofrece Microsoft Access, para hacer mas fácil y rápido la realización de bases de.
Procesador de textos. Componentes de Word. Multiversidad Latinoamericana Campus Celaya Bachillerato Informática I Prof. Brayan Tula Villanueva 1er. Semestre.
Para cada uno de los atributos, indicaremos su campo de descripción. Cuando un campo no dispone de este (como el.
1.ª Parte: Dónde y cómo buscar información.  Cuando se busca información sobre un tema, es necesario emplear una «estrategia de búsqueda» para optimizar.
Módulo III.- Recursos en UPSA VIRTUAL Este módulo explica como configurar los distintos recursos que pueden encontrarse en un curso de MOODLE. Recurso:
VISUALIZAR IMÁGENES EN UN GRAFICO. Visualizar Imagenes ◦ Paso 1: Listar Ítems a incluir. ◦ Crea una lista que contenga la totalidad de los ítems a incluir.
COMUNICACIÓN Y TICS KÁROL FERNANDA BARRAGÁN M. JENNYLITH DAYANA ARDILA P. WENDY PAOLA PINTO F.
Transcripción de la presentación:

Greenstone Basado en el trabajo de Jesús Tramullas Depto. CC. Documentación /Univ. de Zaragoza

Greenstone… Es una aplicación para bibliotecas digitales… Su objetivo es trabajar con documentos con contenido textual, imagen, audio, video, etc. La interface de visualización es en html y permite una visualización total del contenido Organiza los documentos en colecciones… Permite desarrollar estructuras de organización de la colección…

Aplicaciones En organizaciones y/o servicios de información que utilicen documentos digitales Indexa y busca sobre texto completo además de hacerlo sobre los metadatos Es multilingüe: utiliza Unicode

Arquitectura Aplicación en Perl Usa el motor de representación y recuperación de información MG, o su versión avanzada MGPP, que usan el modelo vectorial Codifica toda la información en XML Necesita de un servidor web de soporte Incorpora una interfaz gráfica en Java

Requerimientos Versiones binarias ejecutables para Linux, Windows y Mac Requiere un intérprete Perl Requiere un servidor web Requiere Java Runtime Environment, JRE Para otros Unix hay código fuente que es necesario compilar

Greenstone en acción Da acceso a una interfaz predefinida, donde muestra las colecciones disponibles La selección de una de ellas lleva a la consulta de la misma La interfaz está muy estandarizada: barra de botones, campo de expresión de búsqueda y listado de respuestas El acceso es libre a la interfaz de busqueda y recuperación

La consulta en Greenstone Uso de las opciones en la barra de menú, y del campo de búsqueda Une los términos con AND Uso de comillas para frases Existencia de una interfaz más avanzada, a través de Preferencias Visualiza los documentos según haya sido predefinido por el creador de la colección

Creación de colecciones El proceso clave es la creación de colecciones Es necesario definir claramente el objetivo, contenido, características y organización de la colección Interfaces de creación: –Greenstone Librarian Interface, GLI –Línea de órdenes

Greenstone Librarian Interface, GLI Método recomendado (y recomendable) desde la versión 2.41a Interfaz en Java que necesita el JRE Integra todos los pasos necesarios para crear una colección Comprobar las Preferencias

Desarrollo de la colección, 1 Definir el nombre y la descripción de la colección Seleccionar el conjunto de metadatos a utilizar Crea un fichero básico de configuración de la colección Selección de los documentos a incluir Asignación de metadatos a cada uno de los documentos

Desarrollo de la colección, 2 Es necesario definir los tipos de documentos, y los plugins necesarios para su manipulación Definir tipos de búsqueda Definir índices para las búsquedas Definir los clasificadores Definir los formatos de presentación Construir la colección… e informe de errores

Plugins Son los procesadores de los tipos de documentos Son terceros programas, pueden aparecer nuevos Se pueden seleccionar y configurar Cuatro son necesarios: BasPlug, GAPlug, ArcPlug y RecPlug Los más importantes: TextPlug, WordPlug, PDFPlug, IsisPlug, Plug, ExcelPlug, LaTeXPlug, PSPPlug…

Clasificadores Criterios de organización de los documentos de la colección Suelen aparecer en forma de botones Clasificadores: –List –AzList, AzCompactList –DateList –Hierarchy –Phind…

Nuestra experiancia Instalación Linux Si bien tiene algunos inconvenientes ya que necesita que estén instalados ciertos componentes y en el manual de instalación no indica cuales, una vez que estos están instalados no tiene mayor dificultad, la inteface es buena y se configura fácilmente, en la versión 2.60 han corregidos alguno errores con respecto a esto.

Nuestra experiencia Interface para crear colecciones Muy amena e intuitiva, su pueden configurar los plugins que procesan los distintos tipos de documentos, se puede asociar un conjunto de metadatos a cada archivo de la colección, se puede indicar la forma de recuperación de las colecciones, (institución, letra, tema, etc), se puede editar el formato de visualización (no fue investigado a fondo) entre otras cosas.

Nuestra Experiencia Marcado de las tesis para que se puedan ver en capítulos El marcado es sencillo, cualquier persona con conocimientos intermedios de HTML lo puede hacer, lo recomendable en todos los casos es convertir el documento a html, por lo que habría que conseguir un buen programa, el mejor resultado que conseguí para convertir docs es con el CZ-Doc2html y después aplicando el Bresoft Word HTML cleanup, para “limpiar” el documento ya que deja mucho “basura” de Word al convertirlo, y esto dificulta el marcado. En el caso de pdf el procedimiento es el mismo. Después de la conversión hay que recorrer todo el documento de punta a punta para observar si se corresponde con el original, ya que puede haber algunos problemas con las tablas y listas. En promedio (depende de la cantidad de capítulos, exagerada muchas veces y de la fidelidad de la conversión) el formateo de la tesis en capítulos nos llevó entre uno y dos días de trabajo.

Nuestra Experiencia Tratamiento de tesis escaneadas En líneas generales el ocr interpretó bien el texto. En líneas generales el ocr interpretó bien el texto. Problemas: 1. Se pierden las listas, sobre todo si en lugar de puntos, se usó otro caracter. 2. Las tablas salen bien en cuanto al contenido, se pierde todo el formato, por lo que hay que reconstruirlas

Nuestra Experiencia 3. Imágenes y formulas, principal problema, no se puede obtener automáticamente, hay que escanear uno por uno, por lo que con una tesis con muchas formulas como es el comun en exactas, ingenieria, etc., el trabajo que lleva es mucho y tedioso. Una buena manera de tratar las formulas, podría ser, conseguir el texto en Word y escribirlas de vuelta con el constructor de formulas (se va a conseguir una calidad mejor que escanearlas, si bien es mas trabajoso) 4. El tiempo de tratamiento de las tesis escaneadas depende de la cantidad de gráficos y formulas que tengan.