Biblioteca Virtual, Repositorio Institucional y Observatorio Tecnológico Objetivo: Recuperar y gestionar toda la documentación científica, revistas, tesis, libros y normas cubanas. Autores: Hector Hdez cehhernandezv@gmail.com , Dayron Pérez dayron.pf@gmail.com
Resumen En la actualidad se genera gran cantidad de información científica en los diferentes centros de investigación, universidades, eventos nacionales e internacionales. Por lo que el acceso abierto y la gestión de la información es de gran importancia. Igualmente hacer uso de herramientas informáticas que permiten organizarla y recuperarla fácilmente. Por lo que se desarrolla una herramienta web con tecnología opensource que permite indexar a texto completo los documentos en formato PDF y brindar un fácil acceso a las diferentes tesis e investigaciones. Esta herramienta conocida como “Biblioteca Virtual o Repositorio Institucional” permite organizar y recuperar rápidamente toda la información científica de la universidad, centro de investigación del país o empresa.
Tecnologías OpenSource PHP 5.3 MYSQL FRAMEWORK CODEIGNITER HTML5 CSS3 BOOTSTRAP + RESPONSIVE DESIGN JAVASCRIPT Las tecnologías seleccionadas permite facilmente instalarla en cualquier PC con un servidor web. Ya sea en Linux o Windows.
Funcionalidades Buscador a texto completo, al estilo de Google con imagen previa del Documento. Algoritmo de relevancia a la hora de recuperar los documentos. Componente Social con autenticación de usuarios. Permite tener mas de 100.000 documentos indexados. Sujeto a factores como potencia de cálculo y capacidad de almacenamiento. Los documentos se clasifican por Bibliotecas o Colecciones. Indexa documentos en español, Inglés y otros idiomas. Indexa documentos en formato PDF, DOC, PPT, TXT, HTML.
Ventajas Acceso instantáneo a la información. Al indexar el texto completo los documentos pueden ser encontrados para cientos de palabras claves. Y no exclusivamente para el Titulo o Descripción. Resultados de la búsqueda al estilo de Google donde se muestra el resumen con la mayor concentración de la palabra que se está buscando. Facilidad de crear nuevas colecciones e indexar miles de documentos a texto completo de forma automática. El título es extraído de los primeros 100 caracteres. Funcionalidad Social permite comentar un documento y obtener retroalimentación. Los documentos pueden ser organizados por diferentes criterios de ordenamiento. Facilidad de administración de miles de documentos.
Valor Añadido Como valor añadido se creó una metodología de trabajo para digitalizar y preparar los documentos que van a ser indexados. Se identificó una herramienta que permite reconocer los caracteres de las imágenes escaneadas de revistas y libros. La herramienta genera un PDF con texto editable, listo para ser indexado por la Biblioteca Virtual a texto completo.
Página de Inicio (Home). 3 1 2
Página de Inicio (Home). 1 Buscar en todos los documentos de la Biblioteca Virtual. Área en donde se encuentran las categorías principales. Menú principal en donde se puede acceder en todo momento a las Bibliotecas y a las Normas Técnicas. 3 2 1 2 3
Ejemplo de Búsqueda 5 1 4 2 6 3
Ejemplo de Búsqueda 1 Título del Documento: al dar clic re- direcciona para un diseño interior con todos los metadatos del documento. Resumen en donde más veces aparece la palabra que se está buscando. Nombre del fichero + el tamaño del fichero. Importante: Al dar clic se descarga el documento a texto completo. Ordenar ascendente o descendente según el algoritmo de relevancia. Mostrar los resultado por ejemplo de 100 en 100. En todo momento se pueden buscar nuevas palabras claves. Imagen Inicial del PDF. 5 2 1 4 2 6 3 3 4 5 6
Trabajo Futuro Tener en cuenta en el algoritmo de relevancia aquellos documentos que más veces han sido descargados, comentados y aparecen como favoritos en varios perfiles de usuarios. Agregar nuevos filtros a los resultados de la búsqueda. Agregar funcionalidad de exportación de citas o de los metadatos del documento a estándares internacionales compatibles con otras herramientas. Agregar nuevas funcionalidades sociales. Por ejemplo: compartir el documento con un amigo a través de las redes sociales.
Conclusiones Es cada vez mas importante el acceso abierto a la información científica, por lo que con esta Biblioteca Digital se resuelve el problema de recuperar fácilmente miles de documentos. En esta biblioteca se logró indexar mas de 100 000 PDF a texto completo y una componente social que permite realizar comentarios a cada documento.