ANÁLISIS DE FACTIBILIDAD Y SELECCIÓN DE UN FRAMEWORK DE BÚSQUEDA GLOBAL PARA SU IMPLEMENTACIÓN EN EL SISTEMA GESTOR FIDUCIA FONDOS JEE DE LA EMPRESA GESTORINC.

Slides:



Advertisements
Presentaciones similares
AUDITEL V 5.0 Software de tarificación
Advertisements

Intranets P. Reyes / Octubre 2004.
Microsoft Office Sharepoint Server Business Intelligence Rubén Alonso Cebrián Código: HOL-SPS07.
Introducción a servidores
PORTAL DE TRANSPARENCIA
I T S S P LIC INFORMATICA SISTEMAS OPERATIVOS WINDOWS 2003 SERVER DOCENTE: L.I RAMIRO ROBLES VILLANUEVA ALUMNOS: ROGELIO CHAIDEZ CORDOBA ZENON ESTRADA.
CREACION DE ESPACIOS VIRTUALES PARA TRABAJO EN EQUIPO
Sistema desarrollado Control de la Producción
Experiencia e innovación
Almacenamiento en la nube
SILVIA BEATRIZ GAVILANES NARANJO KELLY VERÓNICA CARVAJAL CUJI
DESARROLLO E IMPLEMENTACIÓN DE UNA TIENDA VIRTUAL UTILIZANDO OSCOMMERCE, CASO PRÁCTICO TIENDA VIRTUAL PARA MATERIAL ELÉCTRICO Y TELEFÓNICO DE MEDIA Y BAJA.
DESARROLLO E IMPLEMENTACIÓN DE UN PLUGIN DE GOOGLE WALLET PARA PAGOS ONLINE UTILIZANDO SOFTWARE OPEN SOURCE.
ESCUELA POLITÉCNICA DEL EJÉRCITO CARRERA DE INGENIERÍA DE SISTEMAS
Índice 1. Introducción, objetivos y justificación del proyecto.
Microsoft Office.
Windows XP sp3.
Infraestructura de Tecnologías de Información
TEMA: SISCONT-GOLD INTEGRANTES: SOFIA GALIZA SANCHEZ
Software La buena programación no se aprende de generalidades, sino viendo cómo los programas significativos pueden hacerse claros, “fáciles” de leer,
Marzo 2003.
HERRAMIENTAS CASE.
UNIVERSIDAD DE LA FF. AA. ESPE CARRERA DE INGENIERIA DE SISTEMAS PROYECTO DE TESIS : “Análisis, diseño, construcción e implementación de una Guía Interactiva.
Lisette E. Espín Noboa Análisis, diseño e implementación de una red social para ESPOL Digital utilizando herramientas 2.0 Lisette.
Programas computacionales para el manejo de datos, requisitos para su instalación y aplicación Jaime Escobar Melero Gerente de.
Propósito: * Mostrar indicativos porcentuales de los diversos microorganismos con los que se alimentan el camarón en un manejo semi-intensivo aplicado.
SISTEMAS OPERATIVOS EN LOS QUE FUNCIONA
/ Teléfono : Web : Build Solutions IT.
Unidad VI Documentación
Un gestor (o administrador) de descargas es un programa diseñado para descargar ficheros de Internet, ayudado de distintos medios para ir pausando y reanudando.
Marco Conceptual para la Gestión de Conocimiento de entornos de colaboración: aplicación a la creación de un portal de revistas electrónicas EUITIO Daniel.
Servidores Conceptos Generales.
Eguana Reports Servidor de Reportes basado en Tecnología Java y XML Presentado por: Roy Cox S. Fernando Pérez M. José Pérez S.
ESTE ARTICULO EXAMINA: LOS COMPONENTES DE UN SISTEMA DE INFORMACIÓN DE GESTIÓN DEL CICLO DE VIDA.
UNIDAD EDUCATIVA CALASANZ Manual de usos de WORDPRESS. NOMBRE: Melissa Veintimilla Labanda Curso: 1º ´´C´´ FECHA: 29 de marzo del 2015.
GUTIÉRREZ GRANADOS HÉCTOR DANIEL
Software para la gestión de contenidos. Índice: Por qué CanaryWeb CM ? Solución Tecnológica. Características de CanaryWeb CM. Referencias.
MICROSOFT POWER POINT 2010.
 Un servidor proporciona información a los ordenadores que se conecten a él.  Cuando lo usuarios se conectan a un servidor pueden acceder a programas,
Unidad 3: Adquisición de Paquetes de Software Msc. Lic. Susana I. Herrera - Lic. Paola Budán UNSE 2012.
Definición Requisitos Versiones Instalación WSUS Juan Álvarez – Emilio Ayala – Camilo Turra – Daniel Pranao Sección 107 – Ing. Telecomunicaciones Profesor:
Windows server 2008 es un sistema operativo para servidores diseñado por Microsoft.
CMS DRUPAL HERRAMIENTAS DE DISEÑO CARLOS LLANOS V. JENNIFER QUINDE G. JUAN MACIAS B. KERLY UBE.
Microsoft power point Giancarlo ciani.
¿QUE SON LAS ACTUALIZACIONES?  Las actualizaciones son adiciones al software que pueden evitar problemas o corregirlos, mejorar el funcionamiento del.
FACULTAD: CIENCIAS ECONÓMICAS Y EMPRESARIALES ASIGNATURA: GESTIÓN DE CONTENIDO ELECTRÓNICO TÍTULO: TINFOPATH - VENTAJAS Y USO. AUTORA: MARIA DANIELA TOMALÁ.
DISEÑO CURRICULAR Presentado por: Cesar Augusto Sáenz María Alejandra Hernández 1.contenidos curriculares de competencia.
Presentaciones con Power Point
Naime Cecilia del Toro Alvarez
BASE DE DATOS DISTRIBUIDAS
¿QUE ES INTERNET? La Internet es una red de redes. Actualmente conecta miles de redes para permitir compartir información y recursos a nivel mundial. Con.
APACHE WEB SERVER El proyecto Apache Web Server es un desarrollo de software en colaboración, enfocado en crear una implementación de un servidor HTTP.
Colegio de Bachilleres Plantel 13 Xochimilco - Tepepan
AFM – Web File Manager Versión 5. Novedades técnicas – Forma de Implementación Siguiendo última tecnología de Microsoft: Framework.NET 3.5 Implementación.
INTERFAZ DE ACCESS  Access es un sistema gestor de bases de datos relacionales (SGBD). Una base de datos suele definirse como un conjunto de información.
Gestión Electrónica Documental (GED)
Google Drive es un servicio de almacenamiento de archivos en línea.
Google Drive es un servicio de almacenamiento de archivos en línea. Fue introducido por Google el 24 de Abril del Google Drive actualmente es un.
BUSINESS T&G Think & Grow Uniclass Business Intelligence La solución Business Objects que analiza los procesos de su negocio.
Bases de Datos y Sistemas de Gestión de Bases Relacionales.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
EI, Profesor Ramón Castro Liceaga IV. AREAS DE EVALUACIÓN DE LA AUDITORIA EN INFORMÁTICA. UNIVERSIDAD LATINA (UNILA)
Son antivirus especialmente diseñados ara ofrecer protección desde la nube, salvaguardando al usuario contra nuevo códigos maliciosos prácticamente en.
BUSINESS T&G Think & Grow Uniclass Gestión Documental Solución Web para Mejorar la Captura y Gestión.
Autores: Myriam Montes, Iván Viera, Carlos Caizaguano, José Sancho
Conociendo el modelo Cliente-Servidor
DLM Transact SQL Sesión I Introducción al SQL Server Uso de las herramientas de consultas del Transact SQL.
Internet Infranet Protocolo World Wide Web Hipertexto Página web Sitio web Protocolo http Código HTML Editores HTML Portal Url Navegadores: A. Internet.
13/11/14. UNIDADES DEL SEMESTRE Este trabajo esta diseñado para saber los propósitos de los sistemas de información, así como el buen desempeño que le.
Transcripción de la presentación:

ANÁLISIS DE FACTIBILIDAD Y SELECCIÓN DE UN FRAMEWORK DE BÚSQUEDA GLOBAL PARA SU IMPLEMENTACIÓN EN EL SISTEMA GESTOR FIDUCIA FONDOS JEE DE LA EMPRESA GESTORINC Jessica Carolina Balarezo Galarza PROYECTO DE GRADO PARA LA OBTENCIÓN DEL TÍTULO EN INGENIERÍA

AGENDA Introducción Planteamiento del Problema Justificación e Importancia Objetivos Marco Teórico Implementación Conclusiones y Recomendaciones

Introducción Repositorios de datos Rápido Acceso a la información

AGENDA Introducción Planteamiento del Problema Justificación e Importancia Objetivos Marco Teórico Implementación Conclusiones y Recomendaciones

Planteamiento del Problema

AGENDA Introducción Planteamiento del Problema Justificación e Importancia Objetivos Marco Teórico Implementación Conclusiones y Recomendaciones

Justificación e Importancia Investigación de nuevas tecnologías, que sean fáciles, rápidas, confiables y seguras, para facilitar el trabajo diario. Selección entre Oracle Secure Enterprise Search y ApacheLucene y Apache Tika.

AGENDA Introducción Planteamiento del Problema Justificación e Importancia Objetivos Marco Teórico Implementación Conclusiones y Recomendaciones

Objetivo General Analizar la factibilidad y selección de un framework de búsqueda global mediante la implementación en el Sistema Gestor Fiducia Fondos para mejorar su funcionamiento dentro de la empresa Gestor.

Objetivos Específicos Facilitar las búsquedas de documentos en el sistema Gestor Fiducia Fondos. Presentar un cuadro comparativo de los frameworks seleccionados y escoger el mejor según los resultados obtenidos. Diseñar el proceso de solicitud, indexación, búsqueda y respuesta de los documentos almacenados en la base de datos de acuerdo al framework seleccionado. Realizar un control de versionamiento del sistema de acuerdo al framework seleccionado.

AGENDA Introducción Planteamiento del Problema Justificación e Importancia Objetivos Marco Teórico Implementación Conclusiones y Recomendaciones

La práctica de la gestión documental está dada por un conjunto definido de normas técnicas y algunas prácticas generales que son usadas para: Especificar en qué tiempo deben almacenarse los documentos Administración del flujo de documentos de todo tipo en una organización Recuperación de la información Eliminación de los documentos que ya no sirven La conservación de todos los documentos que se consideren valiosos indefinidamente. Gestión Documental

Un algoritmo de búsqueda es un algoritmo para encontrar un elemento con propiedades especificas entre una colección de elementos. Hay dos tipos de algoritmos de búsqueda: algoritmos que no hacen suposiciones sobre el orden de la lista y los algoritmos que a sumen que la lista ya está en orden. Algoritmos de Búsqueda

El proceso de indexación consiste en analizar y extraer de entre toda la información disponible, la verdaderamente relevante. Posteriormente, con esa información se crea el índice a partir del cual se realizarán las búsquedas. El índice es una estructura de datos que permite el acceso rápido a la información, algo similar semánticamente a lo que podría ser el índice de un libro. Indexación

Oracle Secure Enterprise Search es una aplicación independiente de búsqueda integrada. Oracle SES se integra con modelos de seguridad populares para mantener su contenido y la seguridad del índice de búsqueda. Rastrea el contenido no estructurado y estructurado. Devuelve resultados de alta calidad integrados desde los repositorios de intranet y extranet según su configuración. Oracle Secure Enterprise Search

Capacidad para buscar y localizar contenidos públicos, privados y compartidos a través de Intranet servidores web, bases de datos, archivos en el disco local o en servidores de archivos, correo electrónico IMAP, sistemas de gestión de documentos, aplicaciones y portales. Una interfaz simple, búsqueda intuitiva que lleva a una excelente experiencia de usuario. Alta seguridad en el rastreo, indexación y búsqueda en los diferentes repositorios. Oracle Secure Enterprise Search Características

Software Navegadores: Firefox 3.x Internet Explorer 7.x, 8.x Safari 4.x Sistemas Operativos: Windows Server 2003 (64-bit). Windows Server 2003 R2 (64-bit). Windows XP Profesional x64. Windows Server 2008 R1 SP1 o service pack más alto (64-bit). Oracle Secure Enterprise Search Requisitos de Hardware y Software Hardware Mínimo 2GB de espacio en disco. 1 GB para la instalación. 0,5 GB para crear el índice inicial de Oracle SES Para indexar documentos: 4 GB de espacio en disco. 2 GB de RAM. Para indexar documentos: 20 GB de espacio en disco. 6 GB de memoria RAM.

Máximo nivel de seguridad La gama más amplia de fuentes de datos empresariales La rentabilización más rápida Buscar en todos los repositorios Oracle Secure Enterprise Search Ventajas

Oracle Secure Enterprise Search Estructura

Lucene fue originalmente escrito por Doug Cutting. En septiembre de 2001, se unió a la familia de Jakarta de Apache Software Foundation de los productos de Java de código abierto de alta calidad. La versión de Apache Lucene fué liberada fue el 20 de Mayo del Apache Lucene Historia

Potente, preciso y eficiente algoritmo de búsqueda. Búsqueda por rangos de fecha. Se puede ordenar por cualquier campo. Múltiples índices de búsqueda con resultados combinados. Permite la actualización y búsqueda simultánea. Puede indexar y realizar búsquedas sobre cualquier dato que pueda ser convertido a texto desde páginas web hasta documentos Microsoft Word pasando por archivos PDF. Apache Lucene Características

Detecta y extrae los metadatos y el contenido de texto estructurado de documentos en diferentes formatos (Microsoft Word, Excel, Power Point, PDF, txt, etc) mediante bibliotecas analizadoras existentes. Apache Tika

La idea de Tika fue originalmente propuesta en el proyecto de Apache Nutch. Nutch se describe mejor como un marco de código abierto para la búsqueda en la Web a gran escala. El proyecto comenzó como una idea original de Doug Cutting Apache Tika Historia

AGENDA Introducción Planteamiento del Problema Justificación e Importancia Objetivos Marco Teórico Implementación Conclusiones y Recomendaciones

Implementación de Oracle Secure Enterprise Search (SES)

Creación del Origen

Creación de la Calendarización (Schedules)

Administración de la Calendarización

Creación de la funcionalidad para la búsqueda documental

Implementación de la Aplicación de Búsqueda Gestor Search

AGENDA Introducción Planteamiento del Problema Justificación e Importancia Objetivos Marco Teórico Implantación Conclusiones y Recomendaciones

Terminado el desarrollo de la aplicación Gestor Search utilizando las librerías Apache Lucene y Tika y su integración con el sistema Gestor se ejecutaron pruebas en las que se obtuvo buenos resultados en tiempos de búsqueda, menores a 2 segundos utilizando un conjunto de 500 archivos los cuales aproximadamente representan 10GB de espacio en disco. Para la empresa GestorInc. S.A. fue una gran ayuda la implementación de esta aplicación ya que se consiguió facilitar el proceso de búsqueda que los clientes realizan sobre los documentos almacenados en el repositorio del sistema Gestor G5 Trust. La ventaja de la implementación de la aplicación Gestor Search es su compatibilidad con el sistema Gestor tanto en requisitos de hardware y software, por esta razón los clientes no se ven en la obligación de incurrir en costos relacionados a la adquisición de una infraestructura Conclusiones

Recomendaciones Para la implementación de Apache Lucene y Tika no se debe adquirir un equipo dedicado ya que estará integrado en el mismo sistema y así facilitará su manejo. La indexación de los documentos no está diseñando para que realice automáticamente el proceso ya que si se lo hace puede llegar a saturar la base de datos por eso se debe realizar la indexación solo cuando se registre nuevos documentos. Se debe tener en cuenta las nuevas versiones de Apache Lucene y Tika para que la aplicación “Gestor Search” no quede obsoleta, esté actualizada y se pueda desarrollar nuevas cosas.