Categorización de documentos del Centro Virtual Cervantes Fernando García Eddy Rodriguez Paula Zitinski.

Slides:



Advertisements
Presentaciones similares
CUPS Configuración y Uso de Paquetes de Software
Advertisements

Todo el Software necesario puede ser conseguido por separado. Para facilitar la puesta al punto del ambiente, nosotros utilizaremos una herramienta particular.
Sistemas de Control de Versiones
PLATAFORMAS 0. INTRODUCCIÓN
Opciones bajo el comando Tools del menú principal
GLOSARIO TIC KATIA REATIGA OTALORA UMB VIRTUAL AÑO 2012.
Stuart Pérez A12729.
Estructura para servidores de servicios en redes IRC
Ingeniería en Sistemas computacionales Fundamentos de programación
MI PROGRAMA DE FORMACION
DESARROLLO E IMPLEMENTACIÓN DE UN PLUGIN DE GOOGLE WALLET PARA PAGOS ONLINE UTILIZANDO SOFTWARE OPEN SOURCE.
Por: Carlos Aucancela Tatiana Pozo
Control de versiones con Subversion v1.0 © 2012.SOPORTE. DIS. Ronald De La Cruz Cueva Equipo de Soporte USMP.
Control de versiones con Subversion v1.1 © 2012.SOPORTE. DIS. Ronald De La Cruz Cueva Equipo de Soporte USMP.
Índice 1. Introducción, objetivos y justificación del proyecto.
Compilador HTML David Morales Marco Jiménez Carlos Márquez
Proyecto de Ingeniería de Software 2008
Visual Studio 2005 Gestión del Ciclo de Vida Jose Murillo Responsable programas técnicos para Fabricantes.
En este tutorial veremos como descargar e instalar el Entorno de Desarrollo Eclipse para trabajar con PHP. Eclipse es uno de los mas poderosos editores,
Programación 1 Introducción
Sistema de Administración de Subastas Inversas
Experiencia de un líder de desarrollo J2EE
Herramientas QA Morax.
CGI.   Cuando el World Wide Web inició su funcionamiento como lo conocemos, empezando a tomar popularidad aproximadamente en 1993, solo se podía apreciar.
Trabajo Práctico Taller de Desarrollo de Proyectos 2 Septiembre 2009.
Bib Manager and Citer Gestor de referencias bibliográficas.
Integrantes: Arce Diego Chiguano Cristian Freire Santiago Herrera Ernesto Padilla Lorena Paucar Juan Sosa Daniela Tarapués Damaris Uvidia Daisy Vargas.
 Tema del proyecto  Integrantes y roles del equipo  Objetivos del proyecto  Alcance.
Taller de Proyectos 2 Presentación. Objetivos Desarrollar un software con calidad a partir de los requisitos definidos en Taller de Proyectos 1 Análisis.
ACIDE A C onfigurable I ntegrated D evelopment E nvironment (Un entorno integrado de desarrollo configurable)
F RAMEWORKS DE DESARROLLO JAVA,.NET Deisy Pérez Sánchez.
Proyecto final de carrera ALEJANDRA CARREÑO MÉNDEZ
J2EE Java Enterprise edition eilin chang Matthew pabon Gabriel vega.
Programacion Web Practica 1 Estudio de la aplicación distribuida: Apache Hadoop.
Mock objects Rosemary Torrico Bascopé. Introducción Las Pruebas de unidad han sido aceptadas como la “mejor práctica” para el desarrollo de software.
Eddy Bermudez.   conservación del aviso de copyright.  no es una licencia copyleft  no requiere la redistribución del código fuente cuando se distribuyen.
Automatización Informes de Calidad Automatización Informes de Calidad Situación Real AGENDA.
Problema de inclusión en una Curva Digital Por Orellana Muñoz, Alfonso Paz Vicente, Rafael Pérez Medina, Gerardo Rodríguez Naranjo.
ANÁLISIS DE FACTIBILIDAD Y SELECCIÓN DE UN FRAMEWORK DE BÚSQUEDA GLOBAL PARA SU IMPLEMENTACIÓN EN EL SISTEMA GESTOR FIDUCIA FONDOS JEE DE LA EMPRESA GESTORINC.
Web Services bajo J2EE WASP Server for Java de Systinet
LSQA + Equipo Proyecto  Definir Proceso: A nivel de la Organización A nivel de Proyecto Actividades SQA: – Asegurar que el Producto cumple con los Requisitos.
FRAMEWORK VS Código fuente
Cloud Computing Grupo 4 de computación y programación
Pruebas y La Vida del Ciclo de Desarrollo del Software
Especialización en Desarrollo de Software
Programación Java y Desarrollo de Aplicaciones Modulo 3 Lenguaje de programación Java Software utilizado.
Alternativas a Office Suites Ofimáticas.
Taller de Proyectos 2 Presentación. Objetivos Desarrollar un software con calidad a partir de los requisitos definidos en Taller de Proyectos 1 Diseño.
ESCUELA NORMAL PARA EDUCADORA ‘’PROFR. SERAFIN CONTRERAZ MANZO’’
Taller de Proyectos 2 Presentación. Objetivos Desarrollar un software con calidad a partir de los requisitos definidos en Taller de Proyectos 1 Diseño.
MOTORES DE BUSQUEDA.
Antonio López Gracia Fernando Noain Fernandez Ricardo Meana de la Llave
Introducción al proceso de verificación y validación.
MEDIOS TELEMÁTICOS OPEN SOURCE MÁS POPULARES
Naime Cecilia del Toro Alvarez
Tutor: Ing. Juan E. Talavera Horn 2010 Google Web Toolkit (GWT)
ADN2 Diseño ágil de noticias Historia de un trabajo profesional.
Categorización de noticias web
Presentación Técnica DESCRIPCIÓN DE LA TECNOLOGÍA UTILIZADA PARA EL DESARROLLO DEL SISTEMA.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Facultad de Ciencias Exactas Universidad Nacional del Centro de la Provincia de Buenos Aires (UNICEN) Nicolás A. Tourné Directora: Dra. Daniela Godoy Tandil,
Análisis y Balance del Proyecto Análisis Inicial Estimación Inicial Arquitectura de Datos Propuesta Tecnología Metodología aplicada Estimaciones elaboradas.
BUSINESS T&G Think & Grow Uniclass Gestión Documental Solución Web para Mejorar la Captura y Gestión.
Guía rápida de instalación de Sakai Dr. David Roldán Martínez ASIC, Universidad Politécnica de Valencia.
Aplicación Móvil - Eclipse SDK. Primero debemos comprobar si disponemos en nuestro ordenador del JDK, es decir, el software necesario para escribir código.
SIGEP Presentación de Resultados SIGEP. SIGEP Ambiente de Desarrollo  Plataforma Java ( J2EE,JRE,JDK,JVM ).  Contenedor Web ( Tomcat 5 )  Control de.
Taller de Desarrollo de Proyectos II 2do Cuatrimestre 2012 Grupo 4.
Archivador web Proyecto de colaboración para el LSI Autor: Adrián Mesa Pachón Contacto:
ALUMNO ALUMNO: DIEGO URES LEGAJO LEGAJO: La prueba unitaria es la herramienta para la Calidad Presentación Trabajo Final de Grado.
Transcripción de la presentación:

Categorización de documentos del Centro Virtual Cervantes Fernando García Eddy Rodriguez Paula Zitinski

Introducción del proyecto Clasificación de las páginas web del Centro Virtual Cervantes La clasificación actual - incompleta: Música Enseñanza Artes Literatura Lengua

Alcance Crear un clasificador que se pueda aplicar a las páginas del CVC Este clasificador tendrá que cumplir los siguientes requisitos: Entrada desde un fichero de texto Salida a una base de datos Usar, en la medida posible, distintos frameworks La clasificación debe producirse sin (demasiados) errores Debe terminar en tiempo aceptable

Entorno software 1. Eclipse (Java) Entorno de desarrollo integrado de código abierto

2. Lucene es un framework de código abierto para recuperación de información Búsqueda de palabras en documentos Problema – analizador en inglés Solución – adaptación de la librería a través de un fichero externo (300 palabras)

3. SVN Sistema de control de versiones Compatible con Eclipse

4. Google code Espacio web para el almacenamiento de proyectos de código abierto Página web:

5. JUnit Librerías de código para hacer pruebas unitarias y de integración

6. Jericho HTML Parser Librería de Java para el tratamiento de páginas web Al final no lo utilizamos – sacaba información irrelevante

Sistema desarrollado Estructura general del proyecto

Ficheros de entrada: Base – páginas web, ya categorizadas SpanishSmart – lista de palabras ruido Test – páginas web no clasificadas Salida del programa: Base de datos

Objetos del proyecto (despliegue)

Lista de funcionalidades de la aplicación hasta el momento

Pendiente de desarrollo Cambiar el modo de introducción de páginas web a categorizar Implementar la función de similitud Implementar el almacenamiento de resultados Calcular la validez del código (JUnit)

Bibliografía Código de nuestra página web: ary/os-ecl-subversion ary/os-ecl-subversion

¡Ahora, vosotros!