ESCUELA POLITÉCNICA DEL EJÉRCITO DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN TÍTULODEL PROYECTO: “SISTEMA AUTOMATIZADO DE BÚSQUEDA WEB (WEB CRAWLERS) DE.

Slides:



Advertisements
Presentaciones similares
MOVIMIENTO JOVENES DE LA CALLE CIUDAD DE GUATEMALA chi siamo quienes-somos qui sommes-nous who we are attività actividades activités activities scuola.
Advertisements

SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR
SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR
1 Datos sobre webloggers Datos extraidos de la encuesta a webloggers disponibles en la web de los autores.
el 1, el 4 y el 9 tres cuadrados perfectos autosuficientes
SISTEMAS II CICLO DE VIDA.
Paso 1 Portada YO SOY EUROPEO Comisión Europea.
Seminario El Futuro del Seguro de Vida
1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN EL COMERCIO GALLEGO (Resumen COMERCIO AL DETALLE) Noviembre de 2004.
1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN LAS EMPRESAS GALLEGAS ( Resumen PYMES ) Noviembre de 2004.
1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN LAS EMPRESAS GALLEGAS (MICROEMPRESAS, resultados provisionales) 29 de julio de 2004.
1 LA UTILIZACION DE LAS TIC EN LAS PYMES GALLEGAS AÑO Resumen. 24 de Junio de 2005.
AYUDA A LA FUNCIÓN DOCENTE Internet
Open RA 10/25/00 EEM/TD/LQ M. F. Juan 1 La Función de Calidad en los Proyectos de Desarrollo de Software Manuel F. Juan Martínez Juan López Espinosa Centro.
Aranda Fernández, Miguel Ángel García Redondo, Luis Miguel
02- Plan Organización Docente v.2 Noviembre 2009 SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR.
02- PLAN DOCENTE Febrero 2009 SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR.
Respuestas Buscando a Nemo.
Fundamentos de Diseño de Software INFT.1
Metodología de la Investigación Social
Presentación 20 de Mayo 2009.
MOVIMIENTO JOVENES DE LA CALLE CIUDAD DE GUATEMALA chi siamo quienes-somos qui sommes-nous who we are attività actividades activités activities alimentazione.
Funciones Excel. Parte 1. Introducción 2 Una función Excel es una fórmula o un procedimiento que se realiza en el ambiente de Visual Basic, fuera de.
Autodesk Civil 3D 2007 Essentials
Phone2Wave-Server Manual de Operación.
4. Mantenimiento de los espacios de trabajo. Manual de formación 2 4. Modificación de los espacios de trabajo 4.1 Introducción……………………………….……..……..…pág.
Resolución de Problemas
50 principios La Agenda 1.- Presentar un único interlocutor a los clientes. 2.- Tratar de modo distinto a las diferentes clases de clientes. 3.- Saber.
Diseño organizacional,
lean Sigma – Fase de Definición
INFORME USDA NOVIEMBRE TRIGO 2 MERCADO INTERNACIONAL (Millones de Toneladas) 3.
Trascendencia de este curso Curso Introducción a la Computación 1
PLAN MAESTRO PARA EL MEJORAMIENTO DE LOS SERVICIOS DE AGUA POTABLE, ALCANTARILLADO Y SANEAMIENTO DE LA CIUDAD DE CANANEA, SONORA TABLA DE CONTENIDO.
EL OSO APRENDIZ Y SUS AMIGOS
1 SEGUNDO FORO REGIONAL HERMOSILLO, SON Sistema Nacional de Transparencia Fiscalización y Rendición de Cuentas:
50 principios 1. Los clientes asumen el mando.
Proyecto para Centros que trabajan una vez por semana.
Oscar Navarrete J. Jorge Gutiérrez A.
Juan Andrada Romero José Domingo López López
Juan Andrada Romero José Domingo López López
Parte 1: Modelo de Casos de Uso del Negocio
Investigación Algorítmica
Proyecto Fin de Carrera E.T.S. Ingeniería Informática 26 de Septiembre de 2006 DESARROLLO DE UN COMPONENTE TECLADO ALUMNO: Fco. Javier Sánchez Ramos TUTORES:
Administración de Procesos de Pruebas
Ingeniería del Software
Aplicación elementos del MECI 1000:2005
CULENDARIO 2007 Para los Patanes.
Reunión de los requerimientos de la red
Índice Sesión I Bloque I (09:30 a 10:30 Horas) Configuración Inicial
BEATRIZ LAFONT VILLODRE
APENDICE TEMA 4. MÉTRICA DE LOS PUNTOS DE FUNCIÓN
Procedimientos Estándares de Operación Sanitaria (SSOP)
AUDITORIA DE LA SEGURIDAD en Telecomunicaciones y redes de computadoras Unidad VI.
1 ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL PRESENTACIÓN DE LA TESIS Presentada por: Guayaquil, Noviembre 2007 ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL.
Agrupamiento de relaciones no lineales entre expresiones de genes
1 Escenarios Futuros Ingeniería de Requisitos. 2 Obtener Requisitos Explícitos Comprender el UdeD Actual Definir Requisitos del SW Comprender el UdeD.
1.  Contribuir a la competitividad de las empresas mediante la capacitación y actualización tecnológica de sus trabajadores y la mejora del proceso de.
ESTRATEGIAS DE BUSQUEDA A CIEGAS
Solución de problema Herramientas aplicables
1 BALONCESTO PARA NOVATOS Alcobendas 15 de mayo de 2008 GUILLERMO HERNANDEZ PEÑALBA.
Manual de Procedimientos Procedimiento de ejecución del programa de
1 LOS PROBLEMAS DE DISEÑO EN INGENIERÍA: CONCEPTO Y FORMULACIÓN NELSON VÍLCHEZ UNIVERSIDAD TECNOLÓGICA DEL CENTRO COORDINACIÓN DE INGENIERÍA.
Estadística Administrativa II
FUNDAMENTOS DE CALIDAD EN LA GESTIÓN PÚBLICA
Ingeniería del Software
El rol de SQA en PIS.
Introducción al proceso de verificación y validación.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Metodología para el Diseño de Sitios WEB
Transcripción de la presentación:

ESCUELA POLITÉCNICA DEL EJÉRCITO DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN TÍTULODEL PROYECTO: “SISTEMA AUTOMATIZADO DE BÚSQUEDA WEB (WEB CRAWLERS) DE PROMOCIONES DE TICKETS AÉREOS Y PORTAL WEB PARA LA AGENCIA DE VIAJES Y TURISMO MUNDO VALLE”. Autor: Christian Córdova

Agenda Introducción. Objetivo del Proyecto. Algoritmo Implementación Presentación de la Aplicación Conclusiones.

Introducción Definición Web Crawlers Es un programa que recorre las páginas del World Wide Web de forma metódica y automatizada, las descarga y procesa, comienzan visitando una lista de URL, identifican los hiperenlaces en dichas páginas y los añade a la lista a visitar de manera recurrente de acuerdo a determinado conjunto de reglas.

Introducción Entre ellos estan las arañas, bots, buscadores, web Crawlers. Algunas de las tareas más comunes de las arañas web están las siguientes: Crear el índice de una máquina de búsqueda. Analizar los enlaces de un sitio para buscar links rotos. Recolectar información de un cierto tipo, como precios de productos para recopilar un catálogo.

Introducción Los tipos de busqueda determinados para trabajar con las arañas web son: Índices de Búsqueda Motores de Búsqueda Metabuscadores

Objetivo General del Proyecto Analizar, Desarrollar e Implementar el Sistema Automatizado de Búsqueda Web (Web Crawlers) de promociones de Ticket Aéreos y Portal Web para la Agencia de Viajes y Turismo Mundo Valle Cía. Ltda., mediante la utilización de software libre.

Objetivos Específicos Investigar los principios en los que se basan los algoritmos de búsqueda de datos a través de grandes cantidades de información y seleccionar el más óptimo de ellos para este sistema. Analizar la administración y funcionamiento de la Agencia. Desarrollar el portal web de la agencia y el pago en línea Implementar y realizar las pruebas necesarias del sistema para detectar problemas de rendimiento.

Conceptos Generales del Proyecto

BUSCADOR Programa, que permite encontrar contenidos, archivos, páginas Web y demás recursos. Desde el punto de vista del usuario no es más que una página Web, desde el punto de vista de una página Web.

SECUENCIA BÁSICA DE UN BUSCADOR

Pseudo-Algoritmo Inicializar las URLs Verificar la finalización, agregar a la pila Encontrar los enlaces Procesar las páginas Agregar las URLs a ser procesadas ** la pila contiene una lista para el web crawler de URLs no visitadas con nuevas páginas y enlaces.

BÚSQUEDA DE INFORMACIÓN

BÚSQUEDA DE INFORMACIÓN

MODELO MDA- DESARROLLO BASADO EN MODELOS

PROCESO DE DESARROLLO DE SISTEMA CON MDA

METODOLOGÍA MIDAS-MDA

PROCESO DE DESARROLLO DE MIDAS

FASES DEL MÉTODO DE INDUCCIÓN POR SIMPLE ENUMERACIÓN 1 Observación. 2 Formulación de Hipótesis 3 Definir Población 4 Selección Muestral 5 Procedimiento 6 Tratamiento Estadístico 7 Comprobación de Hipótesis 8 Conclusiones

LA WEB COMO MODELO DE GRAFO DIRIGIDO

RECORRIDO DE GRAFO DIRIGIDO

REPRESENTACIÓN DE UN SITIO WEB 1 2 3 4 5 6 7 8 9 10 11 12 13

POBLACIÓN Nombre 1 Búsqueda secuencial 2 Búsqueda secuencial ordenada 3 Búsqueda en profundidad 4 Búsqueda en amplitud 5 Búsqueda de coste uniforme 6 Búsqueda en profundidad limitada 7 Búsqueda en profundidad iterativa 8 Búsqueda binaria Ord Nombre 9 Búsqueda binaria recursiva 10 Búsqueda por fuerza bruta, combinatoria o exhaustiva 11 Tablas Hash 12 Búsqueda bidireccional 13 Búsqueda por interpolación 14 Búsqueda de Fibonacci 15 Algoritmo de Dijkstra 16 Algoritmo de Johnson Ord Nombre 17 Búsqueda de Grover 18 Algoritmo de Prim 19 Algoritmo de Kruskal 20 Algoritmo de busqueda A* 21 Algoritmos IDA* 22 Poda alfa-beta 23 Algoritmo de Shor 24 Algoritmo de bellman-ford

SELECCIÓN DE LA MUESTRA 1 Búsqueda Secuencial 2 Búsqueda secuencial ordenada 3 Búsqueda en profundidad 4 Búsqueda en amplitud 5 Búsqueda de coste uniforme 6 Búsqueda en profundidad iterativa 7 Búsqueda por fuerza bruta, combinatoria o exhaustiva 8 Algoritmo de búsqueda A*

DIAGRAMA ESTADÍSTICO DE COMPLEJIDAD

COMPLEJIDAD DE LOS ALGORITMOS

ACTORES DEL SISTEMA

DIAGRAMA DE CASOS DE USO

ORGANIZACIÓN BÁSICA DEL SISTEMA

ARQUITECTURA MVC

ENTORNO DE TRABAJO

DESARROLLO DE LA APLICACIÓN

VALIDACIÓN DE DATOS Una prueba tiene éxito si descubre un defecto. DATOS CORRECTOS Una prueba tiene éxito si descubre un defecto. Prueba de unidad. Prueba de aceptación. Prueba de integración. Prueba general al sistema.

VALIDACIÓN DE DATOS Se evaluaron los parámetros: Navegación Componentes Configuración Seguridad Desempeño Resistencia

APLICACIÓN WEB

BFS - Breadth First Search

CONCLUSIONES La aplicación de la norma IEEE 830, permitió comprender y satisfacer los requerimientos de Mundo Valle, involucrando al personal en todas las etapas del desarrollo de la aplicación. El cumplimiento de normas y estándares colaboraron para que el desarrollo de este proyecto sea comprensible y fácil entendimiento para modificaciones futuras. Se logró un aplicativo de alta calidad, confiable y disponible los 365 días del año mediante una interfaz amigable dirigida a los clientes tanto internos como externos de la agencia. Uso de herramientas de código libre

CONCLUSIONES La implementación de la metodología MIDAS dirigido por los modelos que son: CIM, PIM y PSM se logró el diseño de la arquitectura enfocada al contenido hipertextual, funcionalidad y navegabilidad . En la etapa de implantación y pruebas se realizaron actividades de validación y verificación, donde se evaluó la integración, aceptación, diseño, contenido, navegabilidad, función y estructura del portal web;

CONCLUSIONES El método de inducción por simple enumeración El modelo de negocios de una agencia de viajes y turismo

FIN