La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

ESCUELA POLITÉCNICA DEL EJÉRCITO DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN TÍTULODEL PROYECTO: “SISTEMA AUTOMATIZADO DE BÚSQUEDA WEB (WEB CRAWLERS) DE.

Presentaciones similares


Presentación del tema: "ESCUELA POLITÉCNICA DEL EJÉRCITO DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN TÍTULODEL PROYECTO: “SISTEMA AUTOMATIZADO DE BÚSQUEDA WEB (WEB CRAWLERS) DE."— Transcripción de la presentación:

1 ESCUELA POLITÉCNICA DEL EJÉRCITO DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN
TÍTULODEL PROYECTO: “SISTEMA AUTOMATIZADO DE BÚSQUEDA WEB (WEB CRAWLERS) DE PROMOCIONES DE TICKETS AÉREOS Y PORTAL WEB PARA LA AGENCIA DE VIAJES Y TURISMO MUNDO VALLE”. Autor: Christian Córdova

2 Agenda Introducción. Objetivo del Proyecto. Algoritmo Implementación
Presentación de la Aplicación Conclusiones.

3 Introducción Definición Web Crawlers Es un programa que recorre las páginas del World Wide Web de forma metódica y automatizada, las descarga y procesa, comienzan visitando una lista de URL, identifican los hiperenlaces en dichas páginas y los añade a la lista a visitar de manera recurrente de acuerdo a determinado conjunto de reglas.

4 Introducción Entre ellos estan las arañas, bots, buscadores, web Crawlers. Algunas de las tareas más comunes de las arañas web están las siguientes: Crear el índice de una máquina de búsqueda. Analizar los enlaces de un sitio para buscar links rotos. Recolectar información de un cierto tipo, como precios de productos para recopilar un catálogo.

5 Introducción Los tipos de busqueda determinados para trabajar con las arañas web son: Índices de Búsqueda Motores de Búsqueda Metabuscadores

6 Objetivo General del Proyecto
Analizar, Desarrollar e Implementar el Sistema Automatizado de Búsqueda Web (Web Crawlers) de promociones de Ticket Aéreos y Portal Web para la Agencia de Viajes y Turismo Mundo Valle Cía. Ltda., mediante la utilización de software libre.

7 Objetivos Específicos
Investigar los principios en los que se basan los algoritmos de búsqueda de datos a través de grandes cantidades de información y seleccionar el más óptimo de ellos para este sistema. Analizar la administración y funcionamiento de la Agencia. Desarrollar el portal web de la agencia y el pago en línea Implementar y realizar las pruebas necesarias del sistema para detectar problemas de rendimiento.

8 Conceptos Generales del Proyecto

9 BUSCADOR Programa, que permite encontrar contenidos, archivos, páginas Web y demás recursos. Desde el punto de vista del usuario no es más que una página Web, desde el punto de vista de una página Web.

10 SECUENCIA BÁSICA DE UN BUSCADOR

11 Pseudo-Algoritmo Inicializar las URLs
Verificar la finalización, agregar a la pila Encontrar los enlaces Procesar las páginas Agregar las URLs a ser procesadas ** la pila contiene una lista para el web crawler de URLs no visitadas con nuevas páginas y enlaces.

12 BÚSQUEDA DE INFORMACIÓN

13 BÚSQUEDA DE INFORMACIÓN

14 MODELO MDA- DESARROLLO BASADO EN MODELOS

15 PROCESO DE DESARROLLO DE SISTEMA CON MDA

16 METODOLOGÍA MIDAS-MDA

17 PROCESO DE DESARROLLO DE MIDAS

18 FASES DEL MÉTODO DE INDUCCIÓN POR SIMPLE ENUMERACIÓN
1 Observación. 2 Formulación de Hipótesis 3 Definir Población 4 Selección Muestral 5 Procedimiento 6 Tratamiento Estadístico 7 Comprobación de Hipótesis 8 Conclusiones

19 LA WEB COMO MODELO DE GRAFO DIRIGIDO

20 RECORRIDO DE GRAFO DIRIGIDO

21 REPRESENTACIÓN DE UN SITIO WEB
1 2 3 4 5 6 7 8 9 10 11 12 13

22 POBLACIÓN Nombre 1 Búsqueda secuencial 2 Búsqueda secuencial ordenada
3 Búsqueda en profundidad 4 Búsqueda en amplitud 5 Búsqueda de coste uniforme 6 Búsqueda en profundidad limitada 7 Búsqueda en profundidad iterativa 8 Búsqueda binaria Ord Nombre 9 Búsqueda binaria recursiva 10 Búsqueda por fuerza bruta, combinatoria o exhaustiva 11 Tablas Hash 12 Búsqueda bidireccional 13 Búsqueda por interpolación 14 Búsqueda de Fibonacci 15 Algoritmo de Dijkstra 16 Algoritmo de Johnson Ord Nombre 17 Búsqueda de Grover 18 Algoritmo de Prim 19 Algoritmo de Kruskal 20 Algoritmo de busqueda A* 21 Algoritmos IDA* 22 Poda alfa-beta 23 Algoritmo de Shor 24 Algoritmo de bellman-ford

23 SELECCIÓN DE LA MUESTRA
1 Búsqueda Secuencial 2 Búsqueda secuencial ordenada 3 Búsqueda en profundidad 4 Búsqueda en amplitud 5 Búsqueda de coste uniforme 6 Búsqueda en profundidad iterativa 7 Búsqueda por fuerza bruta, combinatoria o exhaustiva 8 Algoritmo de búsqueda A*

24 DIAGRAMA ESTADÍSTICO DE COMPLEJIDAD

25 COMPLEJIDAD DE LOS ALGORITMOS

26 ACTORES DEL SISTEMA

27 DIAGRAMA DE CASOS DE USO

28 ORGANIZACIÓN BÁSICA DEL SISTEMA

29 ARQUITECTURA MVC

30 ENTORNO DE TRABAJO

31 DESARROLLO DE LA APLICACIÓN

32 VALIDACIÓN DE DATOS Una prueba tiene éxito si descubre un defecto.
DATOS CORRECTOS Una prueba tiene éxito si descubre un defecto. Prueba de unidad. Prueba de aceptación. Prueba de integración. Prueba general al sistema.

33 VALIDACIÓN DE DATOS Se evaluaron los parámetros: Navegación
Componentes Configuración Seguridad Desempeño Resistencia

34 APLICACIÓN WEB

35 BFS - Breadth First Search

36 CONCLUSIONES La aplicación de la norma IEEE 830, permitió comprender y satisfacer los requerimientos de Mundo Valle, involucrando al personal en todas las etapas del desarrollo de la aplicación. El cumplimiento de normas y estándares colaboraron para que el desarrollo de este proyecto sea comprensible y fácil entendimiento para modificaciones futuras. Se logró un aplicativo de alta calidad, confiable y disponible los 365 días del año mediante una interfaz amigable dirigida a los clientes tanto internos como externos de la agencia. Uso de herramientas de código libre

37 CONCLUSIONES La implementación de la metodología MIDAS dirigido por los modelos que son: CIM, PIM y PSM se logró el diseño de la arquitectura enfocada al contenido hipertextual, funcionalidad y navegabilidad . En la etapa de implantación y pruebas se realizaron actividades de validación y verificación, donde se evaluó la integración, aceptación, diseño, contenido, navegabilidad, función y estructura del portal web;

38 CONCLUSIONES El método de inducción por simple enumeración
El modelo de negocios de una agencia de viajes y turismo

39 FIN


Descargar ppt "ESCUELA POLITÉCNICA DEL EJÉRCITO DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN TÍTULODEL PROYECTO: “SISTEMA AUTOMATIZADO DE BÚSQUEDA WEB (WEB CRAWLERS) DE."

Presentaciones similares


Anuncios Google