La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

World Wide Web M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción

Presentaciones similares


Presentación del tema: "World Wide Web M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción"— Transcripción de la presentación:

1 World Wide Web M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción http://www.inf.udec.cl/~andrea

2 Introducción La Web se inicia en marzo de 1989 propuesto por el investigador Tim Berners-Lee, como un proyecto de desarrollo de un sistema de hipertexto, es decir un sistema de creación y distribución de documentos, que permitiera compartir información desarrollada en diferentes aplicaciones, de forma sencilla y eficiente, entre equipos de investigadores ubicados en distintos lugares geográficos.

3 Requerimientos iniciales Obtener una interfaz consistente, es decir el sistema debería permitir una conexión que al menos asegurara una transferencia de datos consistente (lo que envío es obtenido intacto). Permitir incorporar un amplio rango de tecnologías y distintos tipos de documentos. Proveer de una herramienta que permita leer los documentos desde cualquier lugar y por cualquier individuo que este navegando dentro de este almacén, y deberá permitir que cualquier documento sea accequible en forma paralela por dos o más personas de forma sencilla.

4 A principios de 1993 se vio surgir al browser Mosaic, que cumplía con todos los requerimientos que se buscaban (funcionamiento en diversas plataformas, poseer una interfaz grafica y fácil de usar), lo que produjo su éxito inmediato. Después aparecieron Netscape de Netscape Inc. e Internet Explorer de Microsoft. Finalmente a fines de 1994 y principios de 1995, se formó el Consorcio World Wide Web o W3C que esta bajo la dirección del fundador de la Web Posteriormente

5 Desafíos de RI  Datos distribuidos sobre diferentes plataformas  Datos volátiles  Gran volumen de datos  Datos redundantes y no estructurados  Calidad de los datos  Datos heterogeneos.

6 Directorios son Robot Directorios o buscador sin Robot: estos buscadores son administrados por personas. Debido a esta razón están limitados en el tamaño de la base de datos que contiene los documentos indexados, es decir limitan el campo de búsqueda. Los documentos se indexan después de un análisis que también es hecho por personas, es decir, su crecimiento se limita a la velocidad de trabajo de las personas (incluye actividades como: agregar páginas nuevas, eliminar páginas que han expirado o que han sido eliminadas, etc.).

7 Máquinas de Búsqueda La indexación de documentos es realizada automáticamente a través de SW que indexa las páginas existentes en la Web.

8 Arquitectura Crawler-Indexer

9 Arquitectura de Cosecha

10 Ranking Modelos más usados: Boolean o Vector y sus variaciones Ranking tiene que realizarse sin accesar el texto,s ó lo el í ndice Los algoritmos de ranking son “ top secret ” Es casi imposible determinar el recall

11 Ranking No sólo texto,pero también hyperlinks La importancia de una página depende de quién apunta ella o a quién apunta. La web como una grafo dirigido


Descargar ppt "World Wide Web M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción"

Presentaciones similares


Anuncios Google