La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Sistemas de búsqueda y recuperación de Información

Presentaciones similares


Presentación del tema: "Sistemas de búsqueda y recuperación de Información"— Transcripción de la presentación:

1 Sistemas de búsqueda y recuperación de Información
MID Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid Getafe, 1999

2 Sistemas de búsqueda Tipología
Recursos Web Software y ficheros Personas e instituciones Listas de distribución News Directorios / índices generales especializados Buscadores Metabuscadores Agentes inteligentes Portales WebRings

3 Metabuscadores: búsqueda múltiple ej: Metacrawler
Sistemas de búsqueda

4 Metabuscadores Caracterización
Permiten formular búsquedas simultáneas en un determinado número de motores de búsqueda. Se les denomina también motores de búsqueda en paralelo, megamotores, o metabuscadores. Cuando un usuario lanza la búsqueda, el metabuscador las dirige a sus motores asociados componiendo una lista de aciertos, que representan, en teoría, las mejores respuestas a la pregunta. Posteriormente pueden llevar a cabo otras tareas, como asignar u ordenar por relevancia, formatearlas de forma consistente, verificar la accesibilidad o eliminar enlaces muertos. La lista final indica el motor que ha generado la respuesta y pueden agruparse los resultados por ese criterio.

5 Metabuscadores Ventajas e inconvenientes
En principio, dada la multiplicidad de motores parecen la solución óptima. Pero al depender de los tiempos de respuesta y de la efectividad de sistemas sobre los que no se tienen control, no es sorprendente que en ocasiones fallen.

6 Metabuscadores Alcance: Calidad:
Trabajan para poder presentar resultados manejables, por eso no es sorprendente que las listas de resultados sean breves. Calidad: Dependen extremadamente de las posibilidades de indización de los motores con los que trabaja. Si el motor genera basura degrada la calidad del metabuscador.

7 Metabuscadores Control: Velocidad:
Los motores usan distintos procedimientos de búsqueda. Una petición genérica contra varios, no ofrece las mismas posibilidades que los resultados obtenidos con las funciones avanzadas de cada motor. Velocidad: Si un motor es lento, impone retrasos en la presentación de resultados. Soluciones: Metacrawler incorpora un mecanismo para verificar que los resultados que obtiene son accesibles y relevantes antes de presentarlos en pantalla. SavvySearch toma en cuenta el tiempo de proceso de los motores y da preferencia a los más rápidos.

8 Metabuscadores: ¿Cuándo usarlos?
Cuando se busque sobre una materia poco común Cuando no se ha tenido suerte con otros servicios Cuando no se quieran formular búsquedas complejas Cuando se quieran recuperar tantos documentos como sea posible con una sola pregunta

9 MetaCrawler www.metacrawler.com
Definición: Es un servicios web que trabaja con diferentes motores de búsqueda. Alcance: Usa Lycos, Webcrawler, Excite, AltaVista, Yahoo, Infoseek. Puede buscar en Web, productos informáticos, ficheros o en News.

10 MetaCrawler www.metacrawler.com
Uso: Posee una única ventana desde la que formular las búsquedas. Al introducir los términos el usuario puede decidir si quiere que los aciertos tengan cualquiera de los introducidos, todos o que los términos sean considerados una frase. Los resultados los presenta listados y normalizados eliminando elementos de publicidad.

11 MetaCrawler www.metacrawler.com
Uso avanzado: Permite limitar las búsquedas por países, nº de aciertos, tiempo de duración de la búsquedas (en minutos), o por el número de acierto que debe proporcionar cada motor de búsqueda. Permite seleccionar los motores contra los que lanzar la pregunta:Altavista, Excite, Yahoo, Infoseek, Lycos, Thunderstone, Webcrawler.

12 Otros metabuscadores SavySearch: http://www.savvysearch.com/
Internet Sleuth: Profusion: Cyber411: Metafind: Inference Find: All-in-One Search: Ask Jeeves: ESPAÑOLES: Metabusca:

13 Diferenciación Metabuscadores: Lanzan la misma búsqueda a distintos sistemas, aunando los resultados. Multibuscadores: Permiten lanzar la búsqueda a varios buscadores pero de forma individual (primero uno, después otro...) simplificación de interface pero funcionamiento autónomo. Buscopio:

14 Agentes: la búsqueda inteligente ej. Roboshopper Pointcast
Sistemas de búsqueda

15 Agentes Inteligentes: ¿Qué son?
Los agentes inteligentes son programas que realizan tareas de acuerdo con los planteamientos de los usuarios. Las posibilidades son muy amplias, desde desarrollar rutinas de trabajo hasta tratar esas rutinas como preferencias o incluso negociar en nombre del usuario. Software personal que asiste en la búsqueda de información en Internet con una autoridad delegada de sus usuarios.

16 Agentes Inteligentes: Caracterización
La característica que los distingue es la habilidad de “tomar decisiones” según un conjunto de reglas internas y sin intervención del ususario. Los agentes pueden tener esta característica de autonomía en mayor o menor grado. El grado de autonomía puede llegar a que tomen iniciativas: por ejemplo suministrar al usuarios información sin que la solicite, pero que quizás sea de su interés.

17 Agentes Inteligentes: Acceso
El agente puede ser un programa cliente, o un servidor web. Existen múltiples clientes, algunos son gratuitos (Poitcast) , otros son de pago (Webcompass). Otros agentes son accesibles a través del URL: Jango, aunque exigen registrarse en muchos casos.

18 Agentes Inteligentes: Alcance
Las tareas que pueden llevar a cabo son muy variadas: Enriquecen el browsing del usuario sugiriéndole enlaces basados en anteriores conductas. Dan valor añadido a las búsquedas convencionales como las realizadas en Altavista, Lycos, Infoseek Lanzan preguntas contra diferentes motores, filtran y reordenan los resultados de forma eficiente.

19 Agentes Inteligentes: Alcance
Localiza el mejor precio de un determinado producto en las tiendas online. Controlan bases de datos Web y proporcionan actualizaciones de su contenido. Compila periódicos personalizados. Visita a bases de datos seleccionadas por el usuario y descarga automática de todas las páginas o de parte para consulta offline.

20 Agentes Inteligentes: Alcance
Localización de personas con intereses similares. Vigilar los sitios preferidos del usuario y avisarle cuando se produce un cambio. Generar mapas o guías de la estructura hipertextual de un servidor. Comprobar y priorizar el correo electrónico, tomar decisiones basadas en el contenido del correo y actuar en consonancia.

21 Agentes Inteligentes: Uso
Algunos agentes poseen sus propios conjuntos de reglas y criterios o las tareas que pueden desarrollar se circunscriben a una. Otros, por el contrario, deben ser “entrenados”. Es decir, las instrucciones se las proporciona el usuario. Este proceso puede consumir bastante tiempo, pero al finalizar, el usuario tiene un “traje a su medida”.

22 Agentes Inteligentes Servidor
BargainFinder: Fue un servicio experimental creado por Anderson Consulting (junto con otros como LifestyleFinder, InfoFinder, NewsFinder, etc). Tenía la función de obtener el mejor precio de CDs. Roboshopper: Software que permite comparar precios de distintos tipos de productos en distintas tiendas digitales.

23 Otros sistemas de búsqueda:
Buscadores temáticos Webrings

24 Buscadores temáticos:
Un buscador temático o especializado es aquel que centra toda su actividad alrededor de una materia muy concreta. Este tipo de buscadores tratan por todos los medios de recoger en sus bases de datos toda la información que pueda haber en la Red (y a veces incluso fuera de ella) sobre la materia de que tratan.

25  Buscadores temáticos
Permiten obtener de forma sencilla toda la información existente sobre una materia. La información ordenada y con unos resúmenes mucho mejores y más completos. Organizados para presentar en primer lugar las mejores páginas sobre los temas que tratan (Tratamiento de la información suele ser manual) Todo ello mejora mucho la calidad de la información ante la especificidad.

26  Buscadores temáticos:
Se debe combinar su uso, con el de otros buscadores más generales, ya que en algunas ocasiones, el hecho de que sean, iniciativas temáticas particulares, pone en tela de juicio su exhaustividad. Es necesario conocer su existencia y URL concreto, o bien partir de un buscador general que nos puede hacer llegar a él. Buscopio:

27 Anillos web Los webrings son grupos de webs sobre una misma temática que se han ido formando o construyendo por iniciativa de los propios diseñadores de páginas web con un contenido temático específico. Hay anillos sobre tantos y diferentes temas como podamos imaginar (más de anillos web en todo el mundo), que constituyen hoy en día una alternativa (prometedora) para la búsqueda de información en Internet.

28  Anillos web Sólo contienen webs relevantes sobre la temática concreta de la que tratan. El nivel de ruido es =0, en general. El sistema de índices de la mayoría de los servidores de anillos web está perfectamente estructurado y cada índice contiene información detallada sobre diversas cuestiones de interés No requieren complejas sintaxis de búsqueda. Si algo no se encuentra en un anillo sobre un tema, éste nos llevará a otro de la misma temática que quizás si recoja el aspecto que nos interesa Resulta una de las mejores opciones para el acercamiento a una materia.

29  Anillos web Si un web relevante sobre un tema no se adhiere al anillo web, no se localizará. Sigue habiendo muchas páginas web que no se interconectan a través de enlaces a otras similares, con lo cual siempre habrá que recurrir a índices o motores de búsqueda si se desea una búsqueda más exhaustiva. Tienen muchas limitaciones en cuanto a la búsqueda (no booleanos) Si se busca un web determinado, los buscadores de anillos son inútiles. Sólo permiten buscar por términos definitorios no por nombres de sitios ni por dominios.

30 Principales Webrings:
Looplink: Ringsurf: The Rail:


Descargar ppt "Sistemas de búsqueda y recuperación de Información"

Presentaciones similares


Anuncios Google