Búsqueda P2P: Comunidades Semánticas
Búsqueda Centralizada WWW
Motivación búsqueda P2P Problema de escalabilidad de los sistemas centralizados. Aún los buscadores tradicionales utilizan sistemas distribuidos. Búsqueda a nivel desktop. Performance escalabilidad tolerancia a falla calidad de servicio tráfico de red
Búsqueda P2P WWW
Búsqueda P2P INTERNET
Búsqueda P2P INTERNET
Modelo de Buscador P2P No se asume la presencia de índices o directorios centralizados. Cada peer es un directorio hub (limitado) y un proveedor de contenido. Crawler propio. Buscador propio. Bases de datos e índices propios.
Modelo de Colaboración P2P
Problemas Interesantes Cómo enterarse de la existencia de otros peers. Como mantener información sobre otros peers. Cómo elegir un peer a quien reenviar la consulta. Cuándo dejar de reenviar una consulta Cómo ordenar los resultados. …otros?
Comunidades Semánticas Cuando los peers están agrupados en base a su similitud semántica, la calidad del servicio mejora. ¿Cómo determinar si ha emergido una comunidad semántica? topología de mundo pequeño similaridad semántica
Topología Regular: Anillos
Topología Regular: Retículos
Topología Regular: Estrella
Topología Regular: Grafo Completo
Topología Irregular: Red Aleatoria
¿Cuál es la topología ideal? Caminos cortos Sin congestión Robusta
Topología de Mundo Pequeño
Mundo Pequeño Origen de la idea Seis grados de separación (experimentos realizados por Stanley Milgran en los años sesenta) Modelo de mundo pequeño (Duncan J. Watts y Steve Strogatz, 1998) Se observa en varios fenómenos de la naturaleza (¿ventaja evolutiva?)
Mundo Pequeño: Sitios Web fuente Mark Newman
Mundo Pequeño: Red de Terroristas fuente www.firstmonday.org
red de terroristas fuente www.firstmonday.org
Mundo Pequeño: Red de Citas Bibliográficas fuente http://wwwcsif.cs.ucdavis.edu/~mcpherso/largegraph.html
Mundo Pequeño: Red de Co-autoría fuente Lothar Krempel
Mundo Pequeño Diámetro Pequeño A pesar de existir un gran número de nodos, es posible encontrar sendas cortas que conecten a dos nodos cualesquiera. Cuando aumentan de tamaño, su diámetro aumente lentamente. también ocurre con las redes aleatorias
Mundo Pequeño Coeficiente de Clustering alto Existen comunidades altamente conectadas. no ocurre con las redes aleatorias
Coeficiente de clustering El coeficiente de clustering es la proporción entre el número de nodos en un vecindario y el número total de nodos que podrían existir en dicho vecindario
La Aplicación 6Search
6Search: Descubriendo peers vecino del peer vecino del vecino del peer peer (consulta 1, peer ID) (consulta 1, peer ID) (respuesta, ID del peer vecino del vecino) (respuesta, ID del peer vecino del vecino) (consulta 2, peer ID)
6Search: Características Los peers son independientes. Los peers pueden ingresar o abandonar la red en cualquier momento. Un peer no debería sufrir sobrecarga. Una consulta no debería propagarse indefinidamente. Un peer puede optar por no reenviar una consulta. Arquitectura robusta.
6Search: Interacción con peers Nuevos peers son buscado sólo en caso de ser necesario. Cada peer tiene un número fijo de slots para información sobre otros peers. Nuevos peers se descubren gracias a peers ya conocidos. Un peer buscará nuevos peers cuando tenga slots libres o cuando quiera encontrar peers mejores a los que ya conoce.
Estigmergia (Stigmery) Colaboración a través del medio físico. En sistemas descentralizados, tales como las colonias de hormigas, los diferentes componentes colaboran a través de pautas o hitos dejados en el medio: feromonas, acumulación de objetos o cualquier otro tipo de cambio físico, como la temperatura.
6Search: Ruteo adaptativo de consultas Random-Known Las consultas son enviada a vecinos aleatorios. Los peers actualizan sus tablas de peers conocidos en base a quienes responden. Aprendizaje Greedy Lista de términos asociada a cada peer conocido. Las consultas son enviadas a los vecinos con mayor similitud entre consulta y términos. Aprendizaje por refuerzo Lista de términos básica y expandida en base a los documentos recuperados. Se combina perfil básico y expandido para seleccionar a quienes enviar consultas.
6Searcg: Crear un índice
6Search: Buscar
6Search: Crawler Temático
6Search: Topología Emergente inicial final
Similaridad Semántica
Similaridad Semántica: Taxonomía D. Lin (1998)
Taxonomía
Simbólico
Relacionado
tipos de enlace t1 T S t2 t3 t4 R t5 t6 t7 t8
Similaridad Semántica
Bibliografía Emerging Semantic Communities in Peer Web Search. R. Akavipat, L.-S. Wu, F. Menczer, A. Maguitman. P2PIR 2006: International Workshop on Information Retrieval in Peer-to-Peer. ACM Press. Arlington, USA, November 2006. Adaptive Peer to Peer Social Networks for Distributed Content Based Web Search. L.-S. Wu, R. Akavipat, A. Maguitman, F. Menczer. Social Information Retrieval Systems: Emergent Technologies and Applications for Searching the Web Effectively, IGI Global. September 2007.