Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porAurelio Alamo Modificado hace 10 años
1
Búsqueda Inteligente en la Web II: ¿Búsqueda semántica o búsqueda con sentido?
Julio Gonzalo Grupo de Recuperación de Información y Procesamiento del Lenguaje Natural Departamento de Lenguajes y Sistemas Informáticos UNED
2
Dos visiones del futuro de la Web
Del blog de Mark Pilgrim
3
Buscando al hada azul (A.I.)
Pinocho: “I am looking for the blue fairy” Dr. Know: “Blue fairy, escort service 24 hours, elegant and discreet. Phone number …”
4
Buscando un alquimista
5
Buscando la piedra filosofal
6
Puede solucionarlo una máquina más lista
7
O ponernos todos a hablar Esperanto++
m:mentions Julio Gonzalo UNED P:GivenName #Julio p:WorksAtOrg m:attending Seminario UIMP Sorcerer’s stone Web semántica Fuente: Miguel Rodríguez, UNED nlp.uned.es
8
Quiero decir, rdf <rdf:RDF xmlns=" xmlns:m=" xmlns:p=" xmlns:rdf=" <rdf:Description rdf:about=" <m:mentions rdf:resource=“ </rdf:Description> <rdf:Description rdf:about=" <m:attending rdf:resource=" <GivenName>Julio Gonzalo</GivenName> <WorksAtOrg rdf:resource=" <has </rdf:RDF> Ejercicio: ¿resuelve la web semántica el problema anterior?
9
Así que la web semántica es…
10
(una) premisa de la web semántica
Si nos expresaramos mediante conceptos (en lugar de palabras) no ambiguos y consensuados universalmente, buscar sería incomparablemente más sencillo. ¿Es posible expresarnos mediante conceptos? Y si es posible… ¿es realmente tan magnífico?
11
Indexación conceptual
Conceptual Index n n n Texts ...spring... ...muelle... ...fountain... ...fuente... ...springtime... ...primavera... Query spring n WSD
12
Indexación conceptual sin errores
13
¿Un 30% es suficiente? ¡Es un techo!
Diez años después… los sistemas de WSD siguen en un 60% de eficacia. Un 30% no es más que un intercambio en los cuatro primeros resultados.
14
Más pruebas “empíricas” de que la web semántica no funcionará
Los sistemas de búsqueda bibliotecarios (o la navegación de muchos sitios web) Los diccionarios La quinta de Beethoven El chocolate
15
Así se escribe la historia
1998: Google: la información de los hipervínculos puede catapultar la calidad de los resultados de búsqueda (Brin & Page) La indexación conceptual puede mejorar un 30% la indexación convencional (Gonzalo et. al) 2007: Los votos del PageRank podrían aquilatarse como opiniones (utilizando PLN para analizar los enlaces) Pero la información de los logs de usuario es varios órdenes de magnitud mayor que la Web (12 Tb / día) SE COMIERON EL MUNDO SE COMIERON SUS PALABRAS
16
El círculo vicioso de la web semántica
No se generan contenidos de web semántica porque no hay buscadores capaces de aprovechar esa información. No se crean buscadores capaces de aprovechar la información que proporciona la web semántica porque no hay masa crítica de contenidos.
17
Un cierto paralelismo La piedra filosofal La web semántica
Que dieron lugar a… La química moderna RSS, …?
18
Mucho más listos Personalización: google personalized search (historial de búsqueda), MyRank de Yahoo. Organización: organizadores de información (vivisimo, grokker, kartoo) -> clustering Especialización: news, scholar, kayak.com, Froogle -> categorización, extracción, web semántica. Análisis y diálogo: extracción de datos, respuestas, capacidad de resumir el contenido de fuentes diversas
19
Personalización
20
Personalización por contenido
21
Personalización por contenido
¡De nuevo contar palabras!
22
Personalización por red social
23
Asistencia para la exploración de resultados
24
Agrupación
27
Categorización de resultados
28
Superación de barreras idiomáticas
29
Sugerencias de búsqueda
30
Sugerencias de búsqueda
33
Más listos: multilingües
34
Vs. “crummy Machine Translation”
36
Especialización por dominio
37
Web semántica vs. Information Extraction
pregunta datos Necesidad De información BD QL IE Necesidad de información constante. Objetivo: conjunto perfecto de documentos relevantes.
38
Ejemplo extracción: movies
39
Ejemplo extracción: Google Scholar
40
Extracción de opiniones: Swotti
41
No confundir con acceso a BBDD
42
Extracción@UNED: Multimatch
Buscador vertical (Patrimonio Cultural) Búsqueda multilingüe (translingüe) y multimedia Combina clasificación automática, extracción de información y minería de textos.
43
MultiMatch
44
MultiMatch
45
El círculo virtuoso de MultiMatch
Se añade formato de web semántica a los contenidos para mejorar el resultado de MultiMatch Multimatch es capaz de extraer automáticamente información semántica (con errores) y de aceptarla en formato web semántica (sin ellos)
46
Especialización por tipo de pregunta (“the need behind the query”)
47
Respuestas con interacción
48
Respuestas: definiciones
49
Pregunta/respuesta ¿Cuál es la montaña más grande del mundo?
51
Sistemas de búsqueda de respuestas en castellano: resultados CLEF
52
Especialización + extracción
“Javier Artiles” en Google Mi buscador
53
Búsqueda de personas: zoominfo
54
Estamos en ello…
55
Un poco de sintaxis
56
Búsqueda de respuestas compleja
¿Cuáles son los factores que pueden decidir el voto en las próximas elecciones? “Google answers” necesita expertos en buscar, analizar y sintetizar información sobre un tema específico. ¿Habrá un Google answers automático? (“Síntesis de Información”) ¿Habrá un Google news que redacte automáticamente las noticias, resumiendo de varias fuentes y adaptándose al perfil de cada usuario?
57
Conclusiones Los motores de búsqueda comenzaron siendo un catálogo de páginas web… … pero van acumulando una parte sustancial del conocimiento del mundo… … reflejan nuestras opiniones… … ¡y están empezando a ser capaces de razonar con esa información! ¿Los motores de búsqueda serán el “cerebro del hormiguero”?
58
El test de Turing Una persona conversa (a ciegas) con otra persona y con una máquina. Si no es capaz de distinguir a la máquina, ésta ha pasado el test de Turing. 1990: Hugh Loebner ofrece dólares a la primera máquina que pase el test. Hasta ahora. Los competidores tratan de codificar el conocimiento del mundo y millones de respuestas potenciales (Inteligencia Artificial) ¿Y si el enfoque correcto es un buscador capaz de utilizar páginas, enlaces, transacciones y comportamiento de los usuarios? (John Battelle, The Search).
59
La combinación de ambos definirá la web 3.0
And the future is… Los buscadores se apañarán para entendernos, aunque ocasionalmente seguirá pareciendo que están borrachos. Los usuarios seguirán siendo perezosos. Ocasionalmente añadirán información semántica para conseguir camisetas gratis. La combinación de ambos definirá la web 3.0
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.