La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Búsqueda Inteligente en la Web II: ¿Búsqueda semántica o búsqueda con sentido? Julio Gonzalo Grupo de Recuperación de Información y Procesamiento del Lenguaje.

Presentaciones similares


Presentación del tema: "Búsqueda Inteligente en la Web II: ¿Búsqueda semántica o búsqueda con sentido? Julio Gonzalo Grupo de Recuperación de Información y Procesamiento del Lenguaje."— Transcripción de la presentación:

1 Búsqueda Inteligente en la Web II: ¿Búsqueda semántica o búsqueda con sentido? Julio Gonzalo Grupo de Recuperación de Información y Procesamiento del Lenguaje Natural Departamento de Lenguajes y Sistemas Informáticos UNED

2 Dos visiones del futuro de la Web Del blog de Mark Pilgrim

3 Buscando al hada azul (A.I.) Pinocho: I am looking for the blue fairy Dr. Know: Blue fairy, escort service 24 hours, elegant and discreet. Phone number …

4 Buscando un alquimista

5 Buscando la piedra filosofal

6 Puede solucionarlo una máquina más lista

7 O ponernos todos a hablar Esperanto++ m:mentions Julio Gonzalo UNED P:GivenName #Julio p:WorksAtOrg m:attending Seminario UIMP Sorcerers stone Web semántica Fuente: Miguel Rodríguez, UNED nlp.uned.es

8 Quiero decir, rdf Julio Gonzalo Ejercicio: ¿resuelve la web semántica el problema anterior?

9 Así que la web semántica es…

10 (una) premisa de la web semántica Si nos expresaramos mediante conceptos (en lugar de palabras) no ambiguos y consensuados universalmente, buscar sería incomparablemente más sencillo. ¿Es posible expresarnos mediante conceptos? Y si es posible… ¿es realmente tan magnífico?

11 Indexación conceptual Query spring Texts...spring......muelle......spring......fountain......fuente......spring......springtime......primavera... Conceptual Index n n n WSD

12 Indexación conceptual sin errores

13 ¿Un 30% es suficiente? ¡Es un techo! Diez años después… los sistemas de WSD siguen en un 60% de eficacia. Un 30% no es más que un intercambio en los cuatro primeros resultados.

14 Más pruebas empíricas de que la web semántica no funcionará Los sistemas de búsqueda bibliotecarios (o la navegación de muchos sitios web) Los diccionarios La quinta de Beethoven El chocolate

15 Así se escribe la historia 1998: Google: la información de los hipervínculos puede catapultar la calidad de los resultados de búsqueda (Brin & Page) La indexación conceptual puede mejorar un 30% la indexación convencional (Gonzalo et. al) 2007: Los votos del PageRank podrían aquilatarse como opiniones (utilizando PLN para analizar los enlaces) Pero la información de los logs de usuario es varios órdenes de magnitud mayor que la Web (12 Tb / día) SE COMIERON EL MUNDO SE COMIERON SUS PALABRAS

16 El círculo vicioso de la web semántica No se generan contenidos de web semántica porque no hay buscadores capaces de aprovechar esa información. No se crean buscadores capaces de aprovechar la información que proporciona la web semántica porque no hay masa crítica de contenidos.

17 Un cierto paralelismo La piedra filosofal La web semántica Que dieron lugar a… La química moderna RSS, …?

18 Mucho más listos Personalización: google personalized search (historial de búsqueda), MyRank de Yahoo. Organización: organizadores de información (vivisimo, grokker, kartoo) -> clustering Especialización: news, scholar, kayak.com, Froogle -> categorización, extracción, web semántica. Análisis y diálogo: extracción de datos, respuestas, capacidad de resumir el contenido de fuentes diversas

19 Personalización

20 Personalización por contenido

21 ¡De nuevo contar palabras!

22 Personalización por red social

23 Asistencia para la exploración de resultados

24 Agrupación

25

26

27 Categorización de resultados

28 Superación de barreras idiomáticas

29 Sugerencias de búsqueda

30

31

32

33 Más listos: multilingües

34 Vs. crummy Machine Translation

35

36 Especialización por dominio

37 Web semántica vs. Information Extraction pregunta datos Necesidad De información BD QL IE

38 Ejemplo extracción: movies

39 Ejemplo extracción: Google Scholar

40 Extracción de opiniones: Swotti

41 No confundir con acceso a BBDD

42 Multimatch Buscador vertical (Patrimonio Cultural) Búsqueda multilingüe (translingüe) y multimedia Combina clasificación automática, extracción de información y minería de textos.

43 MultiMatch

44

45 El círculo virtuoso de MultiMatch Se añade formato de web semántica a los contenidos para mejorar el resultado de MultiMatch Multimatch es capaz de extraer automáticamente información semántica (con errores) y de aceptarla en formato web semántica (sin ellos)

46 Especialización por tipo de pregunta (the need behind the query)

47 Respuestas con interacción

48 Respuestas: definiciones

49 Pregunta/respuesta ¿Cuál es la montaña más grande del mundo?

50

51 Sistemas de búsqueda de respuestas en castellano: resultados CLEF

52 Especialización + extracción Javier Artiles en Google Mi buscador

53 Búsqueda de personas: zoominfo

54 Estamos en ello…

55 Un poco de sintaxis

56 Búsqueda de respuestas compleja ¿Cuáles son los factores que pueden decidir el voto en las próximas elecciones? Google answers necesita expertos en buscar, analizar y sintetizar información sobre un tema específico. ¿Habrá un Google answers automático? (Síntesis de Información) ¿Habrá un Google news que redacte automáticamente las noticias, resumiendo de varias fuentes y adaptándose al perfil de cada usuario?

57 Conclusiones Los motores de búsqueda comenzaron siendo un catálogo de páginas web… … pero van acumulando una parte sustancial del conocimiento del mundo… … reflejan nuestras opiniones… … ¡y están empezando a ser capaces de razonar con esa información! ¿Los motores de búsqueda serán el cerebro del hormiguero?

58 El test de Turing Una persona conversa (a ciegas) con otra persona y con una máquina. Si no es capaz de distinguir a la máquina, ésta ha pasado el test de Turing. 1990: Hugh Loebner ofrece dólares a la primera máquina que pase el test. Hasta ahora. Los competidores tratan de codificar el conocimiento del mundo y millones de respuestas potenciales (Inteligencia Artificial) ¿Y si el enfoque correcto es un buscador capaz de utilizar páginas, enlaces, transacciones y comportamiento de los usuarios? (John Battelle, The Search).

59 And the future is… Los usuarios seguirán siendo perezosos. Ocasionalmente añadirán información semántica para conseguir camisetas gratis. Los buscadores se apañarán para entendernos, aunque ocasionalmente seguirá pareciendo que están borrachos. La combinación de ambos definirá la web 3.0


Descargar ppt "Búsqueda Inteligente en la Web II: ¿Búsqueda semántica o búsqueda con sentido? Julio Gonzalo Grupo de Recuperación de Información y Procesamiento del Lenguaje."

Presentaciones similares


Anuncios Google