La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Proyecto Fin de Carrera Ingeniería en Informática Sistema de Resolución de la Ambigüedad Semántica Basada en el Conocimiento Alumno: D. Álvaro Acebedo.

Presentaciones similares


Presentación del tema: "Proyecto Fin de Carrera Ingeniería en Informática Sistema de Resolución de la Ambigüedad Semántica Basada en el Conocimiento Alumno: D. Álvaro Acebedo."— Transcripción de la presentación:

1 Proyecto Fin de Carrera Ingeniería en Informática Sistema de Resolución de la Ambigüedad Semántica Basada en el Conocimiento Alumno: D. Álvaro Acebedo Director: D. Germán Rigau Septiembre 2007 - FISS

2 Índice Introducción Objetivos del Proyecto SSI Pruebas Gestión Conclusiones Demo

3 Introducción  Este proyecto se enmarca en el área de la Inteligencia Artificial, en concreto en lo referido al Procesamiento del Lenguaje Natural.  La WSD consiste en decidir el sentido apropiado de una palabra dependiendo de su contexto.  Para llevarlo a cabo nos valdremos de Bases de Conocimiento.

4 Introducción – Ejemplo  Ejemplo de base de Conocimiento: MAMÍFER O ANIMA L PELAJ E AGU A vive en es un tiene es un

5 Introducción  WordNet 2.0 115.424 nodos, 337.984 relaciones en total.  MCR Desarrollado por el grupo Meaning. Aglutina diferentes versiones de WordNet y diferentes idiomas.

6 Introducción – Adquirir conocimiento  ¿Es posible enriquecer las Bases de Conocimiento con los mismos métodos de desambiguación que se valen de ellas? Desambiguación de Glosas (Senseval)

7 Introducción – WSD orientado a las Glosas  Ballena: Mamífero Cetáceo de hasta quince metros de longitud y enormes aletas. MAMÍFERO 1 ALETA 1 2 CETÁCEO 1 METRO 1 3 2 MAMÍFERO 1 CETÁCEO 1 ALETA 2 METRO 3

8 Objetivos del Proyecto  Objetivos Primarios: Idear, diseñar, implementar y evaluar algoritmos WSD basándonos en SSI.  Objetivos Secundarios: Añadir funcionalidad al MCRQuery. Crear procedimientos almacenados. Añadir visualización de los grafos.

9 Esquema de Descomposición del Proyecto

10 DOP – Casos de Uso  El desarrollo de este proyecto sólo implica la realización de un caso de uso sencillo.

11 SSI  Mecanismo iterativo para la desambiguación basada en el conocimiento.  Crea especificaciones estructurales de los posibles sentidos de cada palabra en un contexto y selecciona la mejor hipótesis de las posibles, describiendo relaciones entre las especificaciones de los sentidos mencionados.

12 SSI. Mecanismo PEZ 1 3 2 MAMÍFERO 1 GATO 1 2 MAMÍFERO 1

13 SSI. Mecanismo MAMÍFERO 1 GATO 1 MAMÍFERO 1 GATO 2 0,1 6 0,8 3

14 SSI. Mecanismo PEZ 1 3 2 GATO 1 2 MAMÍFERO 1 GATO 2

15 SSI. Mecanismo MAMÍFERO 1 PEZ 1 GATO 2 PEZ 1 MAMÍFERO 1 PEZ 2 GATO 2 PEZ 2 MAMÍFERO 1 PEZ 3 GATO 2 PEZ 3 ++ + 0,7 8 0,2 1 0,1 3

16 SSI. Mecanismo PEZ 1 3 2 MAMÍFERO 1 GATO 2 PEZ 1

17 SSI – versión 3 de st. 3 2 2 2 2 2 2 2 2 1 11 ori g.

18 SSI – versión 3 de st. 3 2 2 2 2 2 2 2 2 1 11 ori g.

19 SSI – versión 4  Utiliza el algoritmo de Dijkstra para la obtención de caminos mínimos. $g->dijkstra_shortest_path($s, $t);  Se usa una estructura total de la base de conocimiento para aplicar el algoritmo.

20 SSI – versión 4b  Construye grafos simplificados para el cálculo de los caminos.  También tiene en cuenta la distancia máxima.  Procesa los caminos valiéndose de pilas que almacenan el proceso.

21 SSI – versión 4b de st. 2 2 1 2 1 ori g.

22 SSI – versión 4b de st. 2 2 1 2 1 3 2 2 2 2 2 1 ori g.

23 SSI – versión 5  Crea 'nubes' alrededor de los nodos fuente y destino.  Analiza la similitud entre las 'nubes' para encontrar caminos.  La distancia máxima a la que se encuentran caminos duplica la distancia máxima de las 'nubes'.

24 SSI – versión 5 o ri g. d e st. 1 11 1 1 1 2 2 2 2 2 2 2 2 2 2

25 SSI – versión 5 o ri g. d e st. e e c c a a d d b b

26 SSI – versión 5 de st. e c a d b ori g.

27 Pruebas  Se han realizado dos juegos de pruebas: Pruebas sencillas. Ejecutamos los algoritmos con un juego de términos determinado y observamos resultados. Senseval-3. Taller Internacional de Desambiguación de Glosas basado en eXtended WordNet. Incluye mecanismos de calificación propios.

28 Pruebas - Iniciales  Juego de Pruebas Uno: flight, scheduled, trip, plane, designated, airport  Juego de Pruebas Dos: port, place, seaport, airport, people, merchandise, enter, leave, country

29 Pruebas – Senseval (WN2.0)  Sólo fue posible procesar dos de los cuatro algoritmos ideados.

30 Pruebas – Senseval (WN2.0+XWN2.0)  Los resultados mejoraron ampliando la base de conocimiento con eXtended WordNet.

31 Pruebas Senseval - Comparativa

32 Gestión

33 Balance de Éxito  Objetivos Primarios: Idear, diseñar, implementar y evaluar algoritmos WSD basándonos en SSI.  Objetivos Secundarios: Añadir funcionalidad al MCRQuery. Crear procedimientos almacenados. Añadir visualización de los grafos.

34 Conclusiones finales  Un factor muy influyente en la ejecución es la distancia a la que se buscan relaciones entre conceptos.  Las limitaciones de procesamiento de la máquina y el tiempo de la ejecución son un obstáculo importante.  Las herramientas con licencia 'open- source' han resultado muy efectivas.

35 Demo

36 ¡Gracias por su atención! ¿Preguntas?


Descargar ppt "Proyecto Fin de Carrera Ingeniería en Informática Sistema de Resolución de la Ambigüedad Semántica Basada en el Conocimiento Alumno: D. Álvaro Acebedo."

Presentaciones similares


Anuncios Google