Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porXavier Crespo Ortíz Modificado hace 7 años
1
Proyecto Fin de Carrera Ingeniería en Informática Sistema de Resolución de la Ambigüedad Semántica Basada en el Conocimiento Alumno: D. Álvaro Acebedo Director: D. Germán Rigau Septiembre 2007 - FISS
2
Índice Introducción Objetivos del Proyecto SSI Pruebas Gestión Conclusiones Demo
3
Introducción Este proyecto se enmarca en el área de la Inteligencia Artificial, en concreto en lo referido al Procesamiento del Lenguaje Natural. La WSD consiste en decidir el sentido apropiado de una palabra dependiendo de su contexto. Para llevarlo a cabo nos valdremos de Bases de Conocimiento.
4
Introducción – Ejemplo Ejemplo de base de Conocimiento: MAMÍFER O ANIMA L PELAJ E AGU A vive en es un tiene es un
5
Introducción WordNet 2.0 115.424 nodos, 337.984 relaciones en total. MCR Desarrollado por el grupo Meaning. Aglutina diferentes versiones de WordNet y diferentes idiomas.
6
Introducción – Adquirir conocimiento ¿Es posible enriquecer las Bases de Conocimiento con los mismos métodos de desambiguación que se valen de ellas? Desambiguación de Glosas (Senseval)
7
Introducción – WSD orientado a las Glosas Ballena: Mamífero Cetáceo de hasta quince metros de longitud y enormes aletas. MAMÍFERO 1 ALETA 1 2 CETÁCEO 1 METRO 1 3 2 MAMÍFERO 1 CETÁCEO 1 ALETA 2 METRO 3
8
Objetivos del Proyecto Objetivos Primarios: Idear, diseñar, implementar y evaluar algoritmos WSD basándonos en SSI. Objetivos Secundarios: Añadir funcionalidad al MCRQuery. Crear procedimientos almacenados. Añadir visualización de los grafos.
9
Esquema de Descomposición del Proyecto
10
DOP – Casos de Uso El desarrollo de este proyecto sólo implica la realización de un caso de uso sencillo.
11
SSI Mecanismo iterativo para la desambiguación basada en el conocimiento. Crea especificaciones estructurales de los posibles sentidos de cada palabra en un contexto y selecciona la mejor hipótesis de las posibles, describiendo relaciones entre las especificaciones de los sentidos mencionados.
12
SSI. Mecanismo PEZ 1 3 2 MAMÍFERO 1 GATO 1 2 MAMÍFERO 1
13
SSI. Mecanismo MAMÍFERO 1 GATO 1 MAMÍFERO 1 GATO 2 0,1 6 0,8 3
14
SSI. Mecanismo PEZ 1 3 2 GATO 1 2 MAMÍFERO 1 GATO 2
15
SSI. Mecanismo MAMÍFERO 1 PEZ 1 GATO 2 PEZ 1 MAMÍFERO 1 PEZ 2 GATO 2 PEZ 2 MAMÍFERO 1 PEZ 3 GATO 2 PEZ 3 ++ + 0,7 8 0,2 1 0,1 3
16
SSI. Mecanismo PEZ 1 3 2 MAMÍFERO 1 GATO 2 PEZ 1
17
SSI – versión 3 de st. 3 2 2 2 2 2 2 2 2 1 11 ori g.
18
SSI – versión 3 de st. 3 2 2 2 2 2 2 2 2 1 11 ori g.
19
SSI – versión 4 Utiliza el algoritmo de Dijkstra para la obtención de caminos mínimos. $g->dijkstra_shortest_path($s, $t); Se usa una estructura total de la base de conocimiento para aplicar el algoritmo.
20
SSI – versión 4b Construye grafos simplificados para el cálculo de los caminos. También tiene en cuenta la distancia máxima. Procesa los caminos valiéndose de pilas que almacenan el proceso.
21
SSI – versión 4b de st. 2 2 1 2 1 ori g.
22
SSI – versión 4b de st. 2 2 1 2 1 3 2 2 2 2 2 1 ori g.
23
SSI – versión 5 Crea 'nubes' alrededor de los nodos fuente y destino. Analiza la similitud entre las 'nubes' para encontrar caminos. La distancia máxima a la que se encuentran caminos duplica la distancia máxima de las 'nubes'.
24
SSI – versión 5 o ri g. d e st. 1 11 1 1 1 2 2 2 2 2 2 2 2 2 2
25
SSI – versión 5 o ri g. d e st. e e c c a a d d b b
26
SSI – versión 5 de st. e c a d b ori g.
27
Pruebas Se han realizado dos juegos de pruebas: Pruebas sencillas. Ejecutamos los algoritmos con un juego de términos determinado y observamos resultados. Senseval-3. Taller Internacional de Desambiguación de Glosas basado en eXtended WordNet. Incluye mecanismos de calificación propios.
28
Pruebas - Iniciales Juego de Pruebas Uno: flight, scheduled, trip, plane, designated, airport Juego de Pruebas Dos: port, place, seaport, airport, people, merchandise, enter, leave, country
29
Pruebas – Senseval (WN2.0) Sólo fue posible procesar dos de los cuatro algoritmos ideados.
30
Pruebas – Senseval (WN2.0+XWN2.0) Los resultados mejoraron ampliando la base de conocimiento con eXtended WordNet.
31
Pruebas Senseval - Comparativa
32
Gestión
33
Balance de Éxito Objetivos Primarios: Idear, diseñar, implementar y evaluar algoritmos WSD basándonos en SSI. Objetivos Secundarios: Añadir funcionalidad al MCRQuery. Crear procedimientos almacenados. Añadir visualización de los grafos.
34
Conclusiones finales Un factor muy influyente en la ejecución es la distancia a la que se buscan relaciones entre conceptos. Las limitaciones de procesamiento de la máquina y el tiempo de la ejecución son un obstáculo importante. Las herramientas con licencia 'open- source' han resultado muy efectivas.
35
Demo
36
¡Gracias por su atención! ¿Preguntas?
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.