La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Lingüística computacional unidad 2. análisis semántico

Presentaciones similares


Presentación del tema: "Lingüística computacional unidad 2. análisis semántico"— Transcripción de la presentación:

1 Lingüística computacional unidad 2. análisis semántico
Ana María Tangarife Patiño

2 Análisis semántico El análisis semántico está encaminado a la resolución de problemas con respecto a los sentidos de las palabras o las expresiones usadas de manera automática Dentro de la LC la semántica pretender estructurar representaciones automáticas del lenguaje natural en máquinas a partir de plantillas de sentido para ejecutar inferencias. Permite expresar significados lingüísticos, enlazar información gramatical con otras clases, procesar significados, validar equivalencias. A partir de clasificaciones y categorizaciones de distintos elementos de la lengua, se generan esquemas conceptuales para realizar inferencias Traducción automática Recuperación de información

3 Relaciones semánticas
Se definen a partir de roles temáticos en donde se representan cada uno de los componentes de la oración. Son graficadas a partir de un marco de casos partiendo de la premisa de que un grupo de estos casos es suficiente para modelar el lenguaje. Estos marcos se han hecho principalmente para los verbos.

4 Clasificaciones verbales
Determinar verbos que corresponden al mismo prototipo. LPPO: Lógica de Predicados de Primer Orden Parte de la lógica matemática estableciendo una lógica preposicional empleando variables, predicados y cuantificadores. Se establecen reglas de formación de oraciones y de inferencia que siguen axiomas lógicos. Gramática de casos de Fillmore Relaciones entre el verbo y demás elementos de la oración a partir de las cuales se establecen roles semánticos.

5 Modelos de análisis semántico Lógica de Predicados de Primer Orden
Sirve para representar el lenguaje de manera formal Hace uso de: Reglas de formación o fórmulas Reglas de inferencia Axiomas lógicos Emplea variables, predicados y cuantificadores (lógica proposicional o lógica simbólica), usando los siguientes símbolos: Negación ( ) Conjunción ( ) Disyunción ( ) Implicación ( ) Coimplicación ( )

6 Modelos de análisis semántico Lógica de Predicados de Primer Orden

7 Modelos de análisis semántico cálculo de lamba
Formalismo matemático, base de la computación. Permite construir fórmulas semánticas a partir de representaciones sintácticas. Unas expresiones X representan un algoritmo y su entrada, la expresión Y está sujeta a una serie de reglas de reescritura.

8 Modelos de análisis semántico Gramática Sintagmática Nuclear
Representación gráfica matemática de información sintáctica y semántica. Usa grafos para representar información lingüística como secuencia de características. Incluye principales reglas gramaticales basados en entradas léxicas (palabras o frases) que son marcadas en forma jerárquica. Cada entrada léxica contiene información fonética (PHON) y sintáctico-semántica (SYNSEM).

9 Modelos de análisis semántico Gramática Sintagmática Nuclear. ejemplo

10 Modelos de análisis semántico Gramática Sintagmática Nuclear. ejemplo

11 Modelos de análisis semántico MRS Minimal Recursion Semantics
Usa para representaciones en las cuales se presenten problemas de ambigüedades. Este modelo parte del enfoque de que una estructura mínima del lenguaje representa y describe léxica y semánticamente la lengua general.

12 Modelos de análisis semántico MTT Meaning Text Theory
Representa reglas lingüísticas de acuerdo a significados específicos en un texto. Usa patrones de manejo para combinar un lexema con otros objetos. Permite representar equivalentes gráficos que son legibles por computador puesto que se basan en redes semánticas.. Este modelo establece una correspondencia entre posibles significados y un conjunto de posibles textos.

13 AMBIGUACIÓN Y DESAMBIGUACIÓN
Ambigüedad: Que puede entenderse de varios modos o admitir distintas interpretaciones y dar, por consiguiente, motivo a dudas, incertidumbre o confusión. Este es un problema mayor puesto que es difícil representar todas las variables que pueden presentarse en el lenguaje natural. Se presenta cuando ocurren diferentes fenómenos, que podrían resolverse en contexto, pero que es necesario prever en la implementación de herramientas computacionales.

14 Fenómenos de ambigüedad
Significados o sentidos de palabras o expresiones de acuerdo a contextos particulares de conocimiento. Puede presentarse por las siguientes situaciones: Palabra que tiene más de un significado de acuerdo a la categoría o al tiempo gramatical Sinonimia Dos o más palabras que representan el mismo concepto Homonimia Dos o más palabras con la misma forma gráfica y distinto significado según el contexto Polisemia Una palabra cuyo sentido varía según el contexto

15 Problemas en el tratamiento automático que tienen que ver con la ambigüedad
Dudas, incertidumbre o confusión. En sistemas automáticos de representación de conocimiento es necesario minimizar estos problemas representando los casos más comunes en el lenguaje natural para proveerle a la máquina métodos que le permitan inferir sobre posibles sentidos y decidir las respuestas más adecuadas Otra clasificación de tipos de ambigüedad: Léxica Sintáctica Semántica Textual Pragmática Referencial.

16 La desambigüación se realiza principalmente en tareas de:
Traducción automática Recuperación de información Solución: determinar automáticamente los sentidos de una palabra de acuerdo a contextos específicos. Para lograr esto se llevan a cabo diferentes métodos que están basados bien sea en el conocimiento, en el corpus o métodos híbridos.

17 Métodos basados en conocimiento
Los métodos basados en conocimiento utilizan herramientas como diccionarios, tesauros, ontologías. Ayudan a especificar los sentidos de acuerdo a usos particulares de las palabras en contextos específicos (lenguaje natural o lenguaje especializado). El propósito de estas herramientas es proveer de significados, definiciones y ejemplos típicos de uso de las palabras. Ejemplo: Wordnet

18 Métodos basados en corpus
Usan conjuntos de datos que proveen ejemplos de oraciones y de usos de las palabras de tal forma que puedan utilizarse en algoritmos de aprendizaje automático. Estos métodos están divididos en dos tipos: corpus etiquetado y corpus no etiquetado. Corpus etiquetado: Clasificadores para darle sentido apropiado a una palabra dentro de un contexto determinado. Se encuentran automáticamente relaciones o patrones entre las palabras y luego evalúan y comparan los sentidos para realizar la desambiguación correcta Tiene en cuenta: Co-ocurrencia, N-gramas, Colocaciones. Corpus no etiquetado: Patrones que se definen para armar grupos de palabras con características comunes que se relacionan de alguna manera.

19 Métodos combinados Generación automática de esquemas conceptuales
Permiten la interacción en lenguaje natural entre el usuario y el computador. Facilitan tareas de recuperación y extracción automática de textos en corpus específicos, así como otros modelos o sistemas de etiquetaje, análisis y desambiguación Algunas herramientas: Extracción automática de contextos definitorios: Anotaciones semánticas Ayuda en la escritura (corrección) Extracción automática de terminología Indexación automática Data mining textual Patrones y tendencias del discurso

20 Esquemas preconceptuales
Representaciones gráficas y textuales que permiten una interpretación cercana a la realidad conceptual de un dominio. Identifica las características estructurales y dinámicas de una lengua, ofreciendo a cada elemento una única categoría gramatical, lo que permitiría una mayor precisión de sentidos.

21 Esquemas preconceptuales
Identificación Nombre Objeto Agente 1 Predicado Agente 2 tiene Verbo

22 UN-lecep Lenguaje controlado en español para la especificación de esquemas preconceptuales, generación de plantillas para la escritura de dichos esquemas.

23 Retos… Implementación y desarrollo de esquemas o categorías conceptuales en dominios específicos Aplicaciones que no queden restringidas a la aplicación en otras lenguas. Hace falta más desarrollo y divulgación de aplicaciones en lengua castellana. Construcción de ontologías que faciliten la estructuración y haga una marcación semántica de los documentos en la web a través del uso de términos específicos y la representación de las relaciones conceptuales entre ellos. Utilización de métodos de análisis combinados (estadísticos y cualitativos)

24 referencias http://www3.unileon.es/dp/dfh/Milka/LCII/Intro_LCA.pdf
pdf articulo33.pdf Maestria-AaronPancardo.pdf ticle/viewFile/17290/18129


Descargar ppt "Lingüística computacional unidad 2. análisis semántico"

Presentaciones similares


Anuncios Google