Lingüística computacional unidad 2. análisis semántico

Slides:



Advertisements
Presentaciones similares
SISTEMAS DE INFORMACIÓN I
Advertisements

Programa de Estudio Tercer Año Medio.
TERMINOLOGÍA EN ESPAÑOL
TERMINOLOGÍA EN ESPAÑOL
TERMINOLOGÍA EN ESPAÑOL
Teoría de las descripciones Bertrand Russell ( )
Conceptos preliminares
DIMENSIÓN SEMÁNTICA.
Razonamiento algorítmico
La web semántica y su impacto en la recuperación de información
¿Cómo hacer para que una máquina comprenda el LN?
DESARROLLO DE PROGRAMAS
Lenguajes de programación
Del sonido a la escritura
Propiedades textuales
Referente conceptual El pensamiento matemático es un concepto de carácter cognitivo, que hace alusión al conjunto de representaciones mentales, o redes.
Ramas de la Lingüística
INFORMACIÓN AUTOMÁTICA Ciencia que estudia el tratamiento
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE INGENIERIA DIVISIÓN DE INGENIERÍA ELÉCTRICA COMPUTACIÓN PARA INGENIEROS NOTA IMPORTANTE: Para complementar.
Representación del conocimiento
Traducción dirigida por la Sintaxis
Competencia comunicativa
CAPITULO 2 La Representación del Conocimiento
METODOLOGIA DE LA PROGRAMACION
ANALISIS SINTACTICO El análisis gramatical es la tarea de determinar la sintaxis, o estructura, de un programa. Por esta razón también se le conoce como.
PROGRAMACIÓN LÓGICA.
Sistemas Evolutivos Introduccion.
Metodos de Inferencia Lenin Herrera.
Especificación de Consultas M
Problemas, algoritmos y programas: Modelar: Simular o programar su solución en un computador. Algoritmos: Es un conjunto finito, y no ambiguo de etapas.
Inteligencia artificial
Procesamiento Práctico del lenguaje Natural Capítulo XXIII.
1.
HABILIDAD COGNITIVA CLASIFICAR.
Tema 6. Conceptos básicos de programación (Repaso) Prof. María Alejandra Quintero Informática Año 2013.
Campus Estado de México—Raúl Monroy Resolución, la regla de inferencia y el cálculo Raúl Monroy.
UNIVERSIDAD AUTONOMA SAN FRANCISCO Asignatura: METODOS DE ESTUDIO Tema: Análisis y Selección de Contenidos.
APLICACIONES DE LA LINGÜÍSTICA COMPUTACIONAL (I)
UNIDAD 2. ALGORITMOS Y ESTRUCTURAS DE DATOS.
DIMENSIÓN SEMÁNTICA.
METODOS ESPECIFICOS.
RECOMENDACIONES PARA EL ANÁLISIS DE LOS RESULTADOS
Técnicas de Indización y Resumen Félix del Valle Gastaminza 5º A Licenciatura en Documentación Curso

METODOS ESPECIFICOS.
PROGRAMAS INFORMATICOS
LÓGICA DE PROGRAMACIÓN LSC. Susana Alejandra López Jiménez.
LA MORFOLOGÍA.
LE, EI, Profesor Ramón Castro Liceaga UNIVERSIDAD LATINA (UNILA) TRADUCTORES Y ANALIZADOR LEXICOGRÁFICO.
PRESENTACIÓN Este trabajo se desarrolla sobre el tema de competencias, y basado en el Marco de Fundamentacion Conceptual Especificaciones de la Pruebas.
DEV- C++ ·include <iostream> Int x x=x+2(x)
LINGÜÍSTICA UNIDAD 2. Unidad 2: “PROCESAMIENTO DE ORACIONES” INTENCIONALIDADES FORMATIVAS FASE RECONOCIMIENTO COMPETENCIAS COGNITIVACOMUNICATIVAVALORATIVACONTEXTUAL.
ALGORITMOS PRESENTADO POR: FERNANDA LEURO TATIANA CONTRERAS 1004
ALGORITMO QUE ES ??.
Elaboración de algoritmos usando lógica de programación
Posgrado en Sistemas Computacionales Heurísticas de usabilidad MC Luz María Moreno Aguilar Noviembre 2009.
COMPETENCIAS PARA LA COMUNICACIÓN CIENTÍFICA
Metodología de la programación
TEMA: DISEÑO DE LA SOLUCION INTREGRANTES DE EQUIPO: ERIKA CRUZ MARTINEZ RODOLFO LOPEZ ANOTA LUIS ARMANDO LIÑA QUECHA JOSE FRANCISCO MEZO VARELA LUIS ENRIQUE.
Lingüística computacional unidad 2. ambigüedad semántica
C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.
Lingüística computacional unidad 2. lexicones y corpus
Algoritmos Programación
FUNDAMENTOS DE PROGRAMACIÓN
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Conalep 150 Tehuacán inmi 309 soma
Programación I Prof. Carolina Cols. Algoritmo es una lista bien definida, ordenada y finita de operaciones que permite hallar la solución a un problema.
Presentación De UML Lenguaje estándar para escribir planos de software Se usa para visualizar, especificar, construir y documentar los artefactos de un.
Prof. Jonathan Silva Ingeniería Civil – Informática I Ingeniería Civil Informática I Clase 3 – Diseño de Programas.
1 MÁS QUE PALABRAS. 2 Más que palabras ¿Qué han de aprender a manipular mentalmente los niños para ser competentes gramaticalmente hablando?
Transcripción de la presentación:

Lingüística computacional unidad 2. análisis semántico Ana María Tangarife Patiño

Análisis semántico El análisis semántico está encaminado a la resolución de problemas con respecto a los sentidos de las palabras o las expresiones usadas de manera automática Dentro de la LC la semántica pretender estructurar representaciones automáticas del lenguaje natural en máquinas a partir de plantillas de sentido para ejecutar inferencias. Permite expresar significados lingüísticos, enlazar información gramatical con otras clases, procesar significados, validar equivalencias. A partir de clasificaciones y categorizaciones de distintos elementos de la lengua, se generan esquemas conceptuales para realizar inferencias Traducción automática Recuperación de información

Relaciones semánticas Se definen a partir de roles temáticos en donde se representan cada uno de los componentes de la oración. Son graficadas a partir de un marco de casos partiendo de la premisa de que un grupo de estos casos es suficiente para modelar el lenguaje. Estos marcos se han hecho principalmente para los verbos.

Clasificaciones verbales Determinar verbos que corresponden al mismo prototipo. LPPO: Lógica de Predicados de Primer Orden Parte de la lógica matemática estableciendo una lógica preposicional empleando variables, predicados y cuantificadores. Se establecen reglas de formación de oraciones y de inferencia que siguen axiomas lógicos. Gramática de casos de Fillmore Relaciones entre el verbo y demás elementos de la oración a partir de las cuales se establecen roles semánticos.

Modelos de análisis semántico Lógica de Predicados de Primer Orden Sirve para representar el lenguaje de manera formal Hace uso de: Reglas de formación o fórmulas Reglas de inferencia Axiomas lógicos Emplea variables, predicados y cuantificadores (lógica proposicional o lógica simbólica), usando los siguientes símbolos: Negación ( ) Conjunción ( ) Disyunción ( ) Implicación ( ) Coimplicación ( )

Modelos de análisis semántico Lógica de Predicados de Primer Orden

Modelos de análisis semántico cálculo de lamba Formalismo matemático, base de la computación. Permite construir fórmulas semánticas a partir de representaciones sintácticas. Unas expresiones X representan un algoritmo y su entrada, la expresión Y está sujeta a una serie de reglas de reescritura.

Modelos de análisis semántico Gramática Sintagmática Nuclear Representación gráfica matemática de información sintáctica y semántica. Usa grafos para representar información lingüística como secuencia de características. Incluye principales reglas gramaticales basados en entradas léxicas (palabras o frases) que son marcadas en forma jerárquica. Cada entrada léxica contiene información fonética (PHON) y sintáctico-semántica (SYNSEM).

Modelos de análisis semántico Gramática Sintagmática Nuclear. ejemplo

Modelos de análisis semántico Gramática Sintagmática Nuclear. ejemplo

Modelos de análisis semántico MRS Minimal Recursion Semantics Usa para representaciones en las cuales se presenten problemas de ambigüedades. Este modelo parte del enfoque de que una estructura mínima del lenguaje representa y describe léxica y semánticamente la lengua general.

Modelos de análisis semántico MTT Meaning Text Theory Representa reglas lingüísticas de acuerdo a significados específicos en un texto. Usa patrones de manejo para combinar un lexema con otros objetos. Permite representar equivalentes gráficos que son legibles por computador puesto que se basan en redes semánticas.. Este modelo establece una correspondencia entre posibles significados y un conjunto de posibles textos.

AMBIGUACIÓN Y DESAMBIGUACIÓN Ambigüedad: Que puede entenderse de varios modos o admitir distintas interpretaciones y dar, por consiguiente, motivo a dudas, incertidumbre o confusión. Este es un problema mayor puesto que es difícil representar todas las variables que pueden presentarse en el lenguaje natural. Se presenta cuando ocurren diferentes fenómenos, que podrían resolverse en contexto, pero que es necesario prever en la implementación de herramientas computacionales.

Fenómenos de ambigüedad Significados o sentidos de palabras o expresiones de acuerdo a contextos particulares de conocimiento. Puede presentarse por las siguientes situaciones: Palabra que tiene más de un significado de acuerdo a la categoría o al tiempo gramatical Sinonimia Dos o más palabras que representan el mismo concepto Homonimia Dos o más palabras con la misma forma gráfica y distinto significado según el contexto Polisemia Una palabra cuyo sentido varía según el contexto

Problemas en el tratamiento automático que tienen que ver con la ambigüedad Dudas, incertidumbre o confusión. En sistemas automáticos de representación de conocimiento es necesario minimizar estos problemas representando los casos más comunes en el lenguaje natural para proveerle a la máquina métodos que le permitan inferir sobre posibles sentidos y decidir las respuestas más adecuadas Otra clasificación de tipos de ambigüedad: Léxica Sintáctica Semántica Textual Pragmática Referencial.

La desambigüación se realiza principalmente en tareas de: Traducción automática Recuperación de información Solución: determinar automáticamente los sentidos de una palabra de acuerdo a contextos específicos. Para lograr esto se llevan a cabo diferentes métodos que están basados bien sea en el conocimiento, en el corpus o métodos híbridos.

Métodos basados en conocimiento Los métodos basados en conocimiento utilizan herramientas como diccionarios, tesauros, ontologías. Ayudan a especificar los sentidos de acuerdo a usos particulares de las palabras en contextos específicos (lenguaje natural o lenguaje especializado). El propósito de estas herramientas es proveer de significados, definiciones y ejemplos típicos de uso de las palabras. Ejemplo: Wordnet

Métodos basados en corpus Usan conjuntos de datos que proveen ejemplos de oraciones y de usos de las palabras de tal forma que puedan utilizarse en algoritmos de aprendizaje automático. Estos métodos están divididos en dos tipos: corpus etiquetado y corpus no etiquetado. Corpus etiquetado: Clasificadores para darle sentido apropiado a una palabra dentro de un contexto determinado. Se encuentran automáticamente relaciones o patrones entre las palabras y luego evalúan y comparan los sentidos para realizar la desambiguación correcta Tiene en cuenta: Co-ocurrencia, N-gramas, Colocaciones. Corpus no etiquetado: Patrones que se definen para armar grupos de palabras con características comunes que se relacionan de alguna manera.

Métodos combinados Generación automática de esquemas conceptuales Permiten la interacción en lenguaje natural entre el usuario y el computador. Facilitan tareas de recuperación y extracción automática de textos en corpus específicos, así como otros modelos o sistemas de etiquetaje, análisis y desambiguación Algunas herramientas: Extracción automática de contextos definitorios: http://swesum.nada.kth.se/index-eng.html Anotaciones semánticas Ayuda en la escritura (corrección) Extracción automática de terminología Indexación automática Data mining textual Patrones y tendencias del discurso

Esquemas preconceptuales Representaciones gráficas y textuales que permiten una interpretación cercana a la realidad conceptual de un dominio. Identifica las características estructurales y dinámicas de una lengua, ofreciendo a cada elemento una única categoría gramatical, lo que permitiría una mayor precisión de sentidos.

Esquemas preconceptuales Identificación Nombre Objeto Agente 1 Predicado Agente 2 tiene Verbo

UN-lecep Lenguaje controlado en español para la especificación de esquemas preconceptuales, generación de plantillas para la escritura de dichos esquemas.

Retos… Implementación y desarrollo de esquemas o categorías conceptuales en dominios específicos Aplicaciones que no queden restringidas a la aplicación en otras lenguas. Hace falta más desarrollo y divulgación de aplicaciones en lengua castellana. Construcción de ontologías que faciliten la estructuración y haga una marcación semántica de los documentos en la web a través del uso de términos específicos y la representación de las relaciones conceptuales entre ellos. Utilización de métodos de análisis combinados (estadísticos y cualitativos)

referencias http://www3.unileon.es/dp/dfh/Milka/LCII/Intro_LCA.pdf http://rua.ua.es/dspace/bitstream/10045/3346/1/PLN_37_44. pdf http://www.sepln.org/revistaSEPLN/revista/27/27- articulo33.pdf http://ccc.inaoep.mx/~mmontesg/tesis%20estudiantes/Tesis Maestria-AaronPancardo.pdf http://www.revista.unal.edu.co/index.php/formayfuncion/ar ticle/viewFile/17290/18129 http://tecnolengua.uma.es/doc2/resla98.pdf