Margarita Alonso Ramos Master LUP 2012 Diccionario o Base de datos léxicos.

Slides:



Advertisements
Presentaciones similares
Diferencia Entre Blogs y Websites Christian O. Rodríguez Méndez 8 de abril de 2010.
Advertisements

Internet y tecnologías web
Region Manager (IQA) Microsoft Ireland
Fenómenos semánticos Relaciones semánticas: manera en que se relacionan los significados Sinonimia: dos palabras tienen un mismo significado Sinonimia.
PARTES DE LA GRAMÁTICA.
TERMINOLOGÍA EN ESPAÑOL
TERMINOLOGÍA EN ESPAÑOL
TERMINOLOGÍA EN ESPAÑOL
5. LA TERMINOGRAFÍA: FUNDAMENTOS, MATERIALES Y METODOLOGÍA
Lenguaje Lic. Carlos Marenales
Introducción a LAS Bases de Datos
Conceptos preliminares
Es tanta la información en Internet, que abruma. Y suele ser difícil encontrar datos precisos. No siempre se dispone del tiempo.
Guillermo A. Díaz Sanhueza
Herramientas para la Investigación
La web semántica y su impacto en la recuperación de información
¿Cómo hacer para que una máquina comprenda el LN?
Un curso web sobre NLP en IR para enseñanza y aprendizaje a distancia Felisa Verdejo, Julio Gonzalo, Anselmo Peñas UNED.
Ingeniería del Conocimiento
Los corpus electrónicos
Analizadores Sintácticos Descendentes Predictivos
Propiedades textuales
La palabra.
Placa Apertura. Pulse para añadir textoDiego Ferreyra Mar del Plata 14 de mayo de 2014 La gestión del conocimiento en ambientes digitales.
El ordenador como herramienta en la adquisición del léxico en la enseñanza del alemán en los estudios de Traducción e Interpretación Antonia Montes Fernández.
Ramas de la Lingüística
PARTES DE LA GRAMÁTICA.
Sistema de Gestión de Base de Datos
Definicion Son bases de datos creadas a partir de la información obtenida por programas que sistemáticamente recorren la Internet, localizando recursos.
Partes: -Adecuación -coherencia -cohesión -valoración crítica
Margarita Alonso Ramos Master LUP 2011
Los límites del lenguaje son los límites del pensamiento.
EL COMENTARIO LINGÜÍSTICO
Lo bucadores son sistemas que permite al usuario buscar información,estos la consiguen de la web, pero otroa tanto la obtienen del news,gopher,ftp,etc.
MODELOS DE BASES DE DATOS
Qué es un tesauro y para qué sirve
Arquitectura de la Información Prof. Adelaide Bianchini – Dpto. de Computación y Tecnología de la Información, Universidad Simón Bolívar. Febrero 2006.
UPV - EHU Konputagailuen Arkitektura eta Teknologia Saila Departamento de Arquitectura y Tecnología de Computadores 1 Sistemas Ubicuos 3. Gestión del contexto.
Sistemas de Información IS95872
Introducción al PLN Ingeniería Lingüística Tareas Recursos
Procesamiento Práctico del lenguaje Natural Capítulo XXIII.
Recursos generales del traductor Bianca Vitalaru Universidad de Alcalá
LA COMUNICACIÓN Iconos Símbolos Indicios LENGUA Y LITERATURA
4/27/2015Lingüística Computacional1 LEXICONES Y CORPUS Carlos Mario Zapata J.
Introducción al PLN 2 Lingüística Computacional vs Tratamiento del Lenguaje Natural (Tratamiento de la Lengua). Disciplinas afines Lingüística Inteligencia.
Proyecto Fin de Carrera - II
Niveles de estudio de la lengua El nivel fónico El nivel morfológico
Seminario de Informática Elementos Conceptuales
TEMA 13: RELACIONES SEMÁNTICAS ENTRE LAS PALABRAS: HIPONIMIA, SINONIMIA, POLISEMIA, HOMONIA Y ANTONIMIA. LOS CAMBIOS DE SENTIDO LOS CAMBIOS SEMÁNTICOS.

LA MORFOLOGÍA.
Semana Cuatro/Taller Cuatro Presentación 1
SEMANTICA Y LÉXICO TEMA 7 1.º DE BACH..
Proyecto Fin de Carrera Ingeniería Informática Interfaz Avanzada de Consulta al Multilingual Central Repository (MCR)‏ María Eguimendia Director: Germán.
El concepto de texto.
Heiner Mercado Curso de Lingüística Computacional
El significado de las palabras
Lingüística computacional unidad 2. ambigüedad semántica
C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.
4.2. NIVEL MORFOLÓGICO Lingüística Materia básica. Curso 1º
Lingüística computacional unidad 2. análisis semántico
Lingüística computacional unidad 2. lexicones y corpus
Tecnologías del lenguaje
SUSTANTIVO(p.p.74-77) Palabra variable que nombra a personas, animales cosas o ideas Forma básica: LEX+ MORFEMAS FLEXIVOS DE GÉNERO Y NÚMERO EL GÉNERO.
LA SEMÁNTICA Es la ciencia que estudia el significado de las palabras y las expresiones lingüísticas.
10/07/2015
¿Qué es la sociolingüística?
BASES DE DATOS CONCEPTOS BASICOS Elizabeth Maite Zarate Machaca “El tratamiento eficiente de la información al servicio del usuario”
NIVEL SEMÁNTICO ELIPSIS TABÚ/EUFEMISMO METÁFORA Y METONIMIA
Análisis de fenómenos de fusión en los niveles de la arquitectura gramatical. Sevilla, mayo de 2007.
Transcripción de la presentación:

Margarita Alonso Ramos Master LUP 2012 Diccionario o Base de datos léxicos

Organización de la exposición 1. Qué es un léxico computacional 2. Cómo representar la información léxica 3. Aplicaciones de la LexComp 4. Proyectos de LexComp 1. Qué es un léxico computacional Qué elementos son una unidad léxica Qué información contiene una entrada lexicográfica

1. ¿Qué es un léxico computacional? No es solo un diccionario en soporte informático Los diccionarios en línea o en CD pueden ser una buena herramienta pero el usuario es un humano, no un sistema VOLGA: DRAE: DicoPortugués: WordReference: Bilingüe inglés: Cambridge: Merrian-Webster: htttp://oesi.cervantes.es/TLTODOS/recursos_linguisticos_1.htm

1. ¿Qué es un léxico computacional? Un “almacén” de información léxica accesible por medios manuales o automáticos para sistemas de PLN

1.1.¿Qué se entiende por unidad léxica? Unidades léxicas (UL): sentidos o acepciones Concepto de acepción (polisemia): Difícil delimitación Diferente según el objetivo aplicativo Actuar 1 intr. Ejercer una persona o cosa actos propios de su naturaleza 2 Ejercer las funciones propias de un oficio: ~ de secretario. 3 Representar en el teatro o en el cine. 4 Trabajar en un espectáculo público. 5 Defender, en las universidades, conclusiones públicas o practicar ejercicios de oposición. 6 DER. Realizar actuaciones

¿Qué se entiende por unidad léxica? (2) Granularidad en la diferenciación de sentidos (diccionarios) libro monosémico cerdo monolingües: animal, carne, piel,.... bilingües (desajustes: pig, pork) El tipo semántico no implica que haya una o más acepciones. diferentes sentidos matices de un mismo sentido ¿?

1.2. ¿Qué información contienen ? Dependiendo de los objetivos del léxico: La trascripción fonética La categoría gramatical y paradigma morfológico dar {vdtr}, 1ªconj. La estructura argumental, patrón sintáctico-semántico básico SYNSEM | LOC HEAD | MAJOR V | SUBCAT = SEM[dar agente [1], tema [2], beneficiario [3]]

Información semántica: tipo semántico definido en una ontología. chico [HUMANO] ordenador [ARTEFACTO] Restricciones selectivas Relaciones léxicas: Paradigmáticas: sinonimia, antonimia, hiponimia Sintagmáticas: colocaciones Las equivalencias con otras lenguas,... ¿Qué información contienen ?

Organización de la exposición 1. Qué es un léxico computacional 2. Cómo representar la información léxica 3. Aplicaciones de la LexComp 4. Proyectos de LexComp 2. Cómo representar la información léxica

2. ¿Cómo representar la información?  Bases de datos  Modelos textuales  Bases de conocimiento léxico  Ontologías

Modelos de representación computacionales Bases de datos relacionales las entradas se representan en tablas  cada tabla consta de diversos rasgos que toman valores  Cat = N  Gen = Fem ventajas u software convencional de gestión de base de datos (Access de Microsoft)  mantenimiento, eficiencia y facilidad de interrogación  gran capacidad expresiva limitaciones: - falta de estructura jerárquica – excesiva uniformidad – poco apropiadas para los rasgos de tipo textual

Modelos de representación computacionales Modelos textuales Corpus en bruto:  Frecuencias léxicas  Coapariciones de dos o más palabras Corpus etiquetados:  morfológicamente  sintácticamente  semánticamente  identificación de colocaciones

Modelos de representación computacionales Representaciones orientadas a objetos NOMBRE-F-REG cat= n tipo = común género= femenino morfología= NFAAS casa es-un: NOMBRE-F-REG número= singular casas es-un: NOMBRE-F-REG número= plural CLASE EJEMPLARES

Modelos de representación computacionales Ontologías semántica basada en una ontología árabe semítica lengua cada sentido se diferencia por uno o más rasgos + lengua + semítica + lengua + semítica

árabe semítica lengua + lengua + semítica + lengua + semítica + árabe hebreo... indo- europea lenguaje programación semántica basada en una ontología

Modelos de representación computacionales Ontologías WordNet - Red de conocimiento léxico-semántica - Relaciones semánticas: sinonimia, hiperonimia, hiponimia, meronimia... - Unidad de descripción: synset

vehículo es-un automóvil 1 ; coche 2 ; carro 2 se-compone-de motor rueda volante ranchera;furgón ambulancia taxi es-un Modelos de representación computacionales Redes semánticas

Modelos de representación computacionales Problemas incompleto: dominios poco o nada representados sentidos básicos que no aparecen Granularidad excesiva: Hombre= el que sirve en el ejército (10)opuesto a hembra opuesto a esposa carácter de hombre... Criterio poco claro de sinonimia  hiperonimia/hiponimia

Organización de la exposición 1. Qué es un léxico computacional 2. Cómo representar la información 3. Aplicaciones de la LexComp

Aplicaciones  Técnicas que incorporan conocimiento lingüístico Sistemas de tratamiento de la información Extracción de información Recuperación de información TA  Aplicaciones: usuario final Lexicografía Autoaprendizaje, Buscadores, etc.  Recursos (léxicos)

Aplicaciones (1) Clasificación

Aplicaciones (2) Clasificación semántica

Aplicaciones (3) Traducción Automática Diccionario monolingüe ("llegir" VST ALO [raíz] "lleg" ARGS ((($SUBJ N1 (TYPE P1)) OPT ($DOBJ N1 (TYPE P0) N0 (FCP 0) (MD-0 IND)))) CL [modelo de flexion] (IR-E) CMT[prototipo flexivo] "Model: servir" ON CO PLC (NF) TAL [admite -eix-] -EIX AUTHOR "elisabel" DATE "1-Mar-99" SITE "FB52")

"fer" VST --> "retroceder" VST = Tests (XFR-VST-CTEST :MW T :FIXEXPR T :EXPR "enrere") Comment "no ens farem enrere =no retrocederemos" > "fer" VST --> "llegar" VST = Tests(XFR-VST-CTEST :MW T :FIXEXPR T : EXPR "tard") Comment "fer tard =llegar tarde" > "fer" VST --> "pesar" VST = > Aplicaciones (5) Traducción Automática Diccionario Bilingüe Incita/SailLabs

Organización de la exposición 1. Qué es un léxico computacional 2. Cómo representar la información 3. Aplicaciones de la Lexicografía computacional 4. Proyectos

4. Proyectos lexicográficos DiCE (Diccionario de colocaciones del español) DiCoInfo (Dicctionario de informática) EuroWordNet FrameNet Spanish FrameNet