La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Margarita Alonso Ramos Master LUP 2012 Diccionario o Base de datos léxicos.

Presentaciones similares


Presentación del tema: "Margarita Alonso Ramos Master LUP 2012 Diccionario o Base de datos léxicos."— Transcripción de la presentación:

1 Margarita Alonso Ramos Master LUP 2012 Diccionario o Base de datos léxicos

2 Organización de la exposición 1. Qué es un léxico computacional 2. Cómo representar la información léxica 3. Aplicaciones de la LexComp 4. Proyectos de LexComp 1. Qué es un léxico computacional Qué elementos son una unidad léxica Qué información contiene una entrada lexicográfica

3 1. ¿Qué es un léxico computacional? No es solo un diccionario en soporte informático http://elies.rediris.es/elies24/pampillon.htm Los diccionarios en línea o en CD pueden ser una buena herramienta pero el usuario es un humano, no un sistema http://www.diccionarios.com/consultas.php# http://www.ideasafines.com.ar/buscador-ideas-relacionadas.php VOLGA: http://www.realacademiagalega.org/volga/index.jsp http://www.realacademiagalega.org/volga/index.jsp DRAE: www.rae.eswww.rae.es DicoPortugués: http://www.priberam.pt/dlpo/dlpo.aspxhttp://www.priberam.pt/dlpo/dlpo.aspx WordReference: http://www.wordreference.com/es/http://www.wordreference.com/es/ Bilingüe inglés: http://www.babylon.com/definition/give/Spanishhttp://www.babylon.com/definition/give/Spanish Cambridge: http://dictionary.cambridge.org Merrian-Webster: www.m-w.com/cgi-bin/dictionary?book=Dictionary&va=purchase&x=0&ywww.m-w.com/cgi-bin/dictionary?book=Dictionary&va=purchase&x=0&y= htttp://oesi.cervantes.es/TLTODOS/recursos_linguisticos_1.htm

4 1. ¿Qué es un léxico computacional? Un “almacén” de información léxica accesible por medios manuales o automáticos para sistemas de PLN

5 1.1.¿Qué se entiende por unidad léxica? Unidades léxicas (UL): sentidos o acepciones Concepto de acepción (polisemia): Difícil delimitación Diferente según el objetivo aplicativo Actuar 1 intr. Ejercer una persona o cosa actos propios de su naturaleza 2 Ejercer las funciones propias de un oficio: ~ de secretario. 3 Representar en el teatro o en el cine. 4 Trabajar en un espectáculo público. 5 Defender, en las universidades, conclusiones públicas o practicar ejercicios de oposición. 6 DER. Realizar actuaciones

6 ¿Qué se entiende por unidad léxica? (2) Granularidad en la diferenciación de sentidos (diccionarios) libro monosémico cerdo monolingües: animal, carne, piel,.... bilingües (desajustes: pig, pork) El tipo semántico no implica que haya una o más acepciones. diferentes sentidos matices de un mismo sentido ¿?

7 1.2. ¿Qué información contienen ? Dependiendo de los objetivos del léxico: La trascripción fonética La categoría gramatical y paradigma morfológico dar {vdtr}, 1ªconj. La estructura argumental, patrón sintáctico-semántico básico SYNSEM | LOC HEAD | MAJOR V | SUBCAT = SEM[dar agente [1], tema [2], beneficiario [3]]

8 Información semántica: tipo semántico definido en una ontología. chico [HUMANO] ordenador [ARTEFACTO] Restricciones selectivas Relaciones léxicas: Paradigmáticas: sinonimia, antonimia, hiponimia Sintagmáticas: colocaciones Las equivalencias con otras lenguas,... ¿Qué información contienen ?

9 Organización de la exposición 1. Qué es un léxico computacional 2. Cómo representar la información léxica 3. Aplicaciones de la LexComp 4. Proyectos de LexComp 2. Cómo representar la información léxica

10 2. ¿Cómo representar la información?  Bases de datos  Modelos textuales  Bases de conocimiento léxico  Ontologías

11 Modelos de representación computacionales Bases de datos relacionales las entradas se representan en tablas  cada tabla consta de diversos rasgos que toman valores  Cat = N  Gen = Fem ventajas u software convencional de gestión de base de datos (Access de Microsoft)  mantenimiento, eficiencia y facilidad de interrogación  gran capacidad expresiva limitaciones: - falta de estructura jerárquica – excesiva uniformidad – poco apropiadas para los rasgos de tipo textual

12 Modelos de representación computacionales Modelos textuales Corpus en bruto:  Frecuencias léxicas  Coapariciones de dos o más palabras Corpus etiquetados:  morfológicamente  sintácticamente  semánticamente  identificación de colocaciones

13 Modelos de representación computacionales Representaciones orientadas a objetos NOMBRE-F-REG cat= n tipo = común género= femenino morfología= NFAAS casa es-un: NOMBRE-F-REG número= singular casas es-un: NOMBRE-F-REG número= plural CLASE EJEMPLARES

14 Modelos de representación computacionales Ontologías semántica basada en una ontología árabe semítica lengua cada sentido se diferencia por uno o más rasgos + lengua + semítica + lengua + semítica

15 árabe semítica lengua + lengua + semítica + lengua + semítica + árabe hebreo... indo- europea lenguaje programación semántica basada en una ontología

16 Modelos de representación computacionales Ontologías WordNet - Red de conocimiento léxico-semántica - Relaciones semánticas: sinonimia, hiperonimia, hiponimia, meronimia... - Unidad de descripción: synset

17 vehículo es-un automóvil 1 ; coche 2 ; carro 2 se-compone-de motor rueda volante ranchera;furgón ambulancia taxi es-un Modelos de representación computacionales Redes semánticas

18

19 Modelos de representación computacionales Problemas incompleto: dominios poco o nada representados sentidos básicos que no aparecen Granularidad excesiva: Hombre= el que sirve en el ejército (10)opuesto a hembra opuesto a esposa carácter de hombre... Criterio poco claro de sinonimia  hiperonimia/hiponimia

20 Organización de la exposición 1. Qué es un léxico computacional 2. Cómo representar la información 3. Aplicaciones de la LexComp

21 Aplicaciones  Técnicas que incorporan conocimiento lingüístico Sistemas de tratamiento de la información Extracción de información Recuperación de información TA  Aplicaciones: usuario final Lexicografía Autoaprendizaje, Buscadores, etc.  Recursos (léxicos)

22 Aplicaciones (1) Clasificación

23 Aplicaciones (2) Clasificación semántica

24 Aplicaciones (3) Traducción Automática Diccionario monolingüe ("llegir" VST ALO [raíz] "lleg" ARGS ((($SUBJ N1 (TYPE P1)) OPT ($DOBJ N1 (TYPE P0) N0 (FCP 0) (MD-0 IND)))) CL [modelo de flexion] (IR-E) CMT[prototipo flexivo] "Model: servir" ON CO PLC (NF) TAL [admite -eix-] -EIX AUTHOR "elisabel" DATE "1-Mar-99" SITE "FB52")

25 "fer" VST --> "retroceder" VST = Tests (XFR-VST-CTEST :MW T :FIXEXPR T :EXPR "enrere") Comment "no ens farem enrere =no retrocederemos" > "fer" VST --> "llegar" VST = Tests(XFR-VST-CTEST :MW T :FIXEXPR T : EXPR "tard") Comment "fer tard =llegar tarde" > "fer" VST --> "pesar" VST = > Aplicaciones (5) Traducción Automática Diccionario Bilingüe Incita/SailLabs

26 Organización de la exposición 1. Qué es un léxico computacional 2. Cómo representar la información 3. Aplicaciones de la Lexicografía computacional 4. Proyectos

27 4. Proyectos lexicográficos DiCE (Diccionario de colocaciones del español) http://www.dicesp.es DiCoInfo (Dicctionario de informática) http://olst.ling.umontreal.ca/cgi-bin/dicoinfo/search.cgi?ui=es EuroWordNet http://adimen.si.ehu.es/cgi-bin/wei/public/wei.consult.perl FrameNet http://framenet.icsi.berkeley.edu Spanish FrameNet http://sato.fm.senshu-u.ac.jp/sfn20/notes/index2.html


Descargar ppt "Margarita Alonso Ramos Master LUP 2012 Diccionario o Base de datos léxicos."

Presentaciones similares


Anuncios Google