La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

Presentaciones similares


Presentación del tema: "C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño."— Transcripción de la presentación:

1 C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño

2 OBJETIVO Exponer los conceptos generales de la disciplina, identificando las relaciones y diferencias con otras áreas disciplinares que comparten su objeto de estudio.

3 INTERDISCIPLINARIEDAD LingüísticaInformática Objetivo: Generar modelos computacionales que reproduzcan uno o más aspectos del lenguaje humano.

4 Á REAS DISCIPLINARES INVOLUCRADAS (1) LC IA Industrias de la Lengua Lingüística aplicada Lingüística teórica La LC es un campo interdisciplinario cuyo objetivo es incorporar en los computadores la habilidad en el manejo del lenguaje humano o natural.

5 Á REAS DISCIPLINARES INVOLUCRADAS (2) Informática IA Es la ciencia de hacer máquinas inteligentes. LC Diseña máquinas capaces de comprender el lenguaje, aprender, razonar y tomar decisiones.

6 Á REAS DISCIPLINARES INVOLUCRADAS (3) Lingüística teórica La lingüística es el estudio científico de la lengua. Como tal, se ocupa de descubrir y entender la naturaleza y las leyes que gobiernan el lenguaje. LC Elabora modelos formales (implementables informáticamente) del lenguaje humano.

7 F UNDAMENTOS DE LA LC Lingüística aplicada Rama de la lingüística que se ocupa de los problemas que el lenguaje plantea como medio de relación social y de la cual derivan tres ramas o campos de acción: enseñanza de lengua materna, enseñanza de segunda lengua y enseñanza de lenguas asistida por computador. LC Aplica los modelos y métodos de investigación lingüísticos en campos como la enseñanza de idiomas, la traducción, etc.

8 F UNDAMENTOS DE LA LC LC Elabora programas informáticos (software) para el mercado como los traductores, procesadores de texto, etc. Industrias de la lengua Entendida como una actividad de índole fundamentalmente comercial, requiere el desarrollo de la ingeniería lingüística para disponer de las herramientas y técnicas a partir de las que se crean productos que realizan diversas funciones relacionadas con la utilización del lenguaje.

9 O BJETIVOS DE LA LC Comprobar los modelos lingüísticos y las teorías, diseñando algoritmos y sistemas que puedan ser evaluados y comprendidos en trabajos de procesamiento de lenguaje natural (PLN). Diferencia entre LC y PLN LC: usa las máquinas computacionales para investigar o tratar los fenómenos lingüísticos. PLN: aplicaciones concretas para el procesamiento de textos.

10 V ERTIENTES DE LA LC Dado que la LC abarca muchos objetivos es necesario diferenciar tres vertientes que delimitan su campo de acción: 1. Informática aplicada a la investigación 2. Implementación de teorías lingüísticas 3. Aplicaciones lingüísticas de la informática

11 I NFORMÁTICA APLICADA A LA INVESTIGACIÓN Su objetivo es emprender el estudio científico del lenguaje por medio ordenadores. Suele recibir el nombre de Lingüística informática o de Informática aplicada a la lingüística. Ejemplo: conocer el uso del sufijo –able en inglés moderno temprano por medio de un corpus escrito.

12 I MPLEMENTACIÓN DE TEORÍAS LINGÜÍSTICAS Su objetivo es elaborar formalismos lingüísticos que son lenguajes artificiales diseñados específicamente para representar conocimientos lingüísticos y que pueden ser entendidos por los ordenadores. Suele recibir el nombre de Lingüística computacional en sentido estricto.  Ejemplo: Wordnet, corpus lingüístico para el inglés

13 A PLICACIONES LINGÜÍSTICAS DE LA INFORMÁTICA Diseña sistemas informáticos encaminados a la comprensión y generación del lenguaje natural. Esta vertiente recibe el nombre de Procesamiento del lenguaje natural, Tecnologías de la lengua o Ingeniería lingüística.  Ejemplo: tecnologías del habla, traducción automática, sistemas de extracción de información, etc.

14 P ROGRAMAS PRINCIPALES DESARROLLADOS POR LA LINGÜÍSTICA COMPUTACIONAL Modelos de teorías lingüísticas Enseñanza de lenguas extranjeras Corrección de ortografía y sintaxis de textos Reconocimiento de voz humana Procesamiento de información Sistemas expertos Traducción automática

15 Á REAS DE LA LC Análisis automático de la fonética, la fonología, la morfología, la sintaxis y la pragmática. A partir de las siguientes tareas Etiquetamiento morfológico o tagging Análisis sintáctico o parsing Técnicas de reconocimiento automático de voz Recuperación inteligente de información Sistemas de diálogo y sistemas expertos Traducción automática

16 A NÁLISIS MORFOLÓFICO Tagging (Etiquetador) Análisis automático de las palabras que componen una frase.

17 A NÁLISIS SINTÁCTICO Parsing (Parse: analizar sintácticamente) Análisis automático de una oración. Fase inicial para la interpretación semántica

18 A NALIZADORES MORFOSINTÁCTICOS Ejemplos para el español http://www.gedlc.ulpgc.es/investigacion/desambigua/ morfosintactico.htm http://www.gedlc.ulpgc.es/investigacion/desambigua/ morfosintactico.htm http://www.mystilus.com/MorphosyntacticAnalyzer Analizador para el inglés: http://www2.lingsoft.fi/cgi-bin/engcg/ http://www2.lingsoft.fi/cgi-bin/engcg/

19 R ECUPERACIÓN INTELIGENTE DE INFORMACIÓN Information Retrieval Almacenamiento y envío digital de datos Técnicas de extracción de datos contenidos en textos y su transmisión a los usuarios Ejemplos: Bases de datos Buscadores de internet

20 S ISTEMAS DE DIÁLOGO Y SISTEMAS EXPERTOS Comunicación entre uno o más usuarios y la computadores Sistemas pregunta-respuesta Ejemplo: Asistente en la instalación de un programa, compras por internet Sistemas expertos Representación de conocimiento Generación automática de textos Software de manipulación de datos: Esto requiere un CORPUS amplio sobre los dominios Ejemplos: Diagnósticos automatizados de enfermedades

21 T RADUCCIÓN AUTOMÁTICA Representación intermedia de dos o más códigos linguísticos INTERLINGUA Ejemplos: http://www.reverso.net/text_translation.aspx?lang=E S http://www.reverso.net/text_translation.aspx?lang=E S http://translate.google.es/

22 LC COMO ÁREA DE CONOCIMIENTO Un programa de formación en lingüística computacional debe contener las siguientes áreas de conocimiento: Lingüística Matemática Informática En cuanto a los conocimientos teóricos Teorías estructuralistas Teorías generativistas clásicas Gramática de casos de Fillmore Gramática funcional Lingüística algorítmica

23 PROBLEMAS ACTUALES EN LA LC La LC trabaja en distintos niveles del lenguaje: Fonética/Fonología Morfología Sintaxis Semántica Pragmática

24 PROBLEMAS ACTUALES EN LA LC FONÉTICA Y FONOLOGÍA Sistemas de análisis y síntesis del habla Reconocimiento de voz Generación de voz Estos desarrollos se dirigen hacia el interés de diseñar programas para el dictado y reconocimiento automático. No presentan aún desarrollos significativos puesto que no se logra modelar flexiones y variaciones en entonaciones particulares en las lenguas

25 PROBLEMAS ACTUALES EN LA LC MORFOLOGÍA Análisis y síntesis automático morfológico (sufijos, prefijos, raíces y flexiones) Hace falta la construcción de diccionarios robustos Aunque ha habido grandes desarrollos, se requiere una estandarización efectiva del lenguaje para la marcación

26 PROBLEMAS ACTUALES EN LA LC SINTAXIS Análisis y sintáctico (parser) Es especialmente difícil automatizar en español donde no hay un orden fijo de las palabras que componen una oración Ejemplo: ¿Estuviste en el parque el sábado? ¿El sábado estuviste en la parque? ¿Tu estabas en el parque el sábado?

27 PROBLEMAS ACTUALES EN LA LC SEMÁNTICA Construcción de redes semánticas donde se presenten conceptos y relaciones entre ellos Problemas: Polisemia Ejemplo: Gato (animal felino) Gato (instrumento) Encontrar sentidos y hacer separaciones entre ellos Lexicografía: construcción de diccionarios generales y especializados Representación de conocimientos en general Elaboración de terminologías especializadas Ontologías

28 PROBLEMAS ACTUALES EN LA LC PRAGMÁTICA Relaciones entre oración y el mundo externo. Como ya se tienen muchos problemas en la semántica, es difícil continuar el análisis en el nivel siguiente.

29 REFERENCIAS Domínguez Burgos, Andrés. Lingüística computacional: un esbozo. Boletín de lingüística, No. 18. pp. 104-119 Mercado, Heiner (2008). Fundamentos de la LC [presentación de clase] Sidorov, Grigory (2001). Problemas actuales de lingüística computacional. Revista digital universitaria, Vol. 2, No. 1


Descargar ppt "C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño."

Presentaciones similares


Anuncios Google