La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Traducción automática castellano-catalán: interNOSTRUM Mikel L. Forcada Departament de Llenguatges i Sistemes Informàtics Universitat de Alacant E-03071.

Presentaciones similares


Presentación del tema: "Traducción automática castellano-catalán: interNOSTRUM Mikel L. Forcada Departament de Llenguatges i Sistemes Informàtics Universitat de Alacant E-03071."— Transcripción de la presentación:

1 Traducción automática castellano-catalán: interNOSTRUM Mikel L. Forcada Departament de Llenguatges i Sistemes Informàtics Universitat de Alacant E-03071 Alacant [Expolingua, 25 de marzo de 2004]

2 Índice Traducción automática (TA) TA castellano-catalán y catalán castellano: aplicaciones, problemas El sistema interNOSTRUM

3 ¿Qué se entiende por traducción automática? /1 traducción de textos informatizados Mediante un programa de ordenador (programa + ordenador = sistema) de una lengua origen (LO) a una lengua meta (LM) Manteniendo el formato del documento tanto como sea posible

4 ¿Qué se entiende por traducción automática? /2 Esquema: Sistema de traducción automática Sistema de traducción automática Texto origen Texto origen Texto meta (en bruto) Texto meta (en bruto)

5 Aplicaciones de la traducción automática Dos grupos de aplicaciones básicas: Asimilación: uso de la traducción en bruto para comprender textos escritos en otra lengua (chat, navegación traducida, etc.). Diseminación: la traducción en bruto se corrige (postedita) antes de publicarla.

6 Problemas de la traducción automática/1 Dos dificultades básicas: Traducir supone comprender hasta cierto punto el significado (los significados) del texto origen. Los textos, las frases, las palabras suelen ser ambiguos (tienen más de un significado, con traducciones frecuentemente diferentes)

7 Problemas de la traducción automática/2 La realidad: Sólo se puede programar de manera eficiente un análisis muy superficial de los textos. Es muy difícil (a veces imposible) elegir el significado (superficial) correcto de un enunciado (texto, frase, palabra, etc.)

8 Problemas de la traducción automática/3 La ambigüedad puede ser léxica (de las palabras): Nadie conocía el destino del avión secuestrado [destino = final de un trayecto] Ningú no coneixia la destinació de l'avió segrestat [destino = suerte futura] Ningú no coneixia el destí de l'avió segrestat

9 Problemas de la traducción automática/4 Algunas palabras ambiguas son muy frecuentes: como: com / com a/ menjo una: una / uneixi para: per a / per / para (=atura) [estas tres palabras aparecen cada una entre 4 y 7 veces por cada mil palabras]

10 Problemas de la traducción automática/5 También puede ser sintáctica: Se comió el postre enfadado Se comió [el postre] [enfadado]: Es va menjar les postres enfadat Se comió [el postre enfadado]: Es va menjar les postres enfadades

11 Traducción automática castellano catalán: aplicaciones Aplicaciones típicas (no las únicas): castellano-catalán: diseminación (borradores, normalización lingüística) catalán-castellano: asimilación (no catalanoparlantes, Internet)

12 ¿Qué es interNOSTRUM? [1] Sistema de TA bidireccional castellano-catalán. Impulsado por la Caja de Ahorros del Mediterráneo y cofinanciado por la Universitat d'Alacant Traduce ANSI (texto pelado), RTF (de Word), HTML (webs), correo electrónico, etc. Velocidad (miles de palabras por segundo en un ordenador de sobremesa normal) permite navegación traducida

13 ¿Qué es interNOSTRUM? [2] Disponible públicamente en Internet (www.interNOSTRUM.com) I a través de otros portales (www.SoftCatala.org) Miles de visitas semanales, en alza Se usa para producir borradores de traducciones al catalán......o para leer en castellano aproximado pàgines de Internet en catalán.

14 ¿Qué es interNOSTRUM? [3] Versión actual genera catalán central Versiones valenciana y balear en progreso Versión catalán-castellano algo menos desarrollada (pero entiende bastante valenciano y balear). Tasas de error mejores que el 10% Preserva bien el formato de los documentos

15 ¿Qué es interNOSTRUM [4] La configuración como servidor permite ofrecer durante el desarrollo la mejor versión a los usuarios.

16 Esquema de interNOSTRUM Analizador morfológico Desformateador Desambiguador léxico Transf. estructural Generador morfológico Postgenerador Reformateador Transferencia léxica Transferencia léxica Texto meta Texto meta Texto origen Texto origen

17 Extensibilidad InterNOSTRUM es relativamente fácil de extender (o de aplicar a otras lenguas): El programa se genera a partir de ficheros de datos lingüísticos en un formato adecuado. Las personas usuarias pueden sugerir adiciones i mejoras a través de menús. [Por ejemplo, estamos construyendo un sistema castellano-portugués].

18 Integrabilidad InterNOSTRUM está programado de manera que se puede integrar fácilmente dentro de otros productos informáticos (especialmente los relacionados con Internet).

19 Seguimos desarrollando... Los vocabularios de interNOSTRUM necesitan aún crecer mucho (aportaciones) Se deben programar más regles sintácticas. La desambiguación léxica es aún bastante mejorable. etc.

20 Moltes gràcies! Mikel L. Forcada mlf@ua.es www.dlsi.ua.es/~mlf interNOSTRUM.com [DEMO]


Descargar ppt "Traducción automática castellano-catalán: interNOSTRUM Mikel L. Forcada Departament de Llenguatges i Sistemes Informàtics Universitat de Alacant E-03071."

Presentaciones similares


Anuncios Google