Traducción automática castellano-catalán: interNOSTRUM Mikel L. Forcada Departament de Llenguatges i Sistemes Informàtics Universitat de Alacant E-03071.

Slides:



Advertisements
Presentaciones similares
1 Curso Básico de C.I.O. Light Sección 12 Internet Sección 12 - Internet.
Advertisements

La traducción: Lo primero que se ha de tener en cuenta a la hora de traducir una frase o un texto del latín al castellano es que en latín no existe el.
INVESTIGACION INFORMATICA AVANZADA
Webquest Diseño IU: Wix.com permite un control total del diseño de la web, pudiendo elegir en cualquier momento que punto modificar o que.
TEMA: SMTP – POP3 - IMAP.
Qué es Internet Internet es una red integrada por miles de redes y computadoras interconectadas en todo el mundo mediante cables y señales de telecomunicaciones,
Noticias en linea - rss Rss es una forma muy sencilla para que puedas recibir, directamente en tu ordenador o en una página web online a través de.
CATEGORIA LENGUA CASTELLANA EXCELENTESOBRESALIENTEACEPTABLEINSUFICIENTE SEMÁNTICA Consulta siempre el diccionario utilizando el significado de las palabras.
Blog práctico sobre el español, útil para resolver dudas típicas, para estudiantes de español o cualquiera que se interese por el idioma. Con ejemplos.
Marta Cecilia Palacio Z. Medellín, Es un sistema de información que nació en 1982 y creció en Es una gran red mundial de ordenadores. Interconectados.
Pueden ser públicos, lo que supone que cualquiera puede leer y modificar el texto de las páginas pero no puede realizar determinadas tareas como subir.
República Bolivariana de Venezuela Ministerio del Poder Popular para la Defensa Universidad Nacional Experimental Politécnica de la Fuerza Armada Nacional.
Memorias de traducción… To be or not to be Trad. Públ. Gabriela González II JORNADAS DEL TRADUCTORADO DE INGLÉS MDPCC-UCAECE 10 y.
D E F I N I C I O N E S.
PROTOCOLOS Un protocolo es un conjunto de reglas que hacen que la comunicación en una red sea más eficiente.
Cualquier sitio web puede ser utilizado en un momento determinado como medio para llevar a cabo ciertos aprendizajes, por ejemplo se pueden aprender cosas.
Lo que Internet nos ofrece La Sociedad de la Comunicación: Lo que Internet nos ofrece.
Webquest Diseño IU: Wix.com permite un control total del diseño de la web, pudiendo elegir en cualquier momento que punto modificar o que.
LOS NUEVOS PORTALES ICEX Mayo ICEX en Internet (1ª etapa) Comienzo y primeros servicios: 1995: Páginas informativas de los "Servicios al Exportador"
QUE ES INTERNET Podríamos decir que Internet está formado por una gran cantidad de ordenadores que pueden intercambiar información entre ellos. Es una.
1. Introducción El objetivo final del proyecto piloto es probar el uso de la tecnología XBRL para el intercambio de información financiera entre el Banco.
TRADUCTOR DE UN PROGRAMA
NEWS ¿Qué son los News? Son grupos de noticias distribuido en Internet que están formado por un conjunto de foros de debate clasificados por temas. Los.
Pàgina 1 Comunicación CG a un dep de la GC 7/5/2009 Comunicación de las Cuentas generales recibidas de corporaciones locales (CGCL) al Departamento de.
Lo bucadores son sistemas que permite al usuario buscar información,estos la consiguen de la web, pero otroa tanto la obtienen del news,gopher,ftp,etc.
¿Qué son? ¿Cómo se realizan? Configuración de la acción.
HERNANDEZ RAMIREZ CAROLINA CONALEP IXTAPALUCA 236.
Redes II M. C. Nancy Aguas García. Redes Planeación Análisis y Diseño Instalación Evaluación Administración de software Mantenimiento de hardware.
Proyecto HAL La máquina de conversar Pablo Iacub, Leopoldo Carranza y Dan Rozenfarb.
1.4 Traductor y Su estructura
La web La world, wide, web y www, es una red mundial. Es un sistema de información basado en hipertexto o intermedios enlazados y accesibles al internet,
WIKI Un wiki, o una wiki, es un sitio web cuyas páginas web pueden ser editadas por múltiples voluntarios a través del navegador web. Los usuarios pueden.
TRABAJO POR Brayan Alexander Rodríguez Ramírez j.t.
Conceptos básicos sobre Internet
1. Fundamentación  Quiénes y para qué: conocimiento del grupo meta.  Qué: concepto de lengua  Cómo: proceso de aprendizaje de las lenguas,  Dónde:
¿Qué es Internet? Internet puede ser definida como una red mundial de comunicaciones basada en computadores que comparten sus recursos e información a.
EDWIN ACOSTA PINILLA DIEGO FERNANDO CASTRO JHON SEBASTIAN CASTRO.
Herramientas de Diseño I N T E R N E T Historia Internet nació de manos de ARPAnet en tiempos de la guerra fría. Esta empresa, estaba afiliada al ejército.
Ventajas y desventajas del Software libre
Que es Internet CARACTERÍSTICAS
Nombre: Josselyn Peña Curso: 1° “D”. Este manual de introducción a Wordpress ha sido elaborado con la intención de ofrecer la información necesaria para.
DIEGO MADARRIAGA BRIEVA DARIO DIAZ PEÑALOZA ANDERSON ACEVEDO RIOS.
1 Temas a tratar Metiendo datos. (2) Como reservar un documento que no queremos que aparezca en informes. (3) Metiendo datos de forma eficaz.(4-5) Búsquedas:
 Este protocolo opera a través de solicitudes y respuestas, entre un "cliente" y un "servidor". El cliente para los usuarios es el navegador web, usado.
INTERNET Y WEB. ORÍGENES DE INTERNET Internet se remonta al temprano desarrollo de las redes de comunicación. La idea de una red de ordenadores diseñada.
WORD WIDE WEB Nace a principios de los años 90 en Suiza. Su función es ordenar y distribuir la información que existe en internet. La World Wide Web se.
Las Páginas WIKI. ¿Que son? Es un sitio web colaborativo que puede ser editado por varios usuarios. Los usuarios de una wiki pueden así crear, editar,
LINGÜÍSTICA UNIDAD 2. Unidad 2: “PROCESAMIENTO DE ORACIONES” INTENCIONALIDADES FORMATIVAS FASE RECONOCIMIENTO COMPETENCIAS COGNITIVACOMUNICATIVAVALORATIVACONTEXTUAL.
Definiciones y Conceptos
NOMBRES: Daniel Andrés Martínez Pérez Jhon Alejandro Carrizosa Ovalle Jaiver Giovanny Sánchez García CURSO: JORNADA: Tarde.
DEBORA ARANGO PEREZ NOMBRE JORGE CAMILO CORTES CURSO 1003 AÑO 2012.
III. DESARROLLO DE SISTEMAS.. Podemos definir el desarrollo de sistemas informáticos como el proceso mediante el cual el conocimiento humano y el uso.
TALLER DISEÑO WEB José Joo Villablanca DG & otras yerbas Instituto Profesional Santo Tomás / Diseño Publicitario Multimedial.
Punto 1 – Introducción al servicio Juan Luis Cano.
Las máquinas Buscadoras (Buscadores) Las máquinas buscadoras (Search Engines) son computadoras (llamados servidores) dedicados a almacenar información.
Laberinto del Conocimiento Hotmail Básico. InstruccionesInstrucciones Analiza la pregunta, en base a tus conocimientos elige la puerta que consideres.
Integrante: Mariana Alcalá Hdz María del Carmen Andrade G. Alondra E. García Mtz Joselyn Gpe García V. Antonio de Jesús Hdz R. Cristian Jesús Ruvalcaba.
Modelo Cliente - Servidor. La Web funciona siguiendo el denominado modelo cliente-servidor, habitual en las aplicaciones que funcionan en una red. Existe.
Tema: Normas de netiquetas
Débora Arango Pérez. Un sitio web es una colección de páginas web relacionadas y comunes a un dominio de Internet o subdominio en la World Wide Web en.
INTERNET SERVICIOS Y APLICACIONES
Actividad TIC nº 11 / L. Castellana 3º ESO Buscar la definición de términos informáticos Buscar su origen  su etimología Realizar su traducción al gallego,
HERRAMIENTAS WEB 2.0 CONTENIDO QUE ES LA WEB 2.0 WEB 2.0 Y EDUCACION TIPOS DE HERRAMIENTAS WEB 2.0 HERRAMIENTAS Y EJEMPLOS DE APLICASION DONDE BUSCAR.
TECNICATURA ANALISTA PROGRAMADOR
Iván camilo González Luis David cano
Tema 5. Profundizamos en el uso correcto de nuestro idioma.
Planificación Curso UNIDAD 1. INTRODUCCIÓN A LOS SERVICIOS EN RED UNIDAD 2. SERVICIOS DHCP UNIDAD 3. SERVICIOS DNS UNIDAD 4. SERVICIOS DE ACCESO REMOTO.
Iniciar sesión en Outlook Como muestra la imagen dispones de varias opciones según sean tus necesidades, solo hay que seleccionar la opción correcta.
1 MÁS QUE PALABRAS. 2 Más que palabras ¿Qué han de aprender a manipular mentalmente los niños para ser competentes gramaticalmente hablando?
Hola! Buen dÍa… PROF. ROBERTO ELORZA Y COMPAÑEROS.
Transcripción de la presentación:

Traducción automática castellano-catalán: interNOSTRUM Mikel L. Forcada Departament de Llenguatges i Sistemes Informàtics Universitat de Alacant E Alacant [Expolingua, 25 de marzo de 2004]

Índice Traducción automática (TA) TA castellano-catalán y catalán castellano: aplicaciones, problemas El sistema interNOSTRUM

¿Qué se entiende por traducción automática? /1 traducción de textos informatizados Mediante un programa de ordenador (programa + ordenador = sistema) de una lengua origen (LO) a una lengua meta (LM) Manteniendo el formato del documento tanto como sea posible

¿Qué se entiende por traducción automática? /2 Esquema: Sistema de traducción automática Sistema de traducción automática Texto origen Texto origen Texto meta (en bruto) Texto meta (en bruto)

Aplicaciones de la traducción automática Dos grupos de aplicaciones básicas: Asimilación: uso de la traducción en bruto para comprender textos escritos en otra lengua (chat, navegación traducida, etc.). Diseminación: la traducción en bruto se corrige (postedita) antes de publicarla.

Problemas de la traducción automática/1 Dos dificultades básicas: Traducir supone comprender hasta cierto punto el significado (los significados) del texto origen. Los textos, las frases, las palabras suelen ser ambiguos (tienen más de un significado, con traducciones frecuentemente diferentes)

Problemas de la traducción automática/2 La realidad: Sólo se puede programar de manera eficiente un análisis muy superficial de los textos. Es muy difícil (a veces imposible) elegir el significado (superficial) correcto de un enunciado (texto, frase, palabra, etc.)

Problemas de la traducción automática/3 La ambigüedad puede ser léxica (de las palabras): Nadie conocía el destino del avión secuestrado [destino = final de un trayecto] Ningú no coneixia la destinació de l'avió segrestat [destino = suerte futura] Ningú no coneixia el destí de l'avió segrestat

Problemas de la traducción automática/4 Algunas palabras ambiguas son muy frecuentes: como: com / com a/ menjo una: una / uneixi para: per a / per / para (=atura) [estas tres palabras aparecen cada una entre 4 y 7 veces por cada mil palabras]

Problemas de la traducción automática/5 También puede ser sintáctica: Se comió el postre enfadado Se comió [el postre] [enfadado]: Es va menjar les postres enfadat Se comió [el postre enfadado]: Es va menjar les postres enfadades

Traducción automática castellano catalán: aplicaciones Aplicaciones típicas (no las únicas): castellano-catalán: diseminación (borradores, normalización lingüística) catalán-castellano: asimilación (no catalanoparlantes, Internet)

¿Qué es interNOSTRUM? [1] Sistema de TA bidireccional castellano-catalán. Impulsado por la Caja de Ahorros del Mediterráneo y cofinanciado por la Universitat d'Alacant Traduce ANSI (texto pelado), RTF (de Word), HTML (webs), correo electrónico, etc. Velocidad (miles de palabras por segundo en un ordenador de sobremesa normal) permite navegación traducida

¿Qué es interNOSTRUM? [2] Disponible públicamente en Internet ( I a través de otros portales ( Miles de visitas semanales, en alza Se usa para producir borradores de traducciones al catalán......o para leer en castellano aproximado pàgines de Internet en catalán.

¿Qué es interNOSTRUM? [3] Versión actual genera catalán central Versiones valenciana y balear en progreso Versión catalán-castellano algo menos desarrollada (pero entiende bastante valenciano y balear). Tasas de error mejores que el 10% Preserva bien el formato de los documentos

¿Qué es interNOSTRUM [4] La configuración como servidor permite ofrecer durante el desarrollo la mejor versión a los usuarios.

Esquema de interNOSTRUM Analizador morfológico Desformateador Desambiguador léxico Transf. estructural Generador morfológico Postgenerador Reformateador Transferencia léxica Transferencia léxica Texto meta Texto meta Texto origen Texto origen

Extensibilidad InterNOSTRUM es relativamente fácil de extender (o de aplicar a otras lenguas): El programa se genera a partir de ficheros de datos lingüísticos en un formato adecuado. Las personas usuarias pueden sugerir adiciones i mejoras a través de menús. [Por ejemplo, estamos construyendo un sistema castellano-portugués].

Integrabilidad InterNOSTRUM está programado de manera que se puede integrar fácilmente dentro de otros productos informáticos (especialmente los relacionados con Internet).

Seguimos desarrollando... Los vocabularios de interNOSTRUM necesitan aún crecer mucho (aportaciones) Se deben programar más regles sintácticas. La desambiguación léxica es aún bastante mejorable. etc.

Moltes gràcies! Mikel L. Forcada interNOSTRUM.com [DEMO]