Herramientas terminológicas

Slides:



Advertisements
Presentaciones similares
Base de Datos de Terceros
Advertisements

Lognoter. gestión de datos en Ingeniería. ¿Qué es? Programa de almacenamiento, tratamiento de datos y generación de informes Programa con interface propia,
Word.
Actividades y tareas para la enseñanza y aprendizaje en los cursos CAL Instrucciones de 21 de mayo de 2008, de las Direcciones Generales de Planificación.
Lunes 18 de Febrero 2008 Material para la clase: Elprofe3.wordpress.com.
TERMINOLOGÍA EN ESPAÑOL
7. LA TRADUCCIÓN Y LA TERMINOLOGÍA
TERMINOLOGÍA EN ESPAÑOL
5. LA TERMINOGRAFÍA: FUNDAMENTOS, MATERIALES Y METODOLOGÍA
María Simarro Vázquez 4. LA DOCUMENTACIÓN ESPECIALIZADA.
Una vez completada esta lección, podrá:
TEMA 1: Fundamentos Temario: Introducción a la informática
Solución para Control de Presencia Empleados
Facultad de Ingeniería y Arquitectura Introducción a la Computación 2006 – II (4ta Semana) Lunes 28 de Agosto del 2006 Juan José Montero Román.
TECNICOR BARRANQUILLLA,26 SEPTIEMBRE DE Una base de datos es una colección de información organizada de forma que un programa de ordenador pueda.
Tecnologías Cliente / Servidor Capitulo III Richard Jiménez V. clienteserver.wordpress.com.
LOS SISTEMAS DE AUTOMATIZACIÓN DE OFICINAS
Conjunto de información almacenado en memoria auxiliar Permiten acceso directo a programas que las manipulan Es un sistema de archivos electrónicos.
ACCIONES CORRECTIVAS Y ACCIONES PREVENTIVAS
Tema II Unidad de memoria. 2 Unidad de memoria 2.1 Definiciones y conceptos básicos Localización Capacidad Unidad de transferencia
Uso de Datateca Tareas Glosario Portafolio Wiki
Teoría de lenguajes y compiladores
Gabriela A. González (R) Ley de Propiedad Intelectual.
Johanna Lizeth Rodríguez Lorena Fda. Chávarro Ramos
ANAIS BUITRAGO AIDA BEATRIZ GONZALEZ ANDREA OROZCO
Estrategias de Búsqueda
Modificado de: M.A. Ana Celia Gutiérrez Olivas
El análisis y recuperación de información
Lo bucadores son sistemas que permite al usuario buscar información,estos la consiguen de la web, pero otroa tanto la obtienen del news,gopher,ftp,etc.
Tutorial EDS: Servicio de Búsqueda Para Usuarios Corporativos support.ebsco.com.
EBSCO Discovery Service
BASES DE DATOS INTRODUCCION
Sistemas de Información IS95872
SpringerLink The new SpringerLink interface has been designed based on the results of one of the largest usability studies. Features have been added and.
Recursos generales del traductor Bianca Vitalaru Universidad de Alcalá
(Organización y Manejo de Archivos)
ADQUISICIONES Y ABASTECIMIENTOS
Portafolio Electrónico
O Funcionamiento, ventajas y alcance o ESTUDIANTE: EDWIN ARAY VÉLEZ o PROFESOR: ING. JOSÉ MEDINA o FUNDAMENTOS TECNOLÓGICOS DE INFORMACIÓN.
Derechos reservados ¿QUÉ ES UNA CAZA DEL TESORO? Una caza del tesoro es un tipo de actividad constructivista, muy sencilla, utilizada por los docentes.
5. Sistemas de archivos avanzados1 Tema 5: Sistemas de Archivos Avanzados Resumen: –Sistema de archivos distribuido –File Replication Service.
Página 1 20/03/2005 Materia: Tecnología de la Información Curso: Profesora Ariana Rosenthal Tecnología de la Información Profesora Ariana Rosenthal Administración.
Publicación de bases de datos Access en la web
WIKI Un wiki, o una wiki, es un sitio web cuyas páginas web pueden ser editadas por múltiples voluntarios a través del navegador web. Los usuarios pueden.
Joel Pérez López.  "Un Objeto de Aprendizaje es un conjunto de recursos digitales, autocontenible y reutilizable, con un propósito educativo y constituido.
5.- Aplicaciones software Procesador de textos Hoja de cálculo Bases de datos Programas de estadística Informática Aplicada al Trabajo Social. Universidad.
CATÁLOGO AUTOMATIZADO
GOOGLE Consejos para buscar en internet (Anexo: Módulo 2)
Tecnologías para el Aprendizaje
1 Clase 3 Registro de resultados Tecnología de la Comunicación I.
Zavaleta Nolasco Karina Rechy Villareal Sandra Grupo:309 Equipo: 04 Profesora: Gabriela Pichardo.
CONCEPTO VENTAJAS CARACTERISTICAS
EQUIPO:#3 GRUPO:304 NOMBRES: Lizbeth Nava Barón y Erick Ali Mejía.
Colegio de bachilleres plantel n°14
CSA Illumina, proporciona acceso a bases de datos bibliográficas, con resúmenes e índices relacionados con literatura de investigación científica.
Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.
LOS WIKIS Características y ejemplos
(MOODLE) La palabra Moodle es el acrónimo de Modular Object Oriented Dynamic Learning Environment Entorno de Aprendizaje Dinámico Orientado a Objetos.
Karla Yunuen González Villanueva
Universidad de Carabobo Facultad Ciencias de la Educación Escuela de Educación Departamento de Matemática Trabajo Colaborativo Wikipedia Integrantes:
Yasmine KASSA - Master 1 - Langue des Métiers Espagnol 1 PRESENTACIÓN DE LAS PROFESIONES DEL SECTOR DE LA TRADUCCIÓN.
Modelos del Proceso Omar de Jesús Rosales Hernández.
El Sistema Integral de Gestión y Evaluación (SIGEVA) es una aplicación desarrollada por el Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET)
PRÁCTICA TRADOS Gestión de Proyectos. Objetivo Esta práctica tiene como objetivo: – Crear un proyecto. – Aprender a gestionar un paquete de proyecto.
BASES DE DATOS CONCEPTOS BASICOS Elizabeth Maite Zarate Machaca “El tratamiento eficiente de la información al servicio del usuario”
QUÉ ES UNA BASE DE DATOS? Es un Conjunto de Información, que está clasificada de distintas maneras; pero que comparten entre sí algún tipo de vínculo,
Tutorial EBSCO Discovery Service Para Usuarios Corporativos support.ebsco.com.
1.ª Parte: Dónde y cómo buscar información.  Cuando se busca información sobre un tema, es necesario emplear una «estrategia de búsqueda» para optimizar.
Tutorial EBSCO Discovery Service (EDS) support.ebsco.com.
Búsqueda en la Web. Razones para introducir las TIC (OECD 2001) Las TIC son una competencia básica, tal como la lectura, escritura y matemática. Las TIC.
Transcripción de la presentación:

Herramientas terminológicas Esther Donat Más E_donat@yahoo.com 28 de junio, 2006 Curso de Introducción a la Traducción automática

Herramientas terminológicas Herramientas terminológicas: recopilar, describir y representación de términos Términos: ítmes léxicos que pertenecen a campos de temas especializados El problema en traducción está en encontrar equivalentes para términos especializados (específicos de un campo) y las preferencias del cliente en la empresa. ¿Para qué sirven/Cómo ayudan las herramientas terminológicas? Almacenamiento Recuperación Consistencia Pueden ayudar a reducir costes

Herramientas terminológicas Historia de las herramientas informáticas en terminología Información en registros terminológicos Características de herramientas de gestión terminológica hoy en día Beneficios de herramientas de gestión terminológica en la actualidad Herramientas de extracción de términos (otra herramienta de CAT)

Herramientas terminológicas HISTORIA 1960s bancos terminológicos: colecciones a gran escala de registros terminológicos electrónicos Registros terminológicos: información de entradas sobre términos y conceptos que representan ¿Quién los usaba? Corporaciones e instituciones para TRs internas Hoy también freelance y agencias de TR (gratis en www o subscripción en CDROM) Eurodicautom, Termium, Normaterm, Grand dicitonnaire terminologic Multilingües, producían un registro detallado, actualizadas (no exhaustivas) Instituciones  investigación terminológica + controlador de la calidad del banco terminológico

Herramientas terminológicas ¿Qué info va en los registros terminológicos? Lingüística & extralingüística (campo, equivalentes, info gramatical, sinónimos, definiciones, contexto, notas de uso) Depende de la disponibilidad de los datos y los requisitos del proyecto Banco terminológico: registro detallado completo Base de datos terminológica: uso personal  útil a las necesidades del traductor (Ex: industria de la localization) Ayuda: tecnología

Herramientas terminológicas HERRAMIENTA DE GESTIÓN TERMINOLÓGICA: programa informático que permite crear una base de datos terminológica personal CARACTERÍSTICAS: Almacenamiento: en una forma basada en conceptos para trabajar en múltiples direcciones lingüísticas Flexibilidad: en el tipo y cantidad de información antes: serie fija de campos predefinidos después: estructura de entradas libres (software se adapta a las necesidades) Recuperación: búsqueda wildcard (búsqueda de elección exacta, fichas aleatorias para truncados *) fuzzy matching (similar al patrón solicitado, variantes morfológicas y ortográficas, términos multipalabra) hit list (más de un registro recuperado para seleccionar)

Herramientas terminológicas Otras características: Búsqueda terminológica automática Procesador de textos y memoria de traducción Diccionario compara los términos léxicos del TO con los contenidos de la base de datos terminológica (copiar & pegar) Pre-traducción Similar a la TA con post-edición Gestión de sistema de conceptos/thesauro Fusionar múltiples bases de datos Importar desde y exportar a otros formatos Imprimir en formatos de glosarios

Herramientas terminológicas VENTAJAS de trabajar con un SGT(TMS) Calidad (consistencia) – términos en TO se comprueban automáticamente con la base de datos terminológica Velocidad y Flexibilidad (almacenamiento y recuperación) – más fácil de actualizar la info electrónica & más rápido buscar en los archivos electrónicos Permite que se peguen los términos directamente en el TM tener que volver a escribirlos aunque requiere postedición (Forma canónica) versus elegir registrar la forma más común de un término o varias a insertar haciendo simplemente click en ella Compartir información Varios traductores acceden y contribuyen a una única base de datos terminológica (privilegios!!!) Intercambiar datos con clientes u otros traductores (formatos de archivo!!!) (MARTIF – ISO 12200;TBX by OSCAR, LISA)

Herramientas terminológicas HERRAMIENTA DE EXTRACCIÓN DE TÉRMINOS (identificación/reconocimiento) ¿Qué hacen? Construye una base de datos buscando en corpus electrónicos y extrae listas de términos potenciales ¿Cómo son? Monolingües (un texto – términos candidatos) Bilingües (TO con TR – términos potenciales equivalentes) ¿Cómo funcionan? Términos los verifica un terminólogo/traductor (asistida por ordenador) Enfoques Lingüístico Estadísitico

Herramientas terminológicas ENFOQUE LINGÜÍSTICO Identifica combinaciones de palabras que coinciden con patrones de partes del discurso particulares (Cada palabra en el corpus debe ser asociada primero con su parte del discurso apropiada: Tagger) Problemas/desventajas Ruido – no todas las combinaciones califican como términos Silencio – algunos términos legítimos no están preprogramados en la herramienta Altamente dependientes de la lengua. Patrones de formación de términos difieren de una lengua a otra  no se puede extender a otras lenguas

Herramientas terminológicas ENFOQUE ESTADÍSTICO Busca secuencias repetidas de ítems léxicos: umbral de frecuencia (Número de veces que una secuencia de palabras debe repetirse) Problemas/Desventajas Ruido – Stop list: reduce los términos improbables. Lista de ítems que se le puede enseñar al ordenador que ignore. EXCEPCIONES Silencio Ventajas Identifica patrones repetidos, no depende de la lengua. Puede procesar textos en múltiples lenguas