APLICACIONES DE LA LINGÜÍSTICA COMPUTACIONAL (III)

Slides:



Advertisements
Presentaciones similares
APLICACIONES DE LA LINGÜÍSTICA COMPUTACIONAL (I)
Advertisements

4/27/2015Lingüística Computacional1 LEXICONES Y CORPUS Carlos Mario Zapata J.
C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.
Las Destrezas Básicas De La Comunicación Oral y Escrita Rosi Moran Unidad 4 Semi 1001.
Las tres primeras fases de un compilador suelen agrupan en un sola fase llamada Análisis del programa a compilar y las tres ultimas en una sola fase llamada.
Claves para comentar un texto El comentario de texto.
Traducción dirigida por la Sintaxis Teoría de Autómatas y Lenguajes Formales Alma María Pisabarro, 2007.
DIAZ BOGADO, DIEGO /2016 FERNANDEZ, RODOLFO /2016 PAZ, FRANCISCO /2016 ZAPATA, FLORENCIA /2016 TALLER DE UTILITARIOS.
MÉTODOS Y ELEMENTOS DE PROGRAMACIÓN MÉTODOS Y ELEMENTOS DE PROGRAMACIÓN.
Introducción A SolidWorks (Curso SolidWorks Essentials).
Chomsky y la teoría de gramática universal
Herencia Multiple en Java
Traductor de Lógica Multivariada a Lógica de Primer Orden
Ciclo de vida del producto y decisiones de selección del proceso
CEIP ANTONIO VALDERRAMA (ESPIEL)
Sistema de Base de datos
U.T. 11: Introducción A Las Bases De Datos
7ª Jornada sobre la Biblioteca Digital Universitaria JBDU2009 "La  biblioteca universitaria en la web" 5 y 6 de noviembre de 2009 Biblioteca Central de.
Lenguajes y representación tecnica
Profesor: Juan Gabriel Bernal López Alumno: Adrián Cervantes Chávez
CONFABULÉMONOS CON LAS PALABRAS
Modelo OSI.
UNIVERSIDAD ICEP INTELIGENCIA ARTIFICIAL INGENIERÍA EN SISTEMAS COMPUTACIONALES Martes, 24 de Octubre de 2017 REPRESENTACIÓN DEL CONOCIMIENTO Y RAZONAMIENTO.
INTRODUCCIÒN AL SISTEMA GESTOR DE BASE DE DATOS
El Lenguaje Científico en la TAXONOMÍA
INTELIGENCIA ARTIFICIAL
INFORMATICA JURIDICA ACLARACION CONCEPTUAL Cristhian Campos García
Lenguaje y representación técnica
Concepto y características
Software Es intangible, existe como información, ideas, conceptos, símbolos, pero no ocupa un espacio físico, se podría decir que no tiene sustancia. Se.
LENGUAJES Y REPRESENTACION TECNICA
CONOCIMIENTOS PREVIOS
Proyecto Cortos: «Habla, te escucho»
TIPOS DE INVESTIGACIÓN I
Algoritmo Capitulo Cinco.
Atención psicoeducativa en las dificultades del lenguaje oral
Ingeniería del Software
CONCEPTOS PRELIMINARES (Cont)
EL SIGNO LINGÜÍSTICO.  ¿Qué es un signo? EL SIGNO LINGÜÍSTICO Es aquello que percibimos con nuestros sentidos y que nos transmite alguna información.
APLICACIÓN DE NUEVAS TECNOLOGÍAS EN LA CONSERVACIÓN Y ANÁLISIS DEL PATRIMONIO CULTURAL Herramientas para la Investigación.
Definición de semántica La semántica es la rama de la lingüística que estudia el significado de los signos lingüísticos Ramas de la semántica Semántica.
Diagrama de Flujo La presentación gráfica de sistemas es una forma ampliamente utilizada como herramienta de análisis, ya que permite identificar aspectos.
Programación Lógica.
Programación Orientada a Objetos. ¿Qué es un ordenador? “Un sistema digital con tecnología microelectrónica capaz de procesar información a partir de.
 La minería de datos o exploración de datos (es la etapa de análisis de "Knowledge Discovery in Databases" o KDD) es un campo de la estadística y las.
Texto instructivo o prescriptivo.
Funciones del Analizador Sintáctico
Fundamentos de la Programación I
Instituto Tecnológico de Minatitlán
Claves del Lenguaje Humano
FUNDAMENTOS DE PROGRAMACIÓN. INTRODUCCIÓN  Conceptos: Informática, Ordenador, Programa, Dato, Bit, Byte, Hardware, Software, Lenguaje de Programación,
“EL SUJETO DESDE LA PSICOLOGIA”
Unidad 5. Estructura de la palabra.
Modelo Instruccional Dick & Carey
Procesos productivos artesanales
Rueda de expertos de “La Casa de
Análisis lingüístico automático
No sólo tiene una “ silueta” específica sino que tiene una progresión similar de la información: introducción, desarrollo y conclusión.
Construcción de pruebas objetivas. ¿Qué son las pruebas objetivas? Las pruebas objetivas son instrumentos de medida; elaborados rigurosamente que permiten.
¡VAMOS A PENSAR! español IV COLECCIÓN 4 Vocabulario- TIEMPO LIBRE
Evaluación de los procesos lectores Prolec-R. Ficha técnica.  Nombre de la prueba: PROLEC-R. Evaluación de los procesos lectores revisada.  Autores:
MIDEPLAN. División de Planificación, Estudios e Inversión CICLO DE VIDA DE LOS PROYECTOS Curso de Preparación de Proyectos División de Planificación, Estudios.
La programación de objetivos didácticos en Terminótica
PROYECTO DE INVERSION Y EL CICLO DE PROYECTOS. CONCEPTOS DE PROYECTOS.
INTRODUCCIÓN A UML.  QUE ES UML?  PARA QUE SE UTILIZA  COMPONENTES  DIAGRAMAS.
TALLER DE ESTUDIO INDEPENDIENTE (ILCE) Estrategias de aprendizaje y estudio Independiente.
Estructura de los Sistemas Operativos
Capítulo 6 El significado.
Claves del Lenguaje Humano
Transcripción de la presentación:

APLICACIONES DE LA LINGÜÍSTICA COMPUTACIONAL (III) Carlos Mario Zapata J. 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA MT: Machine Translation. Surgida a finales de los 40’s Sistemas computarizados responsables por la producción de traducciones con o sin la asistencia de humanos (Hutchins, 2003). Se refieren a un lenguaje Fuente (LF) y un lenguaje destino (LD) Utiliza técnicas de PLN Se ha logrado traducciones de regular calidad. 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Los textos aún deben ser post-editados: Revisados y complementados por un humano. Sirven como pre-traducción. Se pretende sólo adquirir algún conocimiento del contenido del texto en LF. Se suelen usar dos mecanismos: Pre-edición: Indicación de sufijos, prefijos, divisiones de palabras, frases y sentencias, categorías gramaticales, etc. Control del texto en LF: Vocabulario, gramática y reducción de la ambigüedad. 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Componentes a diferentes niveles: Análisis: Morfológico: identificación de finales de palabras y palabras compuestas. Sintáctico: identificación de estructuras de frase, dependencia, subordinación, etc. Semántico: Resolución de ambigüedades estructurales y léxicas. 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Componentes a diferentes niveles: Síntesis o Generación: Semántica: Selección de formas estructurales y léxicas compatibles. Sintáctica: Generación de las estructuras de sintagma y oración requeridas. Morfológica: Generación de las formas correctas de las palabras. 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Componentes a diferentes niveles: Transferencia: Sólo para “Sistemas de Transferencia” Léxica: Selección de equivalentes de vocabulario. Estructural: Transformación en estructuras apropiadas del LD. En algunos sistemas de transferencia, el análisis no involucra una etapa semántica; la transferencia se restringe a la conversión de las estructuras sintácticas, lo que se conoce como “Transferencia Sintáctica” 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Tipos: Desde el punto de vista de los lenguajes Fuente y Destino. Bilingüe: Entre dos lenguajes particulares. Generalmente operan en una dirección (de un LF a un LD), aunque también los hay bidireccionales. Multilingüe: Más de un par de lenguajes. Generalmente son diseñados para ser bidireccionales. 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Tipos: Desde el punto de vista del generador de la traducción. Traducción de Máquina Asistida por Humanos (HAMT). Traducción Humana Asistida por Máquinas: Diccionarios en línea. Bancos de datos de terminología remota. Transmisión y recepción de textos. 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Tipos: Desde el punto de vista del objetivo de traducción. Comprensión de Textos: Hacer entender al usuario un texto en LF diferente a la suya. Generalmente textos cortos. Lenguas lejanas. Calidad poco relevante – Se busca una idea del contenido. Por lo general en PC’s e internet. 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Tipos: Desde el punto de vista del objetivo de traducción. Traducción Masiva: Herramientas industriales para el manejo de grandes volúmenes de textos. Es crítica la rapidez y claridad. Lenguas cercanas. La calidad no suele ser muy buena. 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Paradigmas: Traducción Directa o Binaria: Es la más antigua. Se diseña específicamente para un par específico de lenguajes. Emplea poco análisis sintáctico o semántico. Generalmente es un único diccionario bilingüe, con un pequeño programa de generación de textos. Generalmente son sistemas unidireccionales. 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Paradigmas: Traducción Directa o Binaria: La adición de nuevos lenguajes es altamente compleja. Para N lenguajes hay N(N-1)/2 pares de lenguajes. Se requeriría incorporar el mismo número de conjuntos de reglas de traducción. Problemas de calidad por no resolución de ambigüedades. 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Paradigmas: Traducción Directa o Binaria: 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Paradigmas: Transferencia: Separación modular de (Hausser, 1999): Análisis del LF y síntesis del LD. Procedimientos de datos lingüísticos y procesamiento. Léxico para análisis de LD, transferencia a LD y síntesis de LD. 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Paradigmas: Transferencia: Se realiza en tres etapas: Conversión de textos en LF en representaciones abstractas. Conversión de las representaciones abstractas en representaciones equivalentes de LD. Generación del texto final en LD. Se resuelven algunas de las ambigüedades. Se mejora un poco la calidad. 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Paradigmas: Transferencia: Suelen tener tres tipos de lexicones: LF: información morfológica, gramática y semántica. LD: igual. Diccionario de transferencia: relación entre las formas base de LF y las de LD. Para N lenguajes se requieren N2 gramáticas de transferencia (dos por cada par de lenguajes, una por cada dirección). 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Paradigmas: Transferencia: 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Paradigmas: Interlinguas: Es posible convertir un texto en LF en representaciones sintáctico – semánticas que son comunes a más de un lenguaje. Se generan los textos a partir de esas representaciones. Economía de escala en el esfuerzo de un entorno multilingüe. Se basan en un lenguaje artificial “lógico”, un lenguaje auxiliar “natural” y un conjunto de primitivas comunes a todos los lenguajes. 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Paradigmas: Interlinguas: Dos pasos independientes: Traducción del texto en LF en interlingua (análisis) Mapeo de la interlingua al LD (síntesis). Para N lenguajes se requieren 2N gramáticas (una para análisis y una para generación de cada lenguaje). Se debe eliminar completamente la ambigüedad. Traducciones de mejor calidad. 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Paradigmas: Interlinguas: 10/13/2018 Lingüística Computacional

Lingüística Computacional TRADUCCIÓN DE MÁQUINA Comparación de Paradigmas: 10/13/2018 Lingüística Computacional