Tecnologías del lenguaje

Slides:



Advertisements
Presentaciones similares
La enseñanza de la Gramática
Advertisements

LATÍN 4.º DE ESO.
LA CONJURACIÓN DE LAS PALABRAS
TEXTO Y DISCURSO.
También conocido como Diseño Lógico Rodrigo Salvatierra Alberú.
Programa de Estudio Tercer Año Medio.
TERMINOLOGÍA EN ESPAÑOL
Módulo Profesional: Idioma Extranjero. Inglés
Introducción a la lingüística descriptiva: una visión panorámica.
Lenguaje Lic. Carlos Marenales
Nociones sobre su forma, función y significado -
DIMENSIÓN SEMÁNTICA.
¿Cómo hacer para que una máquina comprenda el LN?
ESQUEMA. MORFOSINTAXIS
LOS SISTEMAS DE AUTOMATIZACIÓN DE OFICINAS
Aprendizaje de Microsoft® Access® 2010
Mgster. Mónica Gilda González de Doña
Analizadores Sintácticos Descendentes Predictivos
Lic. Sergio Alejandro Meneses Reyes
El Lenguaje y sus niveles de análisis
Programas Son una serie o secuencia de instrucciones entendibles por los ordenadores que permiten la realización de las acciones o tareas para las que.
LAS CARAS DE LA EVALUACION
Una metodología para utilizar Internet en el aula
DISCIPLINAS DE LA LINGUISTICA
NIVELES DE ESTUDIO DE LA LENGUA
NIVELES COMPETENCIALES
LECTOESCRITURA.
TRADUCTOR DE UN PROGRAMA
04 En esta unidad aprenderás a:
Teoría de lenguajes y compiladores
 Sincronismo. En toda transmisión debe existir un acuerdo entre el receptor y el emisor, y pueden llegar a él de dos formas: Síncrona, es decir, utilizando.
Ingenieria de software
FORMACIÓN BÁSICA – NIVEL I y II. Índice. Los Bloques y documentos adjuntos. Análisis de un bloque de contenidos. Partes y metodología. Los Ámbitos en.
1. Características del lenguaje
LA COMUNICACIÓN Iconos Símbolos Indicios LENGUA Y LITERATURA
4/27/2015Lingüística Computacional1 LEXICONES Y CORPUS Carlos Mario Zapata J.
El análisis fonético y sus aplicaciones Aprendizaje de lenguas: corrección de la propia lengua y enseñanza de otras lenguas Aprendizaje de lenguas: corrección.
Antecedentes. Universidad de Costa Rica Programa de Lexicografía- INIL Escuela de Formación.
Programación de Sistemas
Sistemas de Diálogo Hablado Workshop-Brainstorming 30 abril 2013 Seminario de Lógica y Lenguaje. Universidad de Sevilla.
Lógica – Psicología, gramática y matemáticas
PROGRAMA DE ESTUDIOS 2011 ESPAÑOL
Niveles de estudio de la lengua El nivel fónico El nivel morfológico
RECOMENDACIONES PARA EL ANÁLISIS DE LOS RESULTADOS
Herramientas informáticas
¿Qué estudia la lingüística?
INFORMATICA VII (Programación e implementación de sistemas)
¿CÓMO SE ORGANIZA LA LENGUA?
Programación de Sistemas FEI – 2008
Unidad 1. Introducción a los Compiladores.
LA MORFOLOGÍA.
Sobre el Lenguaje Rodrigo Jurado, MA*
Elaboración automática de resúmenes Nahiko Arraiza Eguillor 17-V-2006.
El aprendizaje de la lengua
Unidad 1. Clase 1 Comprensión de lectura Teórico - práctico
COMPETENCIAS PARA LA COMUNICACIÓN CIENTÍFICA
Unidad mínima con coherencia, significado e intención.
LA CONJURACIÓN DE LAS PALABRAS
Tema 5: “Las dimensiones del lenguaje y su estudio”
C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.
Lingüística computacional unidad 2. lexicones y corpus
INTERFAZ DE ACCESS  Access es un sistema gestor de bases de datos relacionales (SGBD). Una base de datos suele definirse como un conjunto de información.
LENGUA Y LITERATURA Curso
Cultura escrita y Alfabetización
Programación de Sistemas
SISTEMA DE CÓMPUTO PARA LA COMUNICACIÓN HOMBRE -MÁQUINA
En Internet: Los datos se transforman en información cuando una persona los lee, los comprende y los usa con algún fin: para estudiar, para trabajar,
Sandra Parada Mesa y Jesica Alejandra Alarcón
DLM Transact SQL Sesión I Introducción al SQL Server Uso de las herramientas de consultas del Transact SQL.
1 MÁS QUE PALABRAS. 2 Más que palabras ¿Qué han de aprender a manipular mentalmente los niños para ser competentes gramaticalmente hablando?
Transcripción de la presentación:

Tecnologías del lenguaje Ana MaríaTangarife Patiño

¿Qué son? Las tecnologías del lenguaje, también llamadas tecnologías lingüísticas o tecnologías para el lenguaje humano se integran en aplicaciones informáticas para permitir el tratamiento de textos escritos, procesamiento, dictado o lectura automática en voz alta de un mensaje. Estas tecnologías hacen posible la creación de herramientas en las que se utilizan los ordenadores sin renunciar por ello a nuestro uso habitual del lenguaje como medio de interacción y de intercambio de información.

Se distinguen… Tecnologías lingüísticas que se centran en la lengua escrita. Procesamiento del lenguaje natural o tecnologías del texto escrito. Tecnologías lingüísticas que tienen por objeto el habla. El desarrollo de estas tecnologías y sus aplicaciones requieren disponer de recursos lingüísticos, entre los que se cuentan los corpus, los diccionarios y las gramáticas.

Objeto de las tecnologías del habla Speech technologies Tienen por objeto el tratamiento informático de la lengua oral. Permiten que un ordenador: Ofrezca información hablada: síntesis del habla. Reconozca los enunciados emitidos por un locutor: reconocimiento automático del habla. Combine ambas tecnologías para entablar una interacción: sistemas de diálogo. Tiene su origen en la ingeniería de telecomunicaciones: telefonía, tratamiento digital de señales.

TECNOLOGÍAS DEL HABLA - lingüística Síntesis del habla: conversión de texto en habla Reconocimiento del habla Sistemas de diálogo La fonética, tanto en su vertiente descriptiva como experimental, es la disciplina lingüística que más directamente entronca con las tecnologías del habla. Es necesario recurrir a conocimientos fonológicos, morfológicos, sintácticos, semánticos e incluso pragmáticos para representar fenómenos más precisos.

TECNOLOGÍAS DEL HABLA. Síntesis del habla Objetivo: generar automáticamente mensajes orales, partiendo de un texto escrito Conversión de texto en habla Representación simbólica Transforma automáticamente cualquier texto escrito y disponible en formato electrónico en su correspondiente realización sonora.

TECNOLOGÍAS DEL HABLA. Síntesis del habla La estructura de un conversor es modular, de manera que cada uno se ocupa de un aspecto de conversión de la cadena inicial de caracteres (texto) hasta la señal sonora, equivalente a su lectura en voz alta.

TECNOLOGÍAS DEL HABLA. Síntesis del habla Ejemplos: Conversión de texto a habla: En línea: http://vozme.com/index.php?lang=es http://www.ivona.com/us/ Para descarga: https://addons.mozilla.org/en-US/firefox/addon/text-to-voice/

TECNOLOGÍAS DEL HABLA. Reconocimiento del habla Transformar una señal sonora (habla) y su correspondiente representación simbólica en un texto escrito. Ejemplo: Programas comerciales de dictado automático orientados a los usuarios que desean escribir sus textos sin recurrir al teclado del ordenador.

TECNOLOGÍAS DEL HABLA. Reconocimiento del habla Los reconocedores son sistemas que aprenden automáticamente de un extenso corpus de habla y, en el momento de enfrentarse a un nuevo enunciado, lo comparan con los datos que previamente han extraído de este corpus. Actividades para desarrollar un sistema de reconocimiento: Diseñar y recoger el corpus de aprendizaje (o de entrenamiento). Adquirir información para crear modelos de cada una de las unidades de reconocimiento. Obtención la gramática del reconocedor: modelo que recoge las probabilidades de aparición de palabras en un determinado punto.

TECNOLOGÍAS DEL HABLA. Reconocimiento del habla

TECNOLOGÍAS DEL HABLA. Reconocimiento del habla Disciplinas como la fonética y la dialectología son muy relevantes para el reconocimiento automático del habla, puesto que aportan información básica y criterios prácticos para el desarrollo de los sistemas. Ejemplo http://www.e-speaking.com/publish.htm

TECNOLOGÍAS DEL HABLA sistemas de diálogo Objetivo: facilitar la interacción mediante el habla entre una persona y un sistema informático. Se utilizan en: Servicios telefónicos automáticos de información. Servicios de atención al cliente en ámbitos como la banca y el comercio electrónicos. Tecnologías básica que sustentan los denominados portales de voz. Información meteorológica. Cartelera, museos, restaurantes, farmacias de guardia, compañías de taxi, etc. Son equivalentes a los que se encuentran en los portales convencionales en la web.

TECNOLOGÍAS DEL HABLA sistemas de diálogo Un sistema de diálogo consta de un conjunto de módulos que realizan todas las tareas necesarias para facilitar una información o llevar a cabo una transacción.

TECNOLOGÍAS DEL HABLA sistemas de diálogo Problemas lingüísticos implicados en el desarrollo sistemas de diálogo Reconocimiento del habla Ejemplo: un reconocedor puede presentar problemas a la hora de distinguir entre “Palencia” y “Valencia”, lo que hace necesario que en el módulo de gestión del diálogo se prevean estrategias de confirmación de la información dudosa, preguntando, por ejemplo “¿Desea usted viajar a Palencia o a Valencia?” o “¿Quiere usted saber los horarios de trenes a Palencia?”. Reconocimiento de los rasgos prosódicos Ejemplo: “No, quiero viajar por la mañana” o “No quiero viajar por la mañana” depende exclusivamente de la correcta detección de la pausa. Diferencia a partir de la entonación Ejemplo: Pregunta: “¿Puedo viajar el lunes?” o una aseveración: “Puedo viajar el lunes”

TECNOLOGÍAS DEL HABLA sistemas de diálogo Ejemplo http://www.youtube.com/watch?v=zGpuZNLWT8Y

TECNOLOGÍAS DEL TEXTO Se ocupan de la vertiente escrita de la lengua. Se distinguen: Las herramientas con las que se procesa la lengua escrita. Las tecnologías empleadas en el desarrollo de aplicaciones.

TECNOLOGÍAS DEL TEXTO herramientas de ayuda a la escritura Programas de corrección ortográfica y gramatical que se encuentran incorporados a la mayoría de los procesadores de textos y que pueden describirse genéricamente como herramientas de ayuda a la escritura. En la corrección automática de textos se distinguen tres niveles de complejidad: Verificación ortográfica. Verificación gramatical. Verificación de estilo.

TECNOLOGÍAS DEL TEXTO herramientas de ayuda a la escritura Problemas Ciertos errores en el texto escapan con facilidad al sistema. Por ejemplo en palabras que utilizan ciertos prefijos. Aparecen como erróneas palabras que contienen equivocaciones ortográficas o de mecanografiado, sino también palabras existentes en la lengua pero que no han sido incluidas en el diccionario en el que se basa el corrector.

TECNOLOGÍAS DEL TEXTO herramientas de análisis lingüístico Programas que realizan de manera automática operaciones en morfología y sintaxis: Extraer la raíz de una palabra. Segmentar la palabra en morfemas. Asignar la categoría gramatical correspondiente. Determinar la parte de la oración a la que pertenece la palabra. Descomponer una frase en sus constituyentes indicando la función sintáctica de cada uno de ellos. Estas herramientas se denominan lematizadores: su función es detectar el radical de una palabra, separándola de los morfemas derivativos o flexivos que la acompañan Analizadores semánticos

TECNOLOGÍAS DEL TEXTO procesamiento del lenguaje natural Generación del lenguaje: Se realiza a partir de una representación abstracta que debe transformarse en un texto bien formado. Problema: El contenido de una misma representación puede manifestarse en la lengua de diversos modos. Traducción automática: Requiere conocimiento morfológico, sintáctico, léxico y semántico automáticos. Es imprescindible además tener un conocimiento del mundo, información que difícilmente puede formalizarse por ahora en un programa informático. Ejemplo: http://translate.google.com/toolkit

TECNOLOGÍAS DEL TEXTO traducción automática

TECNOLOGÍAS DEL TEXTO Recuperación y extracción Esta operación consiste en seleccionar, en un conjunto de documentos, aquellos que contienen la información que un usuario solicita mediante una consulta. Problemas Reconocimiento de nombres propios, ya que éstos se encuentran de diversas formas en los textos “Lorca”, “García Lorca” o “Federico García Lorca” Poeta o ciudad Correferencia: la misma persona puede aparecer en un documento con su apellido, su nombre y apellido o su cargo, y los tres deben identificarse como referentes al mismo individuo. Anáfora: La extracción de información se lleva a cabo partiendo de un análisis morfológico, léxico y sintáctico de los documentos, y se basa en nociones como entidades, relaciones, o acontecimientos en el marco de un dominio determinado.

RECURSOS LINGÜÍSTICOS Corpus: Conjunto estructurado de textos que constituyen una muestra realista del uso de la lengua. Orales Escritos o textuales Tienen un diseño coherente, marcas en los textos, estructura según estándares y documentación completa de la procedencia y características de los textos. Léxicos computacionales: léxicos monolingües o multilingües y redes léxico-semánticas. Contiene información morfológica, sintáctica y semántica relevante para diversas aplicaciones de PLN. Gramáticas computacionales: Descripción formalizada del conocimiento lingüístico que puede ser empleada por las herramientas de análisis y de generación de textos.

REFERENCIAS Sistemas de diálogo hablado y multimodal. En: http://www.ugr.es/~rlopezc/sistemas_dialogo.htm Llisterri, Joaquim. Lingüística y tecnologías del lenguaje. Lynx. Panorámica de Estudios Lingüísticos, 2; pp. 9-71. En: http://liceu.uab.es/~joaquim/publicacions/Llisterri _03_Linguistica_Tecnologias_Lenguaje.pdf