Perspectivas profesionales en el desarrollo de las Tecnologías del Habla: una visión desde la Lingüística Juan María Garrido Almiñana Grup de Lingüística.

Slides:



Advertisements
Presentaciones similares
Moodle.
Advertisements

Autor: Juan Carlos Álvarez Martín Tutor: Francisco Javier Finat Codes
Interfaces adaptadas para Discapacitados
SOLUCIONES PARA BÚSQUEDA DE TEXTO EN AUDIO Y TRANSCRIPCIÓN DE VOZ A TEXTO Octubre de
CREACIÓN DE UN ESPACIO DE FORMACIÓN VIRTUAL. REFLEXIONES DESDE LA PRÁCTICA Su á rez, J.M.; Bo, R. y S á ez, A. Unidad de Tecnolog í a Educativa (M.I.D.E.-UVEG)
Guia Diseño Robert Echeverria
ATTOS Análisis de Tendencias y Temáticas a través de Opiniones y Sentimientos Kick-off 18 de julio de 2013.
¡¡¡Bienvenido al tutorial gráfico
ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO
RICARDO DE J. BOTERO TABARES
Conciencia Fonológica y Aprendizaje de la Lectura
HERRAMIENTAS CASE.
EL USO DE NUEVAS TECNOLOGÍAS APLICADAS A LA EDUCACIÓN A DISTANCIA
COMO CREAR EXPERIENCIAS DE APRENDIZAJE DE ALTO VALOR EN EL SIGLO XXI.
SEMANA Introducción.
Ofrece mejoras en el uso de su plataforma para usuarios con discapacidades físicas y visuales.
Seminario Nacional EUROMAP © 2002 IBM Corporation Madrid, 20 de febrero de 2003 Perspectivas de futuro de las tecnologías lingüísticas: la visión de IBM.
Realidad virtual Integrantes: Segundo Agurto Cristian Venegas.
UPV - EHU Konputagailuen Arkitektura eta Teknologia Saila Departamento de Arquitectura y Tecnología de Computadores 1 Sistemas Ubicuos 3. Gestión del contexto.
Ciclo de Vida del Software Paradigmas de Desarrollo
MEDIOS Y RECURSOS DIDÁCTICOS. Objetivos  Saber las diferencias entre medios y recursos didácticos  Conocer las características de los recursos didácticos.
FORMACIÓN BÁSICA – NIVEL I y II. Índice. Los Bloques y documentos adjuntos. Análisis de un bloque de contenidos. Partes y metodología. Los Ámbitos en.
Concepto de usabilidad
Eloísa Orozco Bueno Alvaro Padilla Vilema
CERTIFICACION E-LEARNING
El software como una obra humana.
Bienvenidos al Curso de Álgebra, Trigonometría y Geometría Analítica Código:
4/27/2015Lingüística Computacional1 LEXICONES Y CORPUS Carlos Mario Zapata J.
El análisis fonético y sus aplicaciones Aprendizaje de lenguas: corrección de la propia lengua y enseñanza de otras lenguas Aprendizaje de lenguas: corrección.
PROGRAMA DE ESTUDIOS 2011 ESPAÑOL
INTRODUCCIÓN A LA INTELIGENCIA ARTIFICIAL Y LOS SISTEMAS EXPERTOS
Programación Java y Desarrollo de Aplicaciones
La innovación educativa en la formación del traductor e intérprete: herramientas de investigación social aplicadas a la coordinación docente MERCEDES ENRÍQUEZ-
Investigadores: Mijaíl Posada Mijaíl Posada Alejandro Carrillo Alejandro Carrillo Willian Romo Willian Romo Juan Medina Juan Medina Jorge Casas Jorge.
Tecnología de la Información y Comunicación
LCMS Patricia López Nº 14 Almudena Martin Nº 15 Andrea Roldán Nº 20º.
Universidad Tecnológica OTEIMA Maestría en Docencia Superior
CIENCIA, TÉCNICA Y TECNOLOGÍA
INTRODUCCIÓN INGENIERIA DE SISTEMAS
¿QUÉ ES UNA PLATAFORMA DE E-LEARNING?
Programa de Educación Secundaria.
CULIACÁN, SIN. JUNIO 04 DE 2011 SECRETARÍA DE EDUCACIÓN PÚBLICA Y CULTURA DEL ESTADO DE SINALOA CENTRO DE INVESTIGACIÓN E INNOVACIÓN EDUCATIVA DEL NOROESTE,
QUÉ ES ROBÓTICA Es la ciencia encargada de diseñar y construir aparatos y sistemas capaces de realizar tareas por sí mismos. Es una disciplina con sus.
Son elementos con algún tipo de funcionalidad con capacidad de procesamiento con conexión a algún tipo de red cumpliendo indefinidas ordenes que pueden.
Dispositivos Móviles John Alexander Cruz Arévalo.
TECNOLOGIAS ACCESIBLES
Heiner Mercado Curso de Lingüística Computacional
Radio escolar y grabaciones en casete. Audio conferencia, que más tarde se convirtió, en uno de los servicios de la telenseñanza.
UNIVERSIDAD CAPITÁN GENERAL GERARDO BARRIOS FACULTAD DE CIENCIA Y TECNOLOGIA LICENCIATURA EN COMPUTACIÓN MÓDULO I: DISEÑO GRAFICO DOCENTE: ING. EDWIN ROLANDO.
MAESTRIA EN DESARROLLO EDUCATIVO MODULO DISEÑO CURRICULAR
III. DESARROLLO DE SISTEMAS.. Podemos definir el desarrollo de sistemas informáticos como el proceso mediante el cual el conocimiento humano y el uso.
DISEÑO CURRICULAR Presentado por: Cesar Augusto Sáenz María Alejandra Hernández 1.contenidos curriculares de competencia.
INGLÈS INTRODUCCION  El programa de estudios de 1993 constituyo un cambio fundamental en cuanto a la concepción de la lengua extranjera y su enseñanza.
Características distintivas Ventajas y desventajas
C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.
Lingüística computacional unidad 2. lexicones y corpus
Tecnologías del lenguaje
Sistema de soporte Educativo Integrantes:  Bustos, Gustavo  Celía, Salvador A.  Giovanolli, Juan  Tavorda, Marcos.
Introducción Mayo 16, 2012 Análisis y Diseño de Sistemas.
LAS COMPETENCIAS.
Acciones Formativas http: //oportunidadaccesible.com.
SISTEMA DE CÓMPUTO PARA LA COMUNICACIÓN HOMBRE -MÁQUINA
FI-GQ-GCMU V Presentación del curso Microprocesadores y Microcontroladores Héctor Ivan Blanco Rodriguez Bogotá D.C ECBTI.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Las fases del ciclo de la vida de desarrollo de sistemas
Perspectivas actuales y futuras de la investigación en el ámbito de las TIC y la atención a la diversidad. Julio Cabero Almenara Universidad de Sevilla.
LAS TIC ANGIE KATERIN TEQUIA HERRERA LIC. PEDAGOGÍA INFANTIL 1 SEMESTRE 2015.
MULTIVERSIDAD LATINOAMERICANA CAMPUS TONALÁ DOCENTE: MARÍA DOLORES GARCÍA PONCE INFORMÁTICA II BLOQUE IV. EMPLEA SOFTWARE EDUCATIVO.
TUTOR VIRTUAL Nuevos entornos formativos Roles y funciones.
Natural Language, VOCALCOM Company Aplicaciones de los sistemas de lenguaje natural automatizado a la Sanidad PRINCIPIOS, ENFOQUES Y RETOS.
Transcripción de la presentación:

Perspectivas profesionales en el desarrollo de las Tecnologías del Habla: una visión desde la Lingüística Juan María Garrido Almiñana Grup de Lingüística Computacional (GLiCom) Universitat Pompeu Fabra VIII Seminario TIC-ETL Madrid, 4 de diciembre de 2014

Las Tecnologías del Habla han alcanzado un grado de madurez suficiente como para permitir el desarrollo de aplicaciones que sean atractivas para el gran público, y por tanto rentables desde el punto de vista comercial. Están empezando a ser un negocio que genera empleo, no solo para ingenieros, sino también para lingüistas. Las Tecnologías del Habla, un negocio en auge

Usos de las tecnologías del habla: Público en general: Comunicación persona-máquina Ayuda a la discapacidad Comunicación multilingüe Empresas: Análisis de mercado, posicionamiento de marca Comunicación con los clientes Profesionales de la lengua: Enseñanza de lenguas Apoyo al estudio Terapia del habla Las Tecnologías del Habla, un negocio en auge

Interfaces persona-máquina: Permiten la interacción oral entre un dispositivo y un usuario Se emplean en diferentes tipos de dispositivos: Dispositivos móviles Navegadores de a bordo en coches Páginas web Ejemplos: Siri, de AppleSiri SYNC, de Ford SYNC Asistente virtual Renfe Productos comerciales con Tecnologías del Habla

Lectores de pantalla: Sistemas que permiten interactuar con un dispositivo electrónico a personas sin visión o con visión reducida Existen aplicaciones para diferentes tipos de dispositivos ordenadores de sobremesa dispositivos móviles páginas web Ejemplos JAWS, de Freedom Scientific JAWS Mobile Accesibility, de Code FactoryMobile Accesibility Página web de la UOCUOC Productos comerciales con Tecnologías del Habla

Traductores voz-voz: Sistemas de traducción automática que incorporan entrada y salida vocal Permiten la comunicación oral entre dos personas que hablan diferentes lenguas Ejemplos: Google Translate for Mobile Vocre, de MyLanguageVocre Productos comerciales con Tecnologías del Habla

Sistemas IVR (Interactive Voice Response): Sistemas que permiten la interacción mediante el habla entre un cliente y un sistema automático a través del teléfono Muy empleados en la automatización de call centers Ejemplos: Emoción Voz (Movistar) Spoken Spoken Productos comerciales con Tecnologías del Habla

Speech analytics: Aplicaciones para el análisis del contenido de las llamadas a un servicio de atención telefónica Permiten detectar automáticamente situaciones de conflicto o temas de interés para los clientes Ejemplos: Eureka, de CallMiner Eureka Interaction Analytics, de NiceInteraction Analytics Productos comerciales con Tecnologías del Habla

Sistemas de evaluación automática de la pronunciación: Permiten ejercitar la pronunciación a las personas quue están aprendiendo una lengua Se ofrecen como poductos aislados o integrados en otros productos (cursos de idiomas multimedia) Ejemplos: TellMeMore Spanish Language Learning Software, de Rosetta Stone TellMeMore Spanish Language Learning Software Talk to Me, de Auralog Talk to Me Productos comerciales con Tecnologías del Habla

Programas para el aprendizaje de lectura y escritura y apoyo al estudio (literacy software): Programas de soporte al estudio con ayuda del ordenador Pensados tanto para estudiantes con dificultades como sin ella Ejemplos: Kurzweil 3000/Firefly, de Kurzweil Educational Systems Kurzweil 3000/Firefly Ditres, de Rehasoft Ditres Productos comerciales con Tecnologías del Habla

Las tecnologías del habla que se emplean en estas aplicaciones son básicamente tres: Conversión texto-habla Text-to-speech, o TTS, en inglés tecnología que permite leer de forma automática en voz alta un texto escrito en una lengua determinada Reconocimiento de habla Tecnología que convierte en una cadena de texto una onda sonora de habla de entrada Gestión de diálogo Tecnología encargada de controlar automáticamente las interacciones orales entre personas y máquinas Son una mezcla de conocimiento lingüístico/fonético y métodos estadísticos Tecnologías del Habla comerciales

Conversión texto-habla Tecnologías del Habla comerciales

Conversión texto-habla Tareas en la incorporación de un idioma a un sistema comercial: Construcción del módulo de procesado lingüístico Preprocesado Análisis del texto Predicción del acento Análisis prosódico Transcripción fonética Construcción de la voz sintética Selección del corpus Selección del locutor Grabación del corpus Procesado del corpus Construcción de la voz Base de datos de sonidos Modelos prosódicos Evaluación y mejoras Tecnologías del Habla comerciales

Reconocimiento de habla Tecnologías del Habla comerciales

Reconocimiento de habla Tareas en la incorporación de un idioma a un sistema comercial Creación de los modelos acústicos Diseño del corpus Selección de los locutores Recogida del corpus Construcción de los modelos Creación de los modelos de lenguaje Recogida del texto Limpieza del texto Construcción de los modelos Evaluación Tecnologías del Habla comerciales

Gestión de diálogo Tecnologías del Habla comerciales

Gestión de diálogo Tareas en el desarrollo de un servicio basado en gestión de diálogo: Diseño Definición de las carácterísticas funcionales Tecnología implicada Desarrollo Diseño del flujo Ajuste del conversor texto-habla Ajuste del reconocedor Evaluación y pruebas Tecnologías del Habla comerciales

Desarrolladores de tecnología: Grandes empresas: Google Microsoft Apple AT&T Nuance Pequeñas y medianas empresas Acapela Cereproc Neospeech Verbio Fundaciones SRI International Desarrolladores de servicios: Ydilo Fonetic Prosodie VoxWeb Artificial solutions Asistentes Virtuales Tecnologías del Habla comerciales

Nuevas líneas de aplicación: Robótica Asistentes personales Juguetes: AIBO, de SonyAIBO Domótica Control de electrodomésticos, calefacción, luz, etc. de una casa mediante la voz: INVOX, de Vócali INVOX Samsung Smart TV Samsung Smart TV Teleasistencia Sistemas de ayuda a personas mayores y enfermos en casa Denise Las Tecnologías del Habla en un futuro inmediato

Nuevos retos tecnológicos: Mejora de la tecnología actual Sistemas de conversión texto-habla con un mayor grado de naturalidad y capaces de expresar emociones Mejora de los modelos prosódicos Sistemas de reconocimiento de habla mucho más robustos, capaces de trabajar en entornos ruidosos o con habla informal y emotiva Mejora del reconocimiento acústico Mejora de los léxicos y modelos de lenguaje Sistemas de diálogo mucho más flexibles y adaptados también a entornos informales Mejora de las técnicas de control del diálogo Tecnología de reconocimiento de locutor más fiable, que permita su incorporación a sistemas comerciales Las Tecnologías del Habla en un futuro inmediato

Nuevos retos tecnológicos: Desarrollo de nuevas tecnologías ahora emergentes Identificación de idioma Identificación en la onda sonora del idioma en que se ha emitido Reconocimiento automático de emociones Técnicas para identificar en las ondas sonoras del habla las emociones del hablante Speaker diarization Identificación en la grabación de un diálogo de los segmentos pronunciados por los distintos participantes Las Tecnologías del Habla en un futuro inmediato

Sin duda, los linguistas tienen (y tendrán) un papel en el desarrollo de tecnología del habla comercial: El desarrollo de estas tecnologías y servicios lo llevan a cabo grupos interdisciplinares, en los que también participan lingüistas Campos en los que se requieren conocimientos lingüísticos: Desarrollo de módulos de procesado lingüístico para conversión texto-habla Desarrollo de diccionarios de pronunciación para reconocimiento Diseño, recogida y anotación de corpus para la síntesis y el reconicimiento Desarrollo y ajuste de servicios basados en sistemas de diálogo Evaluación y mejoras Perspectivas profesionales de los lingüistas en las Tecnologías del habla

La aportación de la Lingüística a la investigación en Tecnología del Habla es más incierta, y dependerá de diversos factores: Paradigma empleado en el desarrollo de la tecnología: Las aproximaciones estadísticas, de momento, son el paradigma dominante Campos en los que el conocimiento fonético sigue teniendo su papel: Aproximaciones paramétricas a la síntesis Síntesis de emociones Procesado lingüístico para la síntesis y el reconocimiento Diccionarios fonéticos para el reconocimiento Conocimiento teórico aportado por la Fonética: Descripción del habla expresiva Modelos prosódicos Caracterización segmental Descripción del habla en diversas situaciones Diálogos orientados a objetivo Descripción de la variación interlocutor e intralocutor: Habla de niños, habla de personas ancianas Perspectivas profesionales de los lingüistas en las Tecnologías del habla

Hacia un nuevo perfil de fonetista ‘computacional’ Con mayor dominio de las herramientas tecnológicas de procesado, no solo en lo que se refiere a su manejo sino incluso a su desarrollo (con Praat, por ejemplo) Capacitado tanto para el trabajo en investigación básica como para el desarrollo de tecnología del habla, en el mundo académico o de la empresa. Requiere una nueva formación multidisciplinar Perspectivas profesionales de los lingüistas en las Tecnologías del habla