La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Perspectivas profesionales en el desarrollo de las Tecnologías del Habla: una visión desde la Lingüística Juan María Garrido Almiñana Grup de Lingüística.

Presentaciones similares


Presentación del tema: "Perspectivas profesionales en el desarrollo de las Tecnologías del Habla: una visión desde la Lingüística Juan María Garrido Almiñana Grup de Lingüística."— Transcripción de la presentación:

1 Perspectivas profesionales en el desarrollo de las Tecnologías del Habla: una visión desde la Lingüística Juan María Garrido Almiñana Grup de Lingüística Computacional (GLiCom) Universitat Pompeu Fabra VIII Seminario TIC-ETL Madrid, 4 de diciembre de 2014

2 Las Tecnologías del Habla han alcanzado un grado de madurez suficiente como para permitir el desarrollo de aplicaciones que sean atractivas para el gran público, y por tanto rentables desde el punto de vista comercial. Están empezando a ser un negocio que genera empleo, no solo para ingenieros, sino también para lingüistas. Las Tecnologías del Habla, un negocio en auge

3 Usos de las tecnologías del habla: Público en general: Comunicación persona-máquina Ayuda a la discapacidad Comunicación multilingüe Empresas: Análisis de mercado, posicionamiento de marca Comunicación con los clientes Profesionales de la lengua: Enseñanza de lenguas Apoyo al estudio Terapia del habla Las Tecnologías del Habla, un negocio en auge

4 Interfaces persona-máquina: Permiten la interacción oral entre un dispositivo y un usuario Se emplean en diferentes tipos de dispositivos: Dispositivos móviles Navegadores de a bordo en coches Páginas web Ejemplos: Siri, de AppleSiri SYNC, de Ford SYNC Asistente virtual Renfe Productos comerciales con Tecnologías del Habla

5 Lectores de pantalla: Sistemas que permiten interactuar con un dispositivo electrónico a personas sin visión o con visión reducida Existen aplicaciones para diferentes tipos de dispositivos ordenadores de sobremesa dispositivos móviles páginas web Ejemplos JAWS, de Freedom Scientific JAWS Mobile Accesibility, de Code FactoryMobile Accesibility Página web de la UOCUOC Productos comerciales con Tecnologías del Habla

6 Traductores voz-voz: Sistemas de traducción automática que incorporan entrada y salida vocal Permiten la comunicación oral entre dos personas que hablan diferentes lenguas Ejemplos: Google Translate for Mobile Vocre, de MyLanguageVocre Productos comerciales con Tecnologías del Habla

7 Sistemas IVR (Interactive Voice Response): Sistemas que permiten la interacción mediante el habla entre un cliente y un sistema automático a través del teléfono Muy empleados en la automatización de call centers Ejemplos: Emoción Voz (Movistar) Spoken Spoken Productos comerciales con Tecnologías del Habla

8 Speech analytics: Aplicaciones para el análisis del contenido de las llamadas a un servicio de atención telefónica Permiten detectar automáticamente situaciones de conflicto o temas de interés para los clientes Ejemplos: Eureka, de CallMiner Eureka Interaction Analytics, de NiceInteraction Analytics Productos comerciales con Tecnologías del Habla

9 Sistemas de evaluación automática de la pronunciación: Permiten ejercitar la pronunciación a las personas quue están aprendiendo una lengua Se ofrecen como poductos aislados o integrados en otros productos (cursos de idiomas multimedia) Ejemplos: TellMeMore Spanish Language Learning Software, de Rosetta Stone TellMeMore Spanish Language Learning Software Talk to Me, de Auralog Talk to Me Productos comerciales con Tecnologías del Habla

10 Programas para el aprendizaje de lectura y escritura y apoyo al estudio (literacy software): Programas de soporte al estudio con ayuda del ordenador Pensados tanto para estudiantes con dificultades como sin ella Ejemplos: Kurzweil 3000/Firefly, de Kurzweil Educational Systems Kurzweil 3000/Firefly Ditres, de Rehasoft Ditres Productos comerciales con Tecnologías del Habla

11 Las tecnologías del habla que se emplean en estas aplicaciones son básicamente tres: Conversión texto-habla Text-to-speech, o TTS, en inglés tecnología que permite leer de forma automática en voz alta un texto escrito en una lengua determinada Reconocimiento de habla Tecnología que convierte en una cadena de texto una onda sonora de habla de entrada Gestión de diálogo Tecnología encargada de controlar automáticamente las interacciones orales entre personas y máquinas Son una mezcla de conocimiento lingüístico/fonético y métodos estadísticos Tecnologías del Habla comerciales

12 Conversión texto-habla Tecnologías del Habla comerciales

13 Conversión texto-habla Tareas en la incorporación de un idioma a un sistema comercial: Construcción del módulo de procesado lingüístico Preprocesado Análisis del texto Predicción del acento Análisis prosódico Transcripción fonética Construcción de la voz sintética Selección del corpus Selección del locutor Grabación del corpus Procesado del corpus Construcción de la voz Base de datos de sonidos Modelos prosódicos Evaluación y mejoras Tecnologías del Habla comerciales

14 Reconocimiento de habla Tecnologías del Habla comerciales

15 Reconocimiento de habla Tareas en la incorporación de un idioma a un sistema comercial Creación de los modelos acústicos Diseño del corpus Selección de los locutores Recogida del corpus Construcción de los modelos Creación de los modelos de lenguaje Recogida del texto Limpieza del texto Construcción de los modelos Evaluación Tecnologías del Habla comerciales

16 Gestión de diálogo Tecnologías del Habla comerciales

17 Gestión de diálogo Tareas en el desarrollo de un servicio basado en gestión de diálogo: Diseño Definición de las carácterísticas funcionales Tecnología implicada Desarrollo Diseño del flujo Ajuste del conversor texto-habla Ajuste del reconocedor Evaluación y pruebas Tecnologías del Habla comerciales

18 Desarrolladores de tecnología: Grandes empresas: Google Microsoft Apple AT&T Nuance Pequeñas y medianas empresas Acapela Cereproc Neospeech Verbio Fundaciones SRI International Desarrolladores de servicios: Ydilo Fonetic Prosodie VoxWeb Artificial solutions Asistentes Virtuales Tecnologías del Habla comerciales

19 Nuevas líneas de aplicación: Robótica Asistentes personales Juguetes: AIBO, de SonyAIBO Domótica Control de electrodomésticos, calefacción, luz, etc. de una casa mediante la voz: INVOX, de Vócali INVOX Samsung Smart TV Samsung Smart TV Teleasistencia Sistemas de ayuda a personas mayores y enfermos en casa Denise Las Tecnologías del Habla en un futuro inmediato

20 Nuevos retos tecnológicos: Mejora de la tecnología actual Sistemas de conversión texto-habla con un mayor grado de naturalidad y capaces de expresar emociones Mejora de los modelos prosódicos Sistemas de reconocimiento de habla mucho más robustos, capaces de trabajar en entornos ruidosos o con habla informal y emotiva Mejora del reconocimiento acústico Mejora de los léxicos y modelos de lenguaje Sistemas de diálogo mucho más flexibles y adaptados también a entornos informales Mejora de las técnicas de control del diálogo Tecnología de reconocimiento de locutor más fiable, que permita su incorporación a sistemas comerciales Las Tecnologías del Habla en un futuro inmediato

21 Nuevos retos tecnológicos: Desarrollo de nuevas tecnologías ahora emergentes Identificación de idioma Identificación en la onda sonora del idioma en que se ha emitido Reconocimiento automático de emociones Técnicas para identificar en las ondas sonoras del habla las emociones del hablante Speaker diarization Identificación en la grabación de un diálogo de los segmentos pronunciados por los distintos participantes Las Tecnologías del Habla en un futuro inmediato

22 Sin duda, los linguistas tienen (y tendrán) un papel en el desarrollo de tecnología del habla comercial: El desarrollo de estas tecnologías y servicios lo llevan a cabo grupos interdisciplinares, en los que también participan lingüistas Campos en los que se requieren conocimientos lingüísticos: Desarrollo de módulos de procesado lingüístico para conversión texto-habla Desarrollo de diccionarios de pronunciación para reconocimiento Diseño, recogida y anotación de corpus para la síntesis y el reconicimiento Desarrollo y ajuste de servicios basados en sistemas de diálogo Evaluación y mejoras Perspectivas profesionales de los lingüistas en las Tecnologías del habla

23 La aportación de la Lingüística a la investigación en Tecnología del Habla es más incierta, y dependerá de diversos factores: Paradigma empleado en el desarrollo de la tecnología: Las aproximaciones estadísticas, de momento, son el paradigma dominante Campos en los que el conocimiento fonético sigue teniendo su papel: Aproximaciones paramétricas a la síntesis Síntesis de emociones Procesado lingüístico para la síntesis y el reconocimiento Diccionarios fonéticos para el reconocimiento Conocimiento teórico aportado por la Fonética: Descripción del habla expresiva Modelos prosódicos Caracterización segmental Descripción del habla en diversas situaciones Diálogos orientados a objetivo Descripción de la variación interlocutor e intralocutor: Habla de niños, habla de personas ancianas Perspectivas profesionales de los lingüistas en las Tecnologías del habla

24 Hacia un nuevo perfil de fonetista ‘computacional’ Con mayor dominio de las herramientas tecnológicas de procesado, no solo en lo que se refiere a su manejo sino incluso a su desarrollo (con Praat, por ejemplo) Capacitado tanto para el trabajo en investigación básica como para el desarrollo de tecnología del habla, en el mundo académico o de la empresa. Requiere una nueva formación multidisciplinar Perspectivas profesionales de los lingüistas en las Tecnologías del habla

25


Descargar ppt "Perspectivas profesionales en el desarrollo de las Tecnologías del Habla: una visión desde la Lingüística Juan María Garrido Almiñana Grup de Lingüística."

Presentaciones similares


Anuncios Google