Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez ftp.gaps.ssr.upm.es/pub/TDV/DOC/ Tema4a.ppt Dpto. Señales, Sistemas y Radiocomunicaciones.

Slides:



Advertisements
Presentaciones similares
¡BIENVENIDOS A LA NOCHE DE PADRES DE PRIMER GRADO!
Advertisements

DESARROLLO DE LOS SISTEMAS DE CODIFICACIÓN: LECTURA Y CÁLCULO
Lenguaje, lengua y habla
El latín es una lengua flexiva, esto quiere decir que hay un cierto número de palabras, en latín, que se declinan (cambian de forma según la función que.
NUEVAS TECNOLOGÍAS Y EDUCACIÓN ESPECIAL.
DISGRAFIA ¿QUÉ MÁS DEBERÍA SABER?
PARTES DE LA GRAMÁTICA.
LA CONJURACIÓN DE LAS PALABRAS
Programa de Estudio Tercer Año Medio.
LA LECTURA Republica Bolivariana de Venezuela
Metodos y estrategias para conseguir la lectura.
La señal de voz Asunción Moreno.
ESQUEMA. MORFOSINTAXIS
Adquisicion de la Lectura y la Escritura
Del sonido a la escritura
Teoría de lenguajes y compiladores
¡¡¡Bienvenido al tutorial gráfico
Dpto. Señales, Sistemas y Radiocomunicaciones
Dpto. Señales, Sistemas y Radiocomunicaciones
Dpto. Señales, Sistemas y Radiocomunicaciones
Dpto. Señales, Sistemas y Radiocomunicaciones
Dpto. Señales, Sistemas y Radiocomunicaciones
Procesamiento Digital de Voz
El Lenguaje y sus niveles de análisis
Conciencia Fonológica y Aprendizaje de la Lectura
Inteligencia Artificial K 1 - Grupo 7 RECONOCIMIENTO DE VOZ Bonilla, Eduardo Lobera, Laura Marin, Ignacio Scándolo, C. Iván.
Módulo 2 Introducción a la Morfología I
EVAL.INTR: Simplificación
Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez ftp.gaps.ssr.upm.es/pub/TDV/DOC/ Tema2d.ppt Dpto. Señales, Sistemas y Radiocomunicaciones.
Tema 5. Evaluación del lenguaje infantil.
LA DISLEXIA REALIZADO POR: DIANA RAMOS MOREJÓN.
Sensibilidad a la rima y la aliteración.
FORMACIÓN BÁSICA – NIVEL I y II. Índice. Los Bloques y documentos adjuntos. Análisis de un bloque de contenidos. Partes y metodología. Los Ámbitos en.
Diseño de algoritmos La computadora puede realizar procesos y darnos resultados, sin que tengamos la noción exacta de las operaciones que realiza. Con.
TEMA 2 1.EL LÉXICO Y LOS DICCIONARIOS 2.Distintos tipos de tExtos
2.1. Didáctica de la Fonología Fonología y Fonética -Definiciones - Unidades básicas - Diferencias entre Fonología y Fonética - Nuestro objetivo:
LA COMUNICACIÓN Iconos Símbolos Indicios LENGUA Y LITERATURA
La Duración.
MODELO COGNITIVO DEL PROCESO DE ESCRITURA
Programación de Sistemas
SOLUCIÓN DE PROBLEMAS Y APRENDIZAJE DE CONTENIDOS.
Niveles de estudio de la lengua El nivel fónico El nivel morfológico
Las mínimas partes del idioma
Metodología para la construcción de programas
Niveles de la lingüística
¿Qué estudia la lingüística?
EVALUACIÓN DE LOS PROCESOS LECTORES, PROLEC
¿CÓMO SE ORGANIZA LA LENGUA?
LABORATORIO DE PROCESAMIENTO DIGITAL DE SEÑALES
Unidad 1. Introducción a los Compiladores.
Comunicación Oral y Escrita en Lengua Española I (Estudios Ingleses) Comunicación Oral y Escrita en Español (Lengua y Literatura Españolas) Tutorías Centro.
Dpto. Señales, Sistemas y Radiocomunicaciones
 Uno de los grandes retos identificados en diversas entidades y niveles escolares es el débil desarrollo de las competencias de lectura y escritura, observado.
Dpto. Señales, Sistemas y Radiocomunicaciones
LA LENGUA COMO SISTEMA DE SIGNOS. NIVELES DE ESTUDIO
ESTRUCTURA DE LA LENGUA:
Jeziel A. Echevarría Meléndez EDPE-2931-M70 Prof. M. Ramos.
C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.
Tecnologías del lenguaje
Desempeños. Etapas de la reforma educacional e implementación del cambio curricular.
LENGUA Y LITERATURA Curso
Programación de Sistemas
Este diccionario contiene todo tipo de definiciones de interés relacionadas con el mundo de la informática e Internet.
Componentes de la oración, categorías gramaticales y signos de pausa Profesora M. Soto ESPA 3101.
Proceso de comunicación superior: lectoescritura.
“La Gramática. Criterios gramaticales”
Trabajo practico ortografía
MORFOLÉXICO NIVELES LINGüÍSTICOS FONOLÓGICO O FONETOLÓGICO Correspondiente a los fonemas, es decir, con los sonidos. Además, incluye la entonación, acentuación.
Mayer cuatro procesos para hablar de la adquisición de la lectura: Reconocimiento de fonemas Decodificación de palabras Acceso al Significado Integración.
FONÉTICA FONOLOGÍA Sonid o Fonem a La Fonética trata de los sonidos del lenguaje (parte fónica expresiva) y se refiere a los sonidos (acústica) y cómo.
Transcripción de la presentación:

Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez ftp.gaps.ssr.upm.es/pub/TDV/DOC/ Tema4a.ppt Dpto. Señales, Sistemas y Radiocomunicaciones

Tratamiento Digital de Voz  Tema 4: Síntesis de Voz  Tipos de Síntesis de Voz y Aplicaciones  Principios básicos de sistemas de conversión de texto a voz  Sintetizadores de Voz  Sistemas y Dificultades

Síntesis de Voz  Tipos de Síntesis de Voz y Aplicaciones (A) Voz Pre-Grabada (codificación) (B) Conversión de Texto a Voz Text-to-Speech TTS (C) Conversión de Concepto a Voz Concept-to-Speech CTS Acceso a Inform. Telefónica Asistentes de Lectura Comunicadores y Ayudas para Discapacitados Locutores virtuales (visual – TTS) Otros: Enseñanza (I. Cervantes),.. ia.jsp?xml=/docs/ /0001.xml&x sl=/docs/plantillas/noticia.xsl

1791 El barón Wolfgang von Kempelen describió una máquina que reproducía fielmente la anatomía del aparato fonador humano

1835 Sistema parlante diseñado por Sir Charles Wheatstone

Sprachsynthese (TTS, Vocoder) Philipp S. Bach 1939 Homer Dudley’s “Voder”: Primer Sintetizador “electrónico” compuesto de: Un oscilador (controlado por un pedal) y una fuente de ruído blanco Diez filtros paso banda, con salida conectada a potenciómetros Algunos botones para generar consonantes como t, p, etc... Historie der Sprachsynthese Proseminar Sprachdialogsysteme

Síntesis de Voz  Principios básicos de sistemas de conversión de texto a voz Proceso Lingüístico-Prosódico Proceso de Señal Sonidos (pausas) Prosodia: o F0 o Duración o Energía Análisis del Texto Análisis Fonético Análisis Prosódico Modelos de Síntesis de Voz SINTETIZADOR Texto Voz

Síntesis de Voz  Principios básicos de sistemas de conversión de texto a voz  Proceso Lingüístico-Prosódico: Análisis del Texto Componentes: Detección de la Estructura del Texto Texto de Entrada Normalización del Texto Análisis Lingüístico

Síntesis de Voz  Principios básicos de sistemas de conversión de texto a voz  Proceso Lingüístico-Prosódico: Análisis del Texto Detección de la Estructura: –Segmentación de párrafos. –Separación de frases. –Tipos de frases. –Detección de estructura de SMS, , página web,... –Identificación del Idioma,... Detección de la Estructura del Texto Texto de Entrada Normalización del Texto Análisis Lingüístico

Síntesis de Voz  Principios básicos de sistemas de conversión de texto a voz  Proceso Lingüístico-Prosódico: Análisis del Texto Normalización del Texto: –Abreviaturas (Vd. Sr. ), acrónimos (CEE, BMW), etc. –Fechas, Horas, Cantidades, Números –Corrección automática de errores o expansión de formas de escritura (SMSs) –Identificación de palabras extranjeras,.. Detección de la Estructura del Texto Texto de Entrada Normalización del Texto Análisis Lingüístico

Síntesis de Voz  Principios básicos de sistemas de conversión de texto a voz  Proceso Lingüístico-Prosódico: Análisis del Texto Análisis Lingüístico: –Análisis sintáctico y semántico (posible) –Desambiguación de palabras. –Estructura de la frase. –Identificación de tipo de frase. Detección de la Estructura del Texto Texto de Entrada Normalización del Texto Análisis Lingüístico

Síntesis de Voz  Principios básicos de sistemas de conversión de texto a voz  Proceso Lingüístico-Prosódico: Análisis Fonético Componentes: Salida del Componente de Análisis de Texto Análisis Morfológico Conversión Letra-a-sonido (Grafema-a-alófono)

Síntesis de Voz  Principios básicos de sistemas de conversión de texto a voz  Proceso Lingüístico-Prosódico: Análisis Fonético Salida del Componente de Análisis de Texto Análisis Morfológico Conversión Letra-a-sonido (Grafema-a-alófono) Análisis Morfológico: –Palabras de función: pronombres, preposiciones, conjunciones (determinar sílabas, ej.: sublunar) –Palabras de contenido –Prefijos y sufijos, conjugaciones, plurales, aumentativos, etc –Descubrir homógrafas que cambian sentido Ej.: para (preposición) y para (verbo)

Síntesis de Voz  Principios básicos de sistemas de conversión de texto a voz  Proceso Lingüístico-Prosódico: Análisis Fonético Salida del Componente de Análisis de Texto Análisis Morfológico Conversión Letra-a-sonido (Grafema-a-alófono) Conversión Grafema-Alófono: –Soluciones basadas en diccionario Palabras divididas en morfemas (para disminuir diccionario) Si la palabra no está: usa reglas –Soluciones basadas en reglas: Reglas de conversión letras- fonemas + Tabla + algoritmos de excepciones

Síntesis de Voz  Principios básicos de sistemas de conversión de texto a voz  Proceso Lingüístico-Prosódico: Análisis Prosódico Componentes: Salida del Componente de Análisis Fonético Modelado de: Entonación Duración Intensidad Sonidos y pausas + F0, duración y Energía Módulo Pausador

Síntesis de Voz  Principios básicos de sistemas de conversión de texto a voz  Proceso Lingüístico-Prosódico: Análisis Prosódico Salida del Componente de Análisis Fonético Modelado de: Entonación Duración Intensidad Sonidos y pausas + F0, duración y Energía Módulo Pausador Módulo Pausador: –Decisión de dónde insertar pausas –ortográficas y no ortográficas- : Información gramatical: coeficientes de relación Número de sílabas –Asignación de la duración adecuada a las pausas

Síntesis de Voz  Principios básicos de sistemas de conversión de texto a voz  Proceso Lingüístico-Prosódico: Análisis Prosódico Salida del Componente de Análisis Fonético Modelado de: Entonación Duración Intensidad Sonidos y pausas + F0, duración y Energía Módulo Pausador Modelado Prosódico: –Modelos: Patrones pre-establecidos Basados en reglas Estocásticos, a partir de datos. –Modelado de F0 y duración: ¿independiente o conjunto? –Intensidad, generalmente sólo normalización

Síntesis de Voz MODELOS PROSÓDICOS Lineales o de Secuencia de Tonos – generar la curva de F0 de izquierda a derecha como una secuencia de valores o movimientos Escuela Británica – basada en análisis auditivo Pierrehumbert 1980 – análisis acústico (ToBI) Dutch school - ‘t Hart, Collier and Cohen 1990 – información perceptual Tilt - Taylor 1998 – base fonética Modelos Jerárquicos o de superposición: - generar el contorno de F0 modelando factores de forma aislada (fonema, sílaba, palabra, frase, sentencia) y luego combinar los modelos parciales. Fujisaki 1983, Grønnum 1992, Möbius et al. 1993, Tomás Navarro Tomás, Manual de Pronunciación Española (1945) New York: Hispanic Institute. Guadarrama