Dpto. Señales, Sistemas y Radiocomunicaciones Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez ftp.gaps.ssr.upm.es/pub/TDV/DOC/ Tema1a.ppt Dpto. Señales, Sistemas y Radiocomunicaciones
Tratamiento Digital de Voz Tema 1: Producción de sonidos y fonética Mecanismo de producción y tipos de sonidos Fonética (nociones) Modelos Prácticos Tema 2: El oído y la percepción de voz Tema 3: Técnicas de Análisis Temas 4 a 7 Aplicaciones de TDV Codificación de Voz Reconocimiento de Habla Reconocimiento de Locutores Conversión Texto - Habla Sistemas Conversacionales
Mecanismo de Producción y Tipos de Sonidos Procesado eficiente explotar características de la voz Características de la voz proceso de producción
Mecanismo de Producción
Mecanismo de Producción Vibración Flujo de aire
Tipos de Sonidos Segmentos sonoros : vibración de las cuerdas vocales Articulación de /o/ Articulación de /u/ Ejemplos: las vocales
Tipos de Sonidos Segmentos fricativos : estrechamiento y turbulencia Articulación de /s/ Articulación de /f/ Ejemplos: sonidos [s], [f]
Tipos de Sonidos Segmentos oclusivos : cierre total, explosión Articulación de /p/ Art. /b/ oclusiva Ejemplos: sonidos [p], [b]
Fonética (nociones) http://elies.rediris.es/elies4/ Estudios de Lingüística Española Volumen 4 (1999) ISSN: 1139-8736 Depósito Legal: B-39200-99 LA TRANSCRIPCIÓN FONÉTICA AUTOMÁTICA DEL DICCIONARIO ELECTRÓNICO DE FORMAS SIMPLES FLEXIVAS DEL ESPAÑOL: ESTUDIO FONOLÓGICO EN EL LÉXICO Antonio Ríos Mestre http://elies.rediris.es/elies4/
Fonética (nociones) Problemas del repertorio de fonemas del Español Antonio Ríos Mestre (capítulo 4) Referencia: http://liceu.uab.es/~joaquim/home.html Joaquim Llisterri Grup de Fonètica Seminari de Filologia i Informàtica Departament de Filologia Espanyola, Universitat Autònoma de Barcelona
Modelo Excitación- Filtro Modelo y Parametrización de la Voz Contras Pros Modelo Físico dificultad analisis/re-síntesis medidas invasivas control flexible/intuitivo expresividad CO-ARTICULACIÓN fácil Modelo Excitación- Filtro menos expresivo CO-ARTICULACIÓN difícil Modelo Espectral análisis/re-síntesis fácil
Modelo y Parametrización de la Voz Salida Sonido Nasal Cavidad Nasal Velo Cuerdas vocales Salida Sonido oral Cavidad faríngea Cavidad Oral lengua Pulmones Fuerza muscular
Periodo de apertura Periodo de cierre Fase Cerrada Fase Abierta
Modelo y Parametrización de la Voz Interacción tracto-fuente: La forma de onda glotal depende, en general, de la configuración del tracto vocal Aproximación: Despreciar la interacción fuente-tracto ya que la impedancia glotal es muy ata casi siempre. Fuente Glotal Tracto Vocal (Filtro) Radiación Ruido de aspiración
Modelo y Parametrización de la Voz Fuente Glotal Tracto Vocal (Filtro) Radiación Ruido de aspiración “Excitación glotal” Señal de Voz Forma de Onda Glotal Tracto Vocal (Filtro) Ruido de aspiración
Modelo del Tracto Vocal Se modela como un filtro de todo-polos (Filtro IIR) El tracto vocal se representa como una serie de tubos uniformes y sin pérdidas concatenados. Se supone que el sonido se propaga como una onda plana a lo largo del tracto vocal. A1 A2 AN Alip Glotis Terminación en los labios 1-kN Ug Ulip -kN -1
Modelo del Tracto Vocal 1-km + + Um Um+1 Coeficiente De reflexión Am km -km Am+1 - - Um Um+1 1+km : tiempo de propagación de la onda sonora a través de un tubo. N : número de tubo desde la glotis hasta los labios Si el periodo de muestreo es T = 2 , puede demostrarse que la función de transferencia del tracto vocal es un filtro todo-polos de orden N Los coeficientes autoregresivos del filtro que modela el tracto vocal pueden convertirse en los km mediante el método de Durbin.
---------------------- Modelo del Tracto Vocal 1 ---------------------- 1 - S aiz-i s(n) Señal de Voz e(n) Señal de excitación
Análisis Visual de la Señal de Voz Herramientas: Generales de Audio (tipo Cool Edit) Específicas de Voz Herramientas Específicas de Libre Distribución: Snack & WaveSurfer (KTH) http://www.speech.kth.se/software/ (Referencias Joaquim Llisterri) ESPS (HTK) SFS Praat