La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Dpto. Señales, Sistemas y Radiocomunicaciones

Presentaciones similares


Presentación del tema: "Dpto. Señales, Sistemas y Radiocomunicaciones"— Transcripción de la presentación:

1 Dpto. Señales, Sistemas y Radiocomunicaciones
Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez ftp.gaps.ssr.upm.es/pub/TDV/DOC/ Tema1a.ppt Dpto. Señales, Sistemas y Radiocomunicaciones

2 Tratamiento Digital de Voz
Tema 1: Producción de sonidos y fonética Mecanismo de producción y tipos de sonidos Fonética (nociones) Modelos Prácticos Tema 2: El oído y la percepción de voz Tema 3: Técnicas de Análisis Temas 4 a 7 Aplicaciones de TDV Codificación de Voz Reconocimiento de Habla Reconocimiento de Locutores Conversión Texto - Habla Sistemas Conversacionales

3 Mecanismo de Producción y Tipos de Sonidos
Procesado eficiente explotar características de la voz Características de la voz proceso de producción

4 Mecanismo de Producción

5 Mecanismo de Producción
Vibración Flujo de aire

6 Tipos de Sonidos Segmentos sonoros : vibración de las cuerdas vocales
Articulación de /o/ Articulación de /u/ Ejemplos: las vocales

7 Tipos de Sonidos Segmentos fricativos : estrechamiento y turbulencia
Articulación de /s/ Articulación de /f/ Ejemplos: sonidos [s], [f]

8 Tipos de Sonidos Segmentos oclusivos : cierre total, explosión
Articulación de /p/ Art. /b/ oclusiva Ejemplos: sonidos [p], [b]

9 Fonética (nociones) http://elies.rediris.es/elies4/
Estudios de Lingüística Española                 Volumen 4 (1999)            ISSN:                Depósito Legal: B LA TRANSCRIPCIÓN FONÉTICA AUTOMÁTICA DEL DICCIONARIO ELECTRÓNICO DE FORMAS SIMPLES FLEXIVAS DEL ESPAÑOL: ESTUDIO FONOLÓGICO EN EL LÉXICO Antonio Ríos Mestre

10

11

12

13

14

15 Fonética (nociones) Problemas del repertorio de fonemas del Español
Antonio Ríos Mestre (capítulo 4) Referencia: Joaquim Llisterri Grup de Fonètica Seminari de Filologia i Informàtica Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

16

17 Modelo Excitación- Filtro
Modelo y Parametrización de la Voz Contras Pros Modelo Físico dificultad analisis/re-síntesis medidas invasivas control flexible/intuitivo expresividad CO-ARTICULACIÓN fácil Modelo Excitación- Filtro menos expresivo CO-ARTICULACIÓN difícil Modelo Espectral análisis/re-síntesis fácil

18 Modelo y Parametrización de la Voz
Salida Sonido Nasal Cavidad Nasal Velo Cuerdas vocales Salida Sonido oral Cavidad faríngea Cavidad Oral lengua Pulmones Fuerza muscular

19 Periodo de apertura Periodo de cierre Fase Cerrada Fase Abierta

20 Modelo y Parametrización de la Voz
Interacción tracto-fuente: La forma de onda glotal depende, en general, de la configuración del tracto vocal Aproximación: Despreciar la interacción fuente-tracto ya que la impedancia glotal es muy ata casi siempre. Fuente Glotal Tracto Vocal (Filtro) Radiación Ruido de aspiración

21 Modelo y Parametrización de la Voz
Fuente Glotal Tracto Vocal (Filtro) Radiación Ruido de aspiración “Excitación glotal” Señal de Voz Forma de Onda Glotal Tracto Vocal (Filtro) Ruido de aspiración

22 Modelo del Tracto Vocal
Se modela como un filtro de todo-polos (Filtro IIR) El tracto vocal se representa como una serie de tubos uniformes y sin pérdidas concatenados. Se supone que el sonido se propaga como una onda plana a lo largo del tracto vocal. A1 A2 AN Alip Glotis Terminación en los labios 1-kN Ug Ulip -kN -1

23 Modelo del Tracto Vocal
1-km + + Um Um+1 Coeficiente De reflexión Am km -km Am+1 - - Um Um+1 1+km : tiempo de propagación de la onda sonora a través de un tubo. N : número de tubo desde la glotis hasta los labios Si el periodo de muestreo es T = 2 , puede demostrarse que la función de transferencia del tracto vocal es un filtro todo-polos de orden N Los coeficientes autoregresivos del filtro que modela el tracto vocal pueden convertirse en los km mediante el método de Durbin.

24 ----------------------
Modelo del Tracto Vocal 1 1 - S aiz-i s(n) Señal de Voz e(n) Señal de excitación

25 Análisis Visual de la Señal de Voz
Herramientas: Generales de Audio (tipo Cool Edit) Específicas de Voz Herramientas Específicas de Libre Distribución: Snack & WaveSurfer (KTH) (Referencias Joaquim Llisterri) ESPS (HTK) SFS Praat


Descargar ppt "Dpto. Señales, Sistemas y Radiocomunicaciones"

Presentaciones similares


Anuncios Google