La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Dpto. Señales, Sistemas y Radiocomunicaciones

Presentaciones similares


Presentación del tema: "Dpto. Señales, Sistemas y Radiocomunicaciones"— Transcripción de la presentación:

1 Dpto. Señales, Sistemas y Radiocomunicaciones
Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez ftp.gaps.ssr.upm.es/pub/TDV/DOC/ Tema1b.ppt Dpto. Señales, Sistemas y Radiocomunicaciones

2 Fonética Acústica: Técnicas de Análisis
Transformación o Filtrado (Tracto Vocal) Excitación Periódica Segmento Sonoro

3 Propiedades acústicas:
Fonética Acústica: Técnicas de Análisis Propiedades acústicas de “segmentos sonoros”: Los sonidos tienen las siguientes propiedades acústicas, que se relacionan con las propiedades físicas: TONO (F. Fundamental) INTENSIDAD Propiedades acústicas: TIMBRE DURACIÓN

4 Fonética Acústica: Técnicas de Análisis
Tono (altura), Frecuencia Fundamental, Pitch: Frecuencia Fundamental (F0): frecuencia de vibración de las cuerdas vocales. En la voz humana, el tono depende del grosor y la elasticidad de las cuerdas vocales. Rango de variación entre 50 Hz y 400 Hz (mujeres: 220 Hz varones: 120 Hz. Variación para un mismo locutor en habla “normal”: 1 octava. Pitch : relacionado con la percepción de F0 (Ejemplo voz y ancho de banda telefónico)

5 Fonética Acústica: Técnicas de Análisis
Intensidad: Amplitud o energía de los sonidos (vocales mayor energía “en general”: considerar casos como relajación al final de las locuciones) Duración: Duración del sonido. Lenguas como el alemán, el italiano, el latín y algunas variedades del inglés (Received Pronunciation) distinguen entre sonidos largos y breves (p. ej., kin vs. keen). En español las vocales tónicas son un poco más largas que las vocales átonas, pero esta diferencia no es importante. En el inglés de EE. UU., las vocales tónicas son considerablemente más largas que las vocales átonas (p. ej., California).

6 Fonética Acústica: Técnicas de Análisis
Timbre: El timbre está formado por el fundamental y los armónicos. El timbre depende del tamaño, la forma y la composición de las cavidades supraglóticas. Timbre: relación con respuesta en frecuencia del tracto vocal : permite distinguir los diferentes sonidos (Reconocimiento de Habla)

7 Fonética Acústica: Técnicas de Análisis
Segmentos sonoros: J. Ortega EUITT) Vibración de las cuerdas vocales: frecuencia fundamental y armónicos 3-4 Formantes (resonancias del tracto) bien definidos: diferenciación entre sonidos 5 10 15 20 25 30 35 40 45 -0.5 -0.4 -0.3 -0.2 -0.1 0.1 0.2 0.3 0.4 0.5 Tiempo(ms) Estructura periódica, alta energía 1 2 3 4 6 7 8 -70 -60 -50 -40 -30 -20 -10 Frecuencia(KHz) Amplitud(dB) Estructura fina (armónicos) y formantes

8 Fonética Acústica: Técnicas de Análisis
Relación envolvente/frecuencia fundamental Mismo sonido (Misma envolvente espectral) Distinta frecuencia fundamental (Espaciamiento de armónicos) J. Ortega EUITT) 1 2 3 4 5 6 7 8 -70 -60 -50 -40 -30 -20 -10 Frecuencia(KHz) Amplitud(dB) Frecuencia fundamental: 122 Hz. Frecuencia fundamental: 196 Hz.

9 Fonética Acústica: Técnicas de Análisis
Sonido [i]: primer formante 250 Hz - segundo 2000 Hz (aprox.) Sonido [u] : primer formante 250 Hz - segundo 600 Hz (aprox.)

10 Introducción a la Fonética y Fonología Españolas
Capítulo 2

11 Clasificación de las vocales (1)
a) Localización anterior-posterior Vocales anteriores: El dorso de la lengua se levanta hacia el paladar duro. Vocales centrales: El dorso de la lengua se levanta hacia un punto intermedio entre el paladar duro y el velo del paladar. Vocales posteriores: El dorso de la lengua se levanta hacia el velo del paladar.

12 Clasificación de las vocales (2)
b) Altura: Vocales altas: El dorso de la lengua se levanta a una altura máxima. Vocales medias: El dorso de la lengua se levanta a una altura media. Vocales bajas: El dorso de la lengua se levanta a una altura mínima.

13 Clasificación de las vocales (3)
Triángulo vocálico: Si unimos los puntos más altos que alcanza la lengua en la articulación de las vocales obtenemos una figura llamada “triángulo vocálico” Descripción de las vocales: [i] vocal anterior alta [e] vocal anterior media [a] vocal central baja [o] vocal posterior media [u] vocal posterior alta Redondeamiento: Las vocales posteriores son redondeadas (se pronuncian con los labios redondeados). Las vocales anteriores son labializadas (se pronuncian con los labios estirados).

14 Carta de Formantes (aproximada)
Fonética Acústica: Técnicas de Análisis Carta de Formantes (aproximada) Alta (Cerrada) Baja (Abierta) Posterior Anterior

15 Segmento fricativo /s/
Fonética Acústica: Técnicas de Análisis Segmento fricativo /s/ Transformación o Filtrado (Tracto Vocal) Excitación Ruidosa Segmento fricativo

16 Fonética Acústica: Técnicas de Análisis
Sonidos sordos: Constricción tracto sin vibración cuerdas vocales Formantes (1-2) de alta frecuencia J. Ortega EUITT) 5 10 15 20 25 30 35 40 45 -0.5 -0.4 -0.3 -0.2 -0.1 0.1 0.2 0.3 0.4 0.5 Tiempo(ms) Aspecto ruidoso, baja energía 1 2 3 4 5 6 7 8 -70 -60 -50 -40 -30 -20 -10 Frecuencia(KHz) Amplitud(dB) Estructura aleatoria de alta frecuencia

17 T ; 1/T = Frecuencia Fundamental
Fonética Acústica: Técnicas de Análisis Modelo simplificado de Producción de Voz (VOCODER) T ; 1/T = Frecuencia Fundamental Filtro IIR (Todo Polos) Tracto Vocal Excitación Sonora Voz Excitación Ruidosa ENERGÍA

18 INFORMACIÓN PROSÓDICA
Fonética Acústica: Técnicas de Análisis Modelo DINÁMICO ENERGÍA: garantiza que la energía de la señal sintetizada = energía de la voz original DURACIÓN: pone de manifiesto el carácter dinámico del modelo. Ritmo, pausas, … FRECUENCIA FUNDAMENTAL: entonación y acentuación. INFORMACIÓN PROSÓDICA (PROSODIA)


Descargar ppt "Dpto. Señales, Sistemas y Radiocomunicaciones"

Presentaciones similares


Anuncios Google