La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez ftp.gaps.ssr.upm.es/pub/TDV/DOC/ Tema5a.ppt Dpto. Señales, Sistemas y Radiocomunicaciones.

Presentaciones similares


Presentación del tema: "Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez ftp.gaps.ssr.upm.es/pub/TDV/DOC/ Tema5a.ppt Dpto. Señales, Sistemas y Radiocomunicaciones."— Transcripción de la presentación:

1 Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez ftp.gaps.ssr.upm.es/pub/TDV/DOC/ Tema5a.ppt Dpto. Señales, Sistemas y Radiocomunicaciones

2 Tema 4: Codificación de Voz Introducción a la Codificación de Voz Codificación de Forma de Onda => Paramétrica Codificación Híbrida CELP Estándares Tratamiento Digital de Voz

3 Codificación de Voz Introducción Objetivo (I): Representación digital de la señal voz analógica Ancho de banda: o 4 KHz Telefonía o 7 KHz Voz de Banda Ancha o 20 KHz Audio Alta Fidelidad Mayor Calidad (recordar PESQ) posible a la Menor Tasa Binaria (bits por segundo) posible

4 Codificación de Voz Introducción Objetivo (II): Otras medidas de calidad: o Robustez frente: o Ruido o Canal de Transmisión (Errores Tx) o Retardo de Codificación (+ Retardo de Canal) o Carga Computacional (Coste) o Codificaciones en cadena y transcodificación o Transmisión de datos en la banda de voz

5 Codificación de Voz Introducción Objetivo (III): Aplicaciones: o Transmisión o GSM, UMTS o VoIP (Session Initiation Protocol (SIP), H323) o Almacenamiento To meet the demands of the changing business environment, to attract new customers, and to add to their portfolio of revenue-generating services, service providers are deploying converged voice-and-data services based on the Session Initiation Protocol (SIP). With its foundation in Internet protocols, SIP provides the ability to integrate traditional voice services with Web-based data services, including self-based provisioning, instant messaging, presence, and mobility services.

6 Codificación de Voz H.323 Extension of ITU-T standard H.320 that enables videoconferencing over LANs and other packet-switched networks, as well as video over the Internet. MGCP Media Gateway Control Protocol. Media Gateway Control Protocol is a protocol for the control of Voice over IP (VoIP) calls by external call-control elements known as media gateway controllers (MGCs) or call agents (CAs). SGCP Simple Gateway Control Protocol. Controls Voice over IP gateways by an external call control element (called a call-agent). This has been adapted to allow SGCP to control switch ATM Circuit Emulation Service circuits (called endpoints in SGCP). The resulting system (call-agents and gateways) allows for the call-agent to engage in Common Channel Signalling (CCS) over a 64-Kbps CES circuit, governing the interconnection of bearer channels on the CES interface.

7 Curso de Tecnologías del Habla Asunción Moreno UPC

8 Sistema de comunicaciones

9 Codificación de Voz Introducción Familias de Codificadores Codificadores de Forma de Onda: Buscan preservar la forma de onda de la señal de voz Codificadores Paramétricos: Preservan las características perceptualmente relevantes de la señal de voz recurriendo a un modelo simplificado de producción de voz. Codificadores Híbridos: Familia de codificadores basados en un modelo (paramétricos) pero capaces de preservar la forma de onda de la voz.

10 Codificación de Voz Introducción Calidad Excelente Buena Aceptable Baja kbps GSM ADPCM G721, G726 CELP 2.4 PCM G711 Codificación Paramétrica VOCODERS Codificación de Forma de Onda Codificadores Híbridos Velocidad de Transmisión Vocoder LPC VoIP

11 Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM Uniforme error de cuantificación L LL yydecisióndeNiveles xxxxdecisióndeIntervalos LdorcuantificadelNiveles :,,...,,: : x(n)x(n) xkxk yLyL x k+1 y1y1

12 Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM Uniforme ¿Para qué señal sería óptima? Distribución Uniforme: errores equidistribuidos Señal Estacionaria: max, min y escalones no varían Señal Incorrelada: no se explota la correlación entre muestras Las amplitudes de las muestras de Voz tienen una distribución aprox. Gamma, Laplaciana. La Voz no es estacionaria. Las muestras de Voz están correladas. Es posible una cuantificación más eficiente

13 Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM Uniforme => No-Uniforme Las amplitudes de las muestras de Voz tienen una distribución aprox. Gamma, Laplaciana. Es posible una cuantificación más eficiente Utilizar intervalos x k y niveles de cuantificación y k óptimos Buscando Minimizar la varianza del error

14 Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM Uniforme => No-Uniforme

15 Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM Uniforme => No-Uniforme

16 Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM Uniforme => No-Uniforme

17 Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM Uniforme => No-Uniforme (Log-PCM) x(n)x(n) y(n)y(n) yq(n)yq(n) xq(n)xq(n) Transmisor Receptor ITU-G Kbps (4KHz, 8000 muestras/seg) Ley-µ 14-bit lineal PCM a 8-bit logaritmico Ley-A 13-bit linear PCM a 8-bit logarítmico EQUIVALENTE PCM-UNIFORME 11 bits * 8000 m/seg 88 Kbps

18 Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM => ADPCM D Diferencial: Correlada (DPCM) Q + _ Voz x(n) e(n) e q (n) ()xn ~ ()xn Predictor Se cuantifica PCM la diferencia entre la voz x(n) y su predicción: una señal más incorrelada DPCM Transmisor

19 Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM => ADPCM A Adaptativa: No estacionaria (APCM) Adaptar, con las características de la voz, los niveles de cuantificación y el predictor ADPCM: G kbps G.726 PCM Ley-A/Ley-mu -> 16,24,32,40Kbps (MOS en torno a 4.0 a 32 kbps) Codificación Delta: CSVD (16 Kbps) Q + _ Voz x(n) e(n) e q (n) ()xn ~ ()xn Predictor Transmisor

20 Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM => ADPCM + + ()xn e q (n) ~ ()xn Predictor Receptor (Decodif.) El error de cuantificación de la voz = error de cuantificación sobre el error de predicción ¿Predictor ? => Predicción Lineal

21 Codificación de forma de onda Asunción Moreno UPC

22 Esquema de predicción con 6 ceros y 2 polos (permite menos coeficientes) ITU G.721 a 32 Kbps Q + _ x(n) e(n) e q (n) ()xn z ~ ()xn A(z) B(z) ~ ()xn + + ()xn e q (n) z A(z) ~ (-1)xn B(z) + + Algoritmo de estimación de los coeficientes simplificado (usando la función signo).

23 Codificación de Voz Codificación de Forma de Onda => Paramétrica ADPCM => VOCODER Receptor (Decodif.) + + ()xn e q (n) ~ ()xn Predictor SIMPLIFICANDO EL PREDICTOR e q (n) ~ ()xn

24 Codificación de Voz Codificación de Forma de Onda => Paramétrica ADPCM => VOCODER e q (n) ~ ()xn Error de Predicción Cuantificado f0f0 + generador de impulsos GvGv generador de ruido GuGu Voz VOCODER LPC10(e) FS-1015 (1976) 2.4 Kbps MOS MIPS Mixed-Excitation Linear Prediction Coder (MELP) (1996) 2.4 Kbps MOS MIPS

25 Codificación de Voz Codificación de Forma de Onda => Paramétrica Codificadores Híbridos e q (n) ~ ()xn Error de Predicción Cuantificado f0f0 + generador de impulsos GvGv generador de ruido GuGu Voz Soluciones Intermedias

26 Codificadores de voz en banda ancha Al aumentar el ancho de banda ( Hz) se consigue –naturalidad (bajas frecuencias) –inteligibilidad, especialmente en fricativas (altas frecuencias) Aplicaciones: –Canal de 64 kbits/s de ISDN –Difusión radio

27 ITU-T G.722 Entrada: –frecuencia de muestreo: –resolución necesaria de cuantificación: 14 bits División de señal en dos bandas (filtros QMF) Cada banda se codifica mediante ADPCM –banda inferior: 6 bits/muestra –banda superior 2 bits/muestra 64 kbits/s Retardo 3 milisegundos, complejidad baja El predictor de banda de baja frecuencia sólo utiliza en la predicción los 4 bits más significativos. Es posible ignorar bits en transmisión: 64 kb/s, 56 kb/s, 48 kb/s. (embedded code)

28 ITU-T G.722 canal auxiliar de datos 0, 8 ó 16 kbits/s ADPCM banda alta ADPCM banda baja filtros QMFMUX Inserción datos 16 kbits/s 48 kbits/s Filtros QMF (de aplicación en todos los codificadores subbandas) Han de ser simétricos para combatir solapamiento entre bandas H 1 (f) H 2 (f) fm/4fm/4 fm/2fm/ Debido al error de cuantificación se destruye la simetría entre bandas ha de ser selectivo para minimizar solapamiento 24 coeficientes


Descargar ppt "Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez ftp.gaps.ssr.upm.es/pub/TDV/DOC/ Tema5a.ppt Dpto. Señales, Sistemas y Radiocomunicaciones."

Presentaciones similares


Anuncios Google