La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Dpto. Señales, Sistemas y Radiocomunicaciones

Presentaciones similares


Presentación del tema: "Dpto. Señales, Sistemas y Radiocomunicaciones"— Transcripción de la presentación:

1 Dpto. Señales, Sistemas y Radiocomunicaciones
Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez ftp.gaps.ssr.upm.es/pub/TDV/DOC/ Tema5a.ppt Dpto. Señales, Sistemas y Radiocomunicaciones

2 Tratamiento Digital de Voz
Tema 4: Codificación de Voz Introducción a la Codificación de Voz Codificación de Forma de Onda => Paramétrica Codificación Híbrida CELP Estándares

3 Codificación de Voz Introducción Objetivo (I):
Representación digital de la señal voz analógica Ancho de banda: 4 KHz Telefonía 7 KHz Voz de Banda Ancha 20 KHz Audio Alta Fidelidad Mayor Calidad (recordar PESQ) posible  a la Menor Tasa Binaria (bits por segundo) posible

4 Codificación de Voz Introducción Objetivo (II):
Otras medidas de calidad: Robustez frente: Ruido Canal de Transmisión (Errores Tx) Retardo de Codificación (+ Retardo de Canal) Carga Computacional (Coste) Codificaciones en cadena y transcodificación Transmisión de datos en la banda de voz

5 Codificación de Voz Introducción
Objetivo (III): Aplicaciones: Transmisión GSM, UMTS VoIP (Session Initiation Protocol (SIP), H323) Almacenamiento To meet the demands of the changing business environment, to attract new customers, and to add to their portfolio of revenue-generating services, service providers are deploying converged voice-and-data services based on the Session Initiation Protocol (SIP). With its foundation in Internet protocols, SIP provides the ability to integrate traditional voice services with Web-based data services, including self-based provisioning, instant messaging, presence, and mobility services.

6 Codificación de Voz H.323 Extension of ITU-T standard H.320 that enables videoconferencing over LANs and other packet-switched networks, as well as video over the Internet. MGCP Media Gateway Control Protocol. Media Gateway Control Protocol is a protocol for the control of Voice over IP (VoIP) calls by external call-control elements known as media gateway controllers (MGCs) or call agents (CAs). SGCP Simple Gateway Control Protocol. Controls Voice over IP gateways by an external call control element (called a call-agent). This has been adapted to allow SGCP to control switch ATM Circuit Emulation Service circuits (called endpoints in SGCP). The resulting system (call-agents and gateways) allows for the call-agent to engage in Common Channel Signalling (CCS) over a 64-Kbps CES circuit, governing the interconnection of bearer channels on the CES interface.

7 Curso de Tecnologías del Habla
Asunción Moreno UPC

8 Sistema de comunicaciones

9 Codificación de Voz Introducción Familias de Codificadores
Codificadores de Forma de Onda: Buscan preservar la forma de onda de la señal de voz Codificadores Paramétricos: Preservan las características perceptualmente relevantes de la señal de voz recurriendo a un modelo simplificado de producción de voz. Codificadores Híbridos: Familia de codificadores basados en un modelo (paramétricos) pero capaces de preservar la forma de onda de la voz.

10 Codificación de Voz Introducción 2.4 4 8 16 32 64 kbps Calidad
Forma de Onda Codificadores Híbridos PCM G711 Excelente GSM VoIP ADPCM G721, G726 Calidad Buena CELP Aceptable Codificación Paramétrica VOCODERS Baja Vocoder LPC 2.4 4 8 16 32 64 kbps Velocidad de Transmisión

11 Codificación de Voz Codificación de Forma de Onda => Paramétrica
PCM Uniforme D = - + L y decisión de Niveles x Intervalos dor cuantifica del 1 2 : , ,..., 000 010 001 011 100 101 110 111 x(n) D xk yL xk+1 y1 error de cuantificación

12 ¿Para qué señal sería óptima?
Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM Uniforme ¿Para qué señal sería óptima? Distribución Uniforme: errores equidistribuidos Señal Estacionaria: max, min y escalones no varían Señal Incorrelada: no se “explota” la correlación entre muestras Las amplitudes de las muestras de Voz tienen una distribución aprox. Gamma, Laplaciana. La Voz no es estacionaria. Las muestras de Voz están correladas. Es posible una cuantificación más eficiente

13 PCM Uniforme => No-Uniforme
Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM Uniforme => No-Uniforme Utilizar intervalos xk y niveles de cuantificación yk óptimos Buscando Minimizar la varianza del error Las amplitudes de las muestras de Voz tienen una distribución aprox. Gamma, Laplaciana. Es posible una cuantificación más eficiente

14 PCM Uniforme => No-Uniforme
Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM Uniforme => No-Uniforme

15 PCM Uniforme => No-Uniforme
Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM Uniforme => No-Uniforme

16 PCM Uniforme => No-Uniforme
Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM Uniforme => No-Uniforme

17 Codificación de Voz Codificación de Forma de Onda => Paramétrica
PCM Uniforme => No-Uniforme (Log-PCM) x(n) y(n) yq(n) xq(n) Transmisor Receptor ITU-G Kbps (4KHz, 8000 muestras/seg) Ley-µ 14-bit lineal PCM a 8-bit logaritmico Ley-A 13-bit linear PCM a 8-bit logarítmico EQUIVALENTE PCM-UNIFORME 11 bits * 8000 m/seg 88 Kbps

18 Diferencial: Correlada (DPCM)
Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM => ADPCM Diferencial: Correlada (DPCM) Voz x(n) e ( n ) Q e ( n ) q + _ Transmisor $ ( ) x n ~ ( ) x n Predictor Se cuantifica PCM la diferencia entre la voz x(n) y su predicción: una señal más incorrelada DPCM

19 Adaptativa: No estacionaria (APCM)
Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM => ADPCM Adaptativa: No estacionaria (APCM) Q + _ Voz x(n) e ( n ) q $ x ~ Predictor Transmisor Adaptar, con las características de la voz, los niveles de cuantificación y el predictor ADPCM: G kbps G.726 PCM Ley-A/Ley-mu -> 16,24,32,40Kbps (MOS en torno a 4.0 a 32 kbps) Codificación Delta: CSVD (16 Kbps)

20 ¿Predictor ? => Predicción Lineal
Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM => ADPCM ~ ( ) x n e ( n ) q + + $ ( ) x n Predictor Receptor (Decodif.) El error de cuantificación de la voz = error de cuantificación sobre el error de predicción ¿Predictor ? => Predicción Lineal

21 Codificación de forma de onda
Asunción Moreno UPC

22 Q ITU G.721 a 32 Kbps A(z) B(z) A(z) B(z) z z
Esquema de predicción con 6 ceros y 2 polos (permite menos coeficientes) Q + _ x ( n ) e q $ z -1 ~ A(z) B(z) ~ ( ) x n + $ ( ) x n e q z -1 A(z) ~ -1) B(z) Algoritmo de estimación de los coeficientes simplificado (usando la función signo).

23 SIMPLIFICANDO EL PREDICTOR
Codificación de Voz Codificación de Forma de Onda => Paramétrica ADPCM => VOCODER + $ ( ) x n e q ~ Predictor Receptor (Decodif.) SIMPLIFICANDO EL PREDICTOR e q ( n ) ~ x

24 Mixed-Excitation Linear Prediction Coder (MELP) (1996)
Codificación de Voz Codificación de Forma de Onda => Paramétrica ADPCM => VOCODER Error de Predicción Cuantificado ~ ( ) x n e ( n ) q VOCODER LPC10(e) FS-1015 (1976) 2.4 Kbps MOS 2.3 7 MIPS Mixed-Excitation Linear Prediction Coder (MELP) (1996) MOS 3.2 40 MIPS f0 Gv generador de impulsos Voz + generador de ruido Gu

25 Codificadores Híbridos
Codificación de Voz Codificación de Forma de Onda => Paramétrica Codificadores Híbridos Error de Predicción Cuantificado ~ ( ) x n e ( n ) q “Soluciones Intermedias” f0 Gv generador de impulsos Voz + generador de ruido Gu

26 Codificadores de voz en banda ancha
Al aumentar el ancho de banda ( Hz) se consigue naturalidad (bajas frecuencias) inteligibilidad, especialmente en fricativas (altas frecuencias) Aplicaciones: Canal de 64 kbits/s de ISDN Difusión radio

27 ITU-T G.722 Entrada: frecuencia de muestreo: 16.000
resolución necesaria de cuantificación: 14 bits División de señal en dos bandas (filtros QMF) Cada banda se codifica mediante ADPCM banda inferior: 6 bits/muestra banda superior 2 bits/muestra Þ 64 kbits/s Retardo 3 milisegundos, complejidad baja El predictor de banda de baja frecuencia sólo utiliza en la predicción los 4 bits más significativos. Þ Es posible ignorar bits en transmisión: 64 kb/s, 56 kb/s, 48 kb/s. (embedded code)

28 canal auxiliar de datos
ITU-T G.722 canal auxiliar de datos 0, 8 ó 16 kbits/s ADPCM banda alta banda baja filtros QMF MUX Inserción datos 16 kbits/s 48 kbits/s Filtros QMF (de aplicación en todos los codificadores subbandas) Han de ser simétricos para combatir solapamiento entre bandas H1(f) H2(f) fm/4 fm/2 0.707 Debido al error de cuantificación se destruye la simetría entre bandas Þ ha de ser selectivo para minimizar solapamiento 24 coeficientes


Descargar ppt "Dpto. Señales, Sistemas y Radiocomunicaciones"

Presentaciones similares


Anuncios Google