Descargar la presentación
La descarga está en progreso. Por favor, espere
1
Dpto. Señales, Sistemas y Radiocomunicaciones
Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez ftp.gaps.ssr.upm.es/pub/TDV/DOC/ Tema5a.ppt Dpto. Señales, Sistemas y Radiocomunicaciones
2
Tratamiento Digital de Voz
Tema 4: Codificación de Voz Introducción a la Codificación de Voz Codificación de Forma de Onda => Paramétrica Codificación Híbrida CELP Estándares
3
Codificación de Voz Introducción Objetivo (I):
Representación digital de la señal voz analógica Ancho de banda: 4 KHz Telefonía 7 KHz Voz de Banda Ancha 20 KHz Audio Alta Fidelidad Mayor Calidad (recordar PESQ) posible a la Menor Tasa Binaria (bits por segundo) posible
4
Codificación de Voz Introducción Objetivo (II):
Otras medidas de calidad: Robustez frente: Ruido Canal de Transmisión (Errores Tx) Retardo de Codificación (+ Retardo de Canal) Carga Computacional (Coste) Codificaciones en cadena y transcodificación Transmisión de datos en la banda de voz
5
Codificación de Voz Introducción
Objetivo (III): Aplicaciones: Transmisión GSM, UMTS VoIP (Session Initiation Protocol (SIP), H323) Almacenamiento To meet the demands of the changing business environment, to attract new customers, and to add to their portfolio of revenue-generating services, service providers are deploying converged voice-and-data services based on the Session Initiation Protocol (SIP). With its foundation in Internet protocols, SIP provides the ability to integrate traditional voice services with Web-based data services, including self-based provisioning, instant messaging, presence, and mobility services.
6
Codificación de Voz H.323 Extension of ITU-T standard H.320 that enables videoconferencing over LANs and other packet-switched networks, as well as video over the Internet. MGCP Media Gateway Control Protocol. Media Gateway Control Protocol is a protocol for the control of Voice over IP (VoIP) calls by external call-control elements known as media gateway controllers (MGCs) or call agents (CAs). SGCP Simple Gateway Control Protocol. Controls Voice over IP gateways by an external call control element (called a call-agent). This has been adapted to allow SGCP to control switch ATM Circuit Emulation Service circuits (called endpoints in SGCP). The resulting system (call-agents and gateways) allows for the call-agent to engage in Common Channel Signalling (CCS) over a 64-Kbps CES circuit, governing the interconnection of bearer channels on the CES interface.
7
Curso de Tecnologías del Habla
Asunción Moreno UPC
8
Sistema de comunicaciones
9
Codificación de Voz Introducción Familias de Codificadores
Codificadores de Forma de Onda: Buscan preservar la forma de onda de la señal de voz Codificadores Paramétricos: Preservan las características perceptualmente relevantes de la señal de voz recurriendo a un modelo simplificado de producción de voz. Codificadores Híbridos: Familia de codificadores basados en un modelo (paramétricos) pero capaces de preservar la forma de onda de la voz.
10
Codificación de Voz Introducción 2.4 4 8 16 32 64 kbps Calidad
Forma de Onda Codificadores Híbridos PCM G711 Excelente GSM VoIP ADPCM G721, G726 Calidad Buena CELP Aceptable Codificación Paramétrica VOCODERS Baja Vocoder LPC 2.4 4 8 16 32 64 kbps Velocidad de Transmisión
11
Codificación de Voz Codificación de Forma de Onda => Paramétrica
PCM Uniforme D = - -¥ + L y decisión de Niveles x Intervalos dor cuantifica del 1 2 : , ,..., 000 010 001 011 100 101 110 111 x(n) D xk yL xk+1 y1 error de cuantificación
12
¿Para qué señal sería óptima?
Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM Uniforme ¿Para qué señal sería óptima? Distribución Uniforme: errores equidistribuidos Señal Estacionaria: max, min y escalones no varían Señal Incorrelada: no se “explota” la correlación entre muestras Las amplitudes de las muestras de Voz tienen una distribución aprox. Gamma, Laplaciana. La Voz no es estacionaria. Las muestras de Voz están correladas. Es posible una cuantificación más eficiente
13
PCM Uniforme => No-Uniforme
Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM Uniforme => No-Uniforme Utilizar intervalos xk y niveles de cuantificación yk óptimos Buscando Minimizar la varianza del error Las amplitudes de las muestras de Voz tienen una distribución aprox. Gamma, Laplaciana. Es posible una cuantificación más eficiente
14
PCM Uniforme => No-Uniforme
Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM Uniforme => No-Uniforme
15
PCM Uniforme => No-Uniforme
Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM Uniforme => No-Uniforme
16
PCM Uniforme => No-Uniforme
Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM Uniforme => No-Uniforme
17
Codificación de Voz Codificación de Forma de Onda => Paramétrica
PCM Uniforme => No-Uniforme (Log-PCM) x(n) y(n) yq(n) xq(n) Transmisor Receptor ITU-G Kbps (4KHz, 8000 muestras/seg) Ley-µ 14-bit lineal PCM a 8-bit logaritmico Ley-A 13-bit linear PCM a 8-bit logarítmico EQUIVALENTE PCM-UNIFORME 11 bits * 8000 m/seg 88 Kbps
18
Diferencial: Correlada (DPCM)
Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM => ADPCM Diferencial: Correlada (DPCM) Voz x(n) e ( n ) Q e ( n ) q + _ Transmisor $ ( ) x n ~ ( ) x n Predictor Se cuantifica PCM la diferencia entre la voz x(n) y su predicción: una señal más incorrelada DPCM
19
Adaptativa: No estacionaria (APCM)
Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM => ADPCM Adaptativa: No estacionaria (APCM) Q + _ Voz x(n) e ( n ) q $ x ~ Predictor Transmisor Adaptar, con las características de la voz, los niveles de cuantificación y el predictor ADPCM: G kbps G.726 PCM Ley-A/Ley-mu -> 16,24,32,40Kbps (MOS en torno a 4.0 a 32 kbps) Codificación Delta: CSVD (16 Kbps)
20
¿Predictor ? => Predicción Lineal
Codificación de Voz Codificación de Forma de Onda => Paramétrica PCM => ADPCM ~ ( ) x n e ( n ) q + + $ ( ) x n Predictor Receptor (Decodif.) El error de cuantificación de la voz = error de cuantificación sobre el error de predicción ¿Predictor ? => Predicción Lineal
21
Codificación de forma de onda
Asunción Moreno UPC
22
Q ITU G.721 a 32 Kbps A(z) B(z) A(z) B(z) z z
Esquema de predicción con 6 ceros y 2 polos (permite menos coeficientes) Q + _ x ( n ) e q $ z -1 ~ A(z) B(z) ~ ( ) x n + $ ( ) x n e q z -1 A(z) ~ -1) B(z) Algoritmo de estimación de los coeficientes simplificado (usando la función signo).
23
SIMPLIFICANDO EL PREDICTOR
Codificación de Voz Codificación de Forma de Onda => Paramétrica ADPCM => VOCODER + $ ( ) x n e q ~ Predictor Receptor (Decodif.) SIMPLIFICANDO EL PREDICTOR e q ( n ) ~ x
24
Mixed-Excitation Linear Prediction Coder (MELP) (1996)
Codificación de Voz Codificación de Forma de Onda => Paramétrica ADPCM => VOCODER Error de Predicción Cuantificado ~ ( ) x n e ( n ) q VOCODER LPC10(e) FS-1015 (1976) 2.4 Kbps MOS 2.3 7 MIPS Mixed-Excitation Linear Prediction Coder (MELP) (1996) MOS 3.2 40 MIPS f0 Gv generador de impulsos Voz + generador de ruido Gu
25
Codificadores Híbridos
Codificación de Voz Codificación de Forma de Onda => Paramétrica Codificadores Híbridos Error de Predicción Cuantificado ~ ( ) x n e ( n ) q “Soluciones Intermedias” f0 Gv generador de impulsos Voz + generador de ruido Gu
26
Codificadores de voz en banda ancha
Al aumentar el ancho de banda ( Hz) se consigue naturalidad (bajas frecuencias) inteligibilidad, especialmente en fricativas (altas frecuencias) Aplicaciones: Canal de 64 kbits/s de ISDN Difusión radio
27
ITU-T G.722 Entrada: frecuencia de muestreo: 16.000
resolución necesaria de cuantificación: 14 bits División de señal en dos bandas (filtros QMF) Cada banda se codifica mediante ADPCM banda inferior: 6 bits/muestra banda superior 2 bits/muestra Þ 64 kbits/s Retardo 3 milisegundos, complejidad baja El predictor de banda de baja frecuencia sólo utiliza en la predicción los 4 bits más significativos. Þ Es posible ignorar bits en transmisión: 64 kb/s, 56 kb/s, 48 kb/s. (embedded code)
28
canal auxiliar de datos
ITU-T G.722 canal auxiliar de datos 0, 8 ó 16 kbits/s ADPCM banda alta banda baja filtros QMF MUX Inserción datos 16 kbits/s 48 kbits/s Filtros QMF (de aplicación en todos los codificadores subbandas) Han de ser simétricos para combatir solapamiento entre bandas H1(f) H2(f) fm/4 fm/2 0.707 Debido al error de cuantificación se destruye la simetría entre bandas Þ ha de ser selectivo para minimizar solapamiento 24 coeficientes
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.