1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy.

Slides:



Advertisements
Presentaciones similares
Sistema de Encriptación con Wavelets y Caos
Advertisements

Tipos de Formatos o Archivos de Audio Sandra García
CURVA DE RESPUESTA DE FRECUENCIAS
Procesamiento Digital de Señales (DSP)
U2. Grabación, edición y postproducción de audio
Formatos de Audio Un formato de archivo de audio es un contenedor multimedia que guarda una grabación de audio (música, voces, etc.).
DIGITALIZACIÓN DE SEÑALES ANALOGICAS
COMPENSACIÓN DE MOVIMIENTO
Servicios de video Tema 8 SRI Vicente Sánchez Patón I.E.S Gregorio Prieto.
RESPUESTA EN EL TIEMPO Es de interés analizar las dos partes en que puede dividirse normalmente la respuesta en el tiempo de un sistema físico: Respuesta.
CAP. 6 - DISTORSIÓN Ing. Verónica M.Miró 2011.
Ocultar datos en archivos de sonido
Unidad 4 Transmisión Digital.
JPEG/JPG Integrantes:
Mesa de Tejo II. Mesa de Tejo II Presentación para trabajar vectores: variación de velocidad, aceleración y fuerza.
Unidad académica: Ingenierías
Tema 6: Compresión de imagen
Comunicaciones Eléctricas
COMUNICACIONES ELÉCTRICAS ING. VERÓNICA M. MIRÓ 2011
ALGORITMOS DE COMPRESIÓN DE VIDEO
MODULACIÓN EN FRECUENCIA
Repaso de Sistemas Lineales
Ventajas de la señal digital Inconvenientes de la señal digital
Audio digital.
Deteccion y Correccion
CONTRASTE Y VALIDACIÓN DE UN MODELO
Tema 4: La compresión de datos
Procesamiento digital Parte 3 - Filtros
JPEG/JPG Aguilar López Donaji Cruz Ortiz Nora Elida
Análisis de series de tiempo Cuarta semana Abril Julio 2009.
GRUPO DE INVESTIGACION EN CONTROL INDUSTRIAL
Envolvente Compleja y Modulación
MPEG1. Codificación de audio
COMPRESION DE IMAGENES DIGITALES Jaime Lopez Carvajal Univalle Tulua 2008.
FUNDAMENTOS DEL FUNCIONAMIENTO
Detección de Silencio Basado en Umbral de Energía Auto-Ajustable Redes de Alta Velocidad Presentan:Felipe Galaz Cristian Romero Profesora: Marta Barría.
Introducción general a la compresión de datos multimedia
Doble Banda Lateral con Portadora Suprimida
Capacidad de Proceso.
AUDIO INTRODUCCION Multimedia EPS Kostadin Koroutchev.
Procesamiento de Imágenes Digitales Propagación del Error en Codificación de Video Escalable Pablo Fernández Riejos Roberto Fuentes González Francisco.
TEMA 2 CARACTERIZACIÓN FRECUENCIAL DE SEÑALES Y SISTEMAS
Respuesta: NO. Versión grafica del mismo argumento.
Representación RUNS conversiones entre representaciones matriz binaria y secuencia Juan Manuel García Sánchez Pablo de la Torre Moreno.
Digitalización y compresión de vídeo
Unidad 2 Bases Teóricas para la Comunicación Comunicación
MP3 es la abreviatura de Motion Picture Experts Group, (grupo de expertos de la imagen) y es un formato de archivo de sonido que tiene una alta calidad.
Asignatura: Sistemas de Comunicaciones I Técnicas de Multicanalizacion
Compresión de imágenes Carlos Miguel Calafate Visión por Computador 2002.
Punto 3 – Servicio de Vídeo Juan Luis Cano. El podcasting consiste en la distribución de archivos multimedia mediante un sistema de redifusión (RSS) que.
Modelos matemáticos del proceso de muestreo y retención
ARCHIVOS DE AUDIO.
Unidad 2 Técnicas de modulación.
MODEM Modulator/Demodulator. El por qué de los MODEMS El sistema telefónico análogo sigue siendo la principal facilidad utilizada para comunicación de.
Telecomunicaciones II
Televisión y Multimedia
PCM – DIGITALIZACIÓN DE SEÑAL ANALÓGICA
MODULACIÓN.
Televisión Digital standard ISDB-T
DETECCION DE SEÑALES BINARIAS EN RUIDO GAUSSIANO El criterio de toma de decisión fue descrito por la ecuación Un criterio muy usado para escoger el nivel.
DETECCION DE PSK DIFERENCIAL El nombre de PSK diferencial (DPSK) algunas veces necesita clarificación, debido a dos aspectos separados del formato de.
SEÑALIZACION M-ARIA Y DESEMPEÑO
FILTROS ACTIVOS Basados en AO. VENTAJAS:
OPTIMIZACION DEL DESEMPEÑO DE ERROR
(Digital Audio Broadcasting)
Desarrollo de un decoder de video H
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
Principios de Modulación 1. Se llama modulación a la operación mediante la cual ciertas características de una onda, denominada portadora, se modifican.
PCM – DIGITALIZACIÓN DE SEÑAL ANALÓGICA
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
Transcripción de la presentación:

1 Compresión de Audio

2 Existen básicamente dos tipos de compresión. Lossless Lossy

3 La compresión lossless produce una representación digital del audio que luego puede ser expandida a una réplica exacta. Para los esquemas lossy, los cambios sobre el original son irreversibles.

4 En ambos casos se busca eliminar la redundancia, sin embargo los codec con pérdidas buscan reducir también la información irrelevante.

5 Irrelevante llamaremos a aquella información que sea perceptualmente inaudible. Los criterios para evaluar la percepción se basarán en la psicoacústica.

6 Escala Bark Eberhard Zwicker en 1961 propuso una escala de frecuencias con bandas críticas (Barks). Esta escala se originó a partir de la escala Mel.

7 Bandas Críticas

8 Como se ha visto, esta modelización tiene una fuerte correlación con el comportamiento de la cóclea. Desde el punto de vista de la percepción, las bandas críticas pueden ser analizadas individualmente.

9 Volumen La noción de volumen fue estudiada en primer lugar por Fletcher y Munson en Hicieron mediciones trazando curvas para igual volumen percibido a distintas frecuencias.

10 Curvas Equal-Loudness

11 El oído es mas sensible en el rango 1-5kHz. Esto se explica en gran medida por la resonancia del canal auditivo y la función transferencia de los huesos del oído medio. Obsérvese que el umbral de audición varía desde 0 hasta 80dB SPL (!) Ver

12 Enmascaramiento Enmascaramiento Simultaneo En presencia de un tono, el umbral de audición a su alrededor varía. De esta manera, se “tapan” frecuencias que de lo contrario serían audibles. Enmascaramiento Temporal Si dos tonos cercanos son presentados secuencialmente. El primero es capaz de volver inaudible al segundo.

13 Enmascaramiento simultaneo Como ya vimos…

14 Enmascaramiento simultaneo

15 Enmascaramiento temporal Cualquier sonido dentro del área sombreada será enmascarado. Las colas exponenciales variarán su largo (no linealmente) en función de la duración del tono.

16 ¿Como podemos aprovechar esto?

17 Lo que hace es adaptar la cantidad de bits, para que el ruido de cuantización quede justo por debajo del enmascaramiento. Para esto, es conveniente el análisis del audio en bandas de frecuencia.

18 Compresor Lossy

19 MPEG - 1

20 MPEG - 1 MPEG-1 es un standard de compresión lossy para video y audio. Fue publicado en 1993 por el grupo “Moving Picture Expert Group“. Trabaja con frecuencias de sampleo de 32, 44.1, y 48 kHz. Bitrates desde 32 hasta 448kbit/s (Layer 1 Stereo).

21 MPEG - 1 Tiene 4 modos posibles: mono, stereo, dual (ideal para SAP) y joint stereo. Tiene definidas 3 capas. Cada una con algoritmos de complejidad progresiva. Las capas son inclusivas. Con el codec para Layer III es posible decodificar también Layer I y II.

22 Estructura de Codificador/Decodificador MPEG - 1 Layer I y II

23 Análisis multibanda El codec subdivide el espectro en 32 bandas de filtros equiespaciados. La implementación de los pasabandas se hace por filtros polifásicos.

24 Filtros polifásicos Consisten en una serie N (2 k ) de filtros equiespaciados. Se construyen con un filtro pasabajos base con f c =f s /4N, modulado por N senoidales. Se los usa porque requieren baja complejidad computacional.

25 Masking Thresholds Para fijar los umbrales, el codec MPEG-1 utiliza Threshold in quiet (Equal Loudness) Intra-band masking Simultaneous masking Non-simultaneous masking

26 Modelos Matemáticos Tanto para el enmascaramiento simultáneo como para el temporal. Se utilizan modelos matemáticos. Ambos propuestos por Ernst Terhardt. Con estos, se traza un umbral a partir del mínimo valor de la “máscara inaudible”. Uno por cada banda (JND).

27 Just Noticeable Distortion (JND)

28 Compresión Lossless Para la compresión lossless, el enfoque es totalmente distinto. Se busca codificar la redundancia como lo haría un zip, pero con algoritmos específicos para audio.

29 Esquema básico

30 Framing Para la división en frames, se evalúa Que el frame no sea excesivamente corto. Overhead en decodificación. Tampoco que sea demasiado largo. Baja adaptabilidad. En los algoritmos mas populares, el largo del frame va desde 13 a 26ms.

31 Intrachannel decorrelation La mayoría de los algoritmos remueven redundancia de los samples utilizando predictores lineales. De esta manera, la señal que se envía son los parámetros del predictor y la señal de error.

32 Intrachannel decorrelation Existen otros métodos (menos comunes), donde se calculan versiones de bajo bit- rate de la señal. Luego se envía sin pérdidas la diferencia entre esta y la señal original.

33 Modelo Predictor (Predicción) Feedforward Feedback

34 Modelo Predictor (Reconstrucción)

35 Filtros adaptativos Para reducir los tiempos de cálculo, en general, los compresores trabajan con listas de set de coeficientes. Se trabaja con punto fijo Facilita aritmética Es standard

36 Entropy coding Se usan fundamentalmente 3 métodos Run Length Coding Huffman Rice Coding

37 Rice Coding Los números a codificar se dividen en 3 partes. Bit de signo m números de la parte menos significativa. N ceros. Con N igual al número binario que quedó en la parte mas significativa. Un ‘1’ al final.

38 Rice Coding

39 Rice Coding La codificación Rice es un subset de la codificación Golomb. Es utilizado en esquemas adaptativos, porque sus parámetros se pueden ajustar. Se utiliza tanto en audio como en imagen.

40 Rice Coding El parámetro m es la clave para la compresión. Frame a frame, se lo recalcula Tiene la propiedad de adaptarse según la magnitud del error, siendo óptimo para señales que estadísticamente se mueven dentro de un rango.