Introducción general a la compresión de datos multimedia

Slides:

Advertisements

Presentaciones similares

DIGITALIZACIÓN DE SEÑALES ANALOGICAS

Advertisements

COMPENSACIÓN DE MOVIMIENTO

M.I.A Daniel Alejandro García López

Convertidores A/D y D/A

CAP. 6 - DISTORSIÓN Ing. Verónica M.Miró 2011.

Modulación de pulsos.

Almacenamiento de imágenes digitales

¿QUE SON COMUNICACIONES DIGITALES?

Unidad 4 Transmisión Digital.

Códigos Detectores y Correctores de Errores

JPEG/JPG Integrantes:

Tema 6: Compresión de imagen

Transmisión Asíncrona

Teleprocesos y Comunicación de Datos I POR: ING. YVAN GÓMEZ

COMUNICACIONES ELÉCTRICAS ING. VERÓNICA M. MIRÓ 2011

ALGORITMOS DE COMPRESIÓN DE VIDEO

Repaso de Sistemas Lineales

Técnicas de Detección y Corrección de Errores

Codificación Distribuida

Ventajas de la señal digital Inconvenientes de la señal digital

 Multimedia: combinación de texto, sonido, imagen, animación o vídeo dentro de un mismo documento, con objeto de transmitir la información de un modo.

Introducción al diseño gráfico

Códigos IRA Máster en Multimedia y Comunicaciones

JPEG/JPG Aguilar López Donaji Cruz Ortiz Nora Elida

Tema 3. Digitalización y cuantificación   Las imágenes reales suelen ser continuas. Para poder trabajar con ellas en un ordenador, será necesario digitalizarlas.

GRUPO DE INVESTIGACION EN CONTROL INDUSTRIAL

MPEG1. Codificación de audio

Vectores Aleatorios 1 Distribución conjunta de un vector aleatorio

(Organización y Manejo de Archivos)

COMPRESION DE IMAGENES DIGITALES Jaime Lopez Carvajal Univalle Tulua 2008.

MÉTODO DE PIXELES DE BORDE

1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy.

U2. Grabación, edición y postproducción de audio

TEMA 2: Espectro Disperso

Capítulo 7 Gestión de memoria.

TRATAMIENTO DE LA IMAGEN Formatos Gráficos I.T. Diseño Industrial Curso 01/02.

COMPRESIÓN AUTORREGRESIVA Y CASI SIN PERDIDA Autores: Antonio Fernández Carpio Francisco José Lamela Rincón.

Informática Médica: Procesamiento de imágenes

TRANSFORMADA DE FOURIER EN EL PROCESAMIENTO DE IMAGENES

Problema de inclusión en una Curva Digital Por Orellana Muñoz, Alfonso Paz Vicente, Rafael Pérez Medina, Gerardo Rodríguez Naranjo.

Tema 3: Filtros.

Procesamiento de Imágenes Digitales Propagación del Error en Codificación de Video Escalable Pablo Fernández Riejos Roberto Fuentes González Francisco.

Procesamiento Digital de Imágenes

Procesamiento Digital de Imágenes

TEMA 2 CARACTERIZACIÓN FRECUENCIAL DE SEÑALES Y SISTEMAS

Sabemos reconocerlas, y calcularlas como soluciones de sistemas de ecuaciones, o de desigualdades Buscamos métodos de cálculo generales y eficientes Problemas.

Un modelo de computación no convencional: La Computación Cuántica

Digitalización y compresión de vídeo

Compresión de imágenes

Unidad 2 Bases Teóricas para la Comunicación Comunicación

Tema 4. VÍDEO DIGITAL.

E DICIÓN DE S ONIDO F EB La edición de audio es el proceso mediante el cual se elabora un documento sonoro a partir de otro u otros documentos.

Compresión de imágenes Carlos Miguel Calafate Visión por Computador 2002.

Punto 3 – Servicio de Vídeo Juan Luis Cano. El podcasting consiste en la distribución de archivos multimedia mediante un sistema de redifusión (RSS) que.

FUNDAMENTOS SOBRE P ROCESAMIENTO D IGILTAL DE I MÁGENES (DIP) Copyright 2004 para Diego Luis Aristizábal Ramírez OrquideaJAI Universidad Nacional de Colombia.

Modelos matemáticos del proceso de muestreo y retención

Clase 3 Tecnología de la Comunicación II Lics. en Com. Social y Periodismo F AC. DE C S. H UMANAS. UNSL. Creación y edición de audios digitales.

ARCHIVOS DE AUDIO.

Telecomunicaciones II

Metodología entrada al muestreador donde T es el intervalo de muestreo señal cuantificada El muestreo representa el tiempo de captura de una señal y es.

Codificaciones digitales

Telecomunicaciones II

Televisión y Multimedia

DETECCION DE SEÑALES BINARIAS EN RUIDO GAUSSIANO El criterio de toma de decisión fue descrito por la ecuación Un criterio muy usado para escoger el nivel.

DETECCION DE PSK DIFERENCIAL El nombre de PSK diferencial (DPSK) algunas veces necesita clarificación, debido a dos aspectos separados del formato de.

OPTIMIZACION DEL DESEMPEÑO DE ERROR

Técnicas numéricas para el procesamiento de datos reales Antonio Turiel Instituto de Ciencias del Mar de Barcelona.

CODIFICACION DE HUFFMAN

Transcripción de la presentación:

Introducción general a la compresión de datos multimedia

Necesidad de la compresión La mayoría de las aplicaciones multimedia requieren volúmenes importantes de almacenamiento y transmisión. CD-ROM 640 Mb Una película de 90 min. 120 Gb Un canal HDTV requiere 2 Gb/seg Por esta razón se hace imprescindible el uso de técnicas de compresión de las señales audiovisuales que permitan reducir considerablemente el volumen de información necesario para representarlas.

Introducción La compresión es un proceso que intenta alcanzar una representación mas compacta de la señal digital, mediante la eliminación de la redundancia existente en dicha señal. El objetivo es minimizar el caudal de bits necesario para su transmisión o almacenamiento, preservando la calidad de la señal. Las señales de audio y vídeo son interesantes desde el punto de vista de la compresión, debido a que contienen gran cantidad de información redundante que en gran parte puede eliminarse antes de su transmisión o almacenamiento.

Redundancia de la señal Redundancia espacial: Dentro de una imagen o de un cuadro de vídeo, existe una correlación significativa entre muestras vecinas. Redundancia temporal En secuencias de vídeo, hay también una correlación significativa entre muestras vecinas temporalmente. Hay una considerable información en la señal que es irrelevante desde un punto de vista perceptivo.

Aspectos básicos Un sistema de compresión consta de: Codificador Descodificador Codificador y descodificador pueden ser: Asimétricos El codificador es mucho mas complejo y lento que el descodificador (p.e. vídeo sobre demanda) Simétricos Coste computacional similar (p.e. videoconferencia) Con pérdidas o irreversible Adecuada para medios continuos (audio y vídeo) Mayores tasas de compresión Sin pérdidas o reversible Adecuada para ficheros de datos, imágenes, etc. Tasas de compresión muy moderadas.

Clasificación de la técnicas Sin pérdidas: de reproducción exacta, donde el audio, la imagen o secuencia de vídeo después del proceso de codificación y descodificación sigue siendo una copia fiel de la imagen original. Con pérdidas: donde parte de la información se pierde, y por tanto el audio, la imagen o secuencia de vídeo recuperada tras el proceso de codificación y descodificación no es una copia exacta de la original.

Clasificación de la técnicas Codificación de muestras: en la codificación de nuestras, se utiliza únicamente información de los píxeles o muestras individuales para comprimir la señal digital. Codificación perceptiva: estas técnicas tienen como base el conocimiento de la percepción psico-visual del ojo humano y de la percepción psico-acústica del oído humano. Codificación por transformada: las técnicas de codificación por transformada, transforman la información a otro dominio donde los datos están mucho mas de-correlados que en el dominio espacial, y la información se acumula en un pequeño número de muestras.

Clasificación de la técnicas Codificación predictiva: explotan la correlación temporal y espacial de las señales de audio, imágenes y vídeo para codificar eficientemente la información. Codificación sub-banda: se basa en dividir la señal en varias bandas de frecuencia y efectuar una compresión en cada una de las bandas de acuerdo a su importancia. Cuantificación vectorial: se utiliza en dispositivos de bajos recursos (PCs) y se basa en codificar un conjunto de muestras (vector) en base a una lista de vectores pre-establecidos. La asignación se realiza de forma que se minimice el error introducido.

Codificación de muestras PCM: Modulación de impulsos codificados Es una técnica muy común, en la cual se muestrea, cuantifica y codifica con un código apropiado de longitud fija. Normalmente 8 bits son suficientes para imágenes de emisión monocroma o videoconferencia, mientras que en imágenes médicas o señales de vídeo en color puede requerir de 10 a 12 bits por píxel. Para señales de audio, se utilizan entre 8 y 16 bits según la calidad deseada.

Codificación de muestras Cuantificación lineal En un cuantificador lineal, la relación entre la señal de entrada y la señal de salida es lineal. Es decir, el salto en cada paso del cuantificador es el mismo a lo largo de todo el rango. Cuantificadores lineales se utilizan con frecuencia en audio.

Codificación de muestras Cuantificación no lineal En un cuantificador no lineal, la relación entre la señal de entrada y la señal de salida no es lineal. Es decir, el salto en cada paso del cuantificador no es el mismo a lo largo de todo el rango. La cuantificación no lineal puede aplicarse a una señal PCM de cuantificación lineal. Se da mas resolución a las muestras de valor mas pequeño y menos resolución a las muestras de mayor valor.

Ejemplo de cuantificación no lineal

Codificación de muestras cuantificación logarítmica Se utilizan en telecomunicaciones con anchos de banda limitados (300 a 3100 Hz) Se pueden asignar mas bits a la parte de la señal de entrada que sea mas importante y así aumentar su resolución. A las partes menos importantes se le asignan menos bits, y por lo tanto tienen menos resolución. Esto no afecta en exceso a la calidad de la señal.

Ejemplo de cuantificación logarítmica Codificación USA Codificación europea

Codificación de muestras Run length encoding (RLE) Útil cuando se esperan largas sucesiones de un mismo valor (usualmente cero) entre cualquier otro par de valores. Estos patrones son frecuentes en multimedia. P. E. En audio (los silencios), en vídeo e imagen (fondos de un mismo color). Se codifica la longitud entre los dos valores diferentes. Es una compresión sin pérdidas.

Codificación de muestras Codificación de entropía I Según el teorema de Shanon, la entropía de una fuentes S, donde pi es la probabilidad de que el símbolo si ocurra en dicha fuente, es definida por la siguiente expresión: Por teoría de la información, si los símbolos son distintos, entonces el número medio de bits necesitados para codificarlos está siempre limitado por el valor de su entropía. En una señal codificada en n bits, hay 2n posibles valores para cada muestra (si la probabilidad de las muestras es igual, su entropía es n).

Codificación de muestras Codificación de entropía II Los codificadores de entropía se basan en asignar palabras de código de longitud variable a cada muestra. Asignan palabras cortas a los valores de muestras mas probables, y palabras largas a los valores de muestras menos probables. El modelo de probabilidad para la asignación de palabras de código, pueden obtenerse o directamente de los valores de entrada o de suposiciones previas sobre dichos valores. Los dos mecanismos más utilizados son la codificación Huffman, y la codificación Aritmética.

Codificación perceptiva Imágenes y vídeo Tiene como base el conocimiento de la percepción psico-visual del ojo humano. Una aplicación de la codificación perceptiva sería la generación de las señales de diferencia de color (YUV) a partir de RGB. El ojo humano no aprecia ningún cambio en la calidad de la señal.

Codificación perceptiva Audio Tienen como base el conocimiento de la percepción psico-acústica del oído humano. En la señal de audio está presente el fenómeno de enmascaramiento. Debido a este fenómeno, una señal fuerte hace imperceptibles otras señales más débiles.

Codificación por transformada Se utiliza para reducir la redundancia espacial de las señales. Se transforma la señal a otro dominio, en el cual, sólo unos pocos de los coeficientes contengan la mayor parte de la información, siendo el resto de coeficientes despreciables. En el nuevo dominio, la señal tendrá una representación mucho mas completa, y podrá ser representada por unos pocos coeficientes de la transformada. Presenta pérdidas despreciables.

Transformadas mas comunes Se utilizan las versiones rápidas siguientes basándose en su buen comportamiento en la compactación de la información: Karhunen Loeve (KLT) Fourier Discreta (DFT) Discreta del Coseno (DCT) (la mas común) Walsh Hadamard (WHT) Son costosas computacionalmente. El número de operaciones requeridas para su cálculo es del orden de n · log (n) para las transformadas rápidas y del n2 para las otras, siendo n el número de datos de la matriz (imágenes)

Codificación predictiva Eliminan la redundancia que existe en el dominio espacio-temporal en el que se representan las muestras. Se realiza prediciendo el valor de una muestra a través de su vecindad espacial o temporal, y codificando sólo la diferencia entre los valores predichos y los valores actuales de las muestras. El rango de las diferencias de las muestras es normalmente menor que el rango de las muestras individuales, y por lo tanto se necesitará un menor número de bits para codificar dicho rango. Los valores de las muestras de las señales (audio, vídeo e imágenes) tienden a no cambiar mucho entre dos muestras consecutivas.

Codificación Sub-banda Basada en transformada. La transformación entre dominios se realiza mediante un conjunto de filtros. La señal es dividida en múltiples bandas de frecuencia utilizando una combinación de filtros paso-bajo y paso-alto. La codificación sub-banda se basa en dividir la señal (unidimensional o bidimensional) en varias bandas de frecuencia y efectuar una compresión en cada una de las bandas de acuerdo a su importancia.

Cuantificación vectorial I Se utiliza cuando algunas aplicaciones requieren una descodificación en tiempo real. Procesa los bloques de datos directamente en el dominio espacial. Se basa en realizar un matching (búsqueda y comparación) entre cada vector real de entrada y una serie de vectores pre-establecidos y almacenados en una biblioteca de vectores. La compresión se alcanza al transmitir únicamente el índice. Durante el matching se busca en la biblioteca aquel vector que mas se asemeje al real y que minimice la distorsión producida entre el vector real y el encontrado.

Cuantificación vectorial II La biblioteca de vectores se crea a priori teniendo en cuenta un conjunto de imágenes representativas para que contenga la mayoría de vectores posibles. Las medidas de distorsión mas utilizadas son el Error cuadrático medio y el Error medio absoluto, por orden de complejidad y calidad creciente. Los algoritmos de búsqueda se basan en árboles binarios, por orden de complejidad y calidad decreciente.