La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Transmisión de Datos Multimedia - Master IC 2006/2007 Codificación y compresión de imagen  1. Introducción.  2. Características de la imagen.  2.1 Captura.

Presentaciones similares


Presentación del tema: "Transmisión de Datos Multimedia - Master IC 2006/2007 Codificación y compresión de imagen  1. Introducción.  2. Características de la imagen.  2.1 Captura."— Transcripción de la presentación:

1 Transmisión de Datos Multimedia - Master IC 2006/2007 Codificación y compresión de imagen  1. Introducción.  2. Características de la imagen.  2.1 Captura y digitalización de imagen.  2.2 Tipos de imagen  3. Compresión de imagen. Redundancia espacial.  3.1 Estándar JPEG  3.2 JPEG Escalado  3.3 Wavelets  4. Conclusiones. Bibliografía [FLU95] Understanding networked multimedia [GIB98] Digital Compression for Multimedia [TSU99] Introduction to video coding standards for multimedia communication [JPEGESC] JPEG escalado - Tesis [JPEGAD] JPEG image coding with adaptive quantization [JPEG2000] JPEG 2000 performance evaluation and assessment [Geo99] Wavelet-based Image Coding: An Overview [EZW] Embedded image coding using zerotrees of wavelet coefficients [LTW] Fast and efficient spatial scalable image compression using wavelet lower trees

2 Transmisión de Datos Multimedia - Master IC 2006/2007 2 1. Introducción  Las imágenes que percibimos están compuestas de ondas electromagnéticas ( : 250nm - 780nm).  A diferentes longitudes de onda, diferentes sensaciones de color.  El ojo es más sensible a unos colores que a otros.  Dadas tres fuentes de luz de la misma intensidad y distinto color (una roja, otra verde y otra azul), el ojo percibe la verde con el doble de intensidad que la roja, y seis veces más intensa que la azul.  Los mecanismos de percepción visual humanos son menos sensibles y estrictos que los auditivos.  Ej.: Variaciones de frecuencia, supresión de imágenes, etc.  Mezclando 3 colores (RGB) podemos obtener otro.  Integra la información que recibe.

3 Transmisión de Datos Multimedia - Master IC 2006/2007 3 2.1 Captura y digitalización de imagen I  Las imágenes digitales están compuestas de píxels (picture element).  Una cámara fotográfica digital utiliza un CCD (charge coupled device) para realizar el proceso de adquisición analógica.  El CCD tiene una serie de pequeños diodos sensibles a la luz que convierten luz en cargas eléctricas (o sea, fotones en electrones).  Cada diodo del CCD captura un píxel de la imagen a adquirir.  Para poder situar cada píxel de la imagen (luz entrante) en su diodo correspondiente del CCD se utiliza una lente.  Mediante la lente se puede conseguir también realizar zoom óptico (no confundir con zoom digital)

4 Transmisión de Datos Multimedia - Master IC 2006/2007 4 2.1 Captura y digitalización de imagen II  Problemática del color:  Si el CCD captura la luz directa que recibe de la lente, sólo tenemos la intensidad de luz, pero no su color.  Añadimos un filtro (R, G ó B) a cada píxel, de manera que algunos píxels reciben sólo la luz roja, otros la verde y otros la azul.  El número de píxels que reciben luz verde es el mismo que la suma de los que reciben luz roja y azul.  La información de color que no se ha obtenido en cada píxel se interpola directamente de sus vecinos, usando un DSP.

5 Transmisión de Datos Multimedia - Master IC 2006/2007 5 2.1 Captura y digitalización de imagen III  El CCD es un dispositivo analógico.  Es necesario un conversor analógico digital (ADC) que obtenga la representación digital de cada píxel a partir de la señal eléctrica generada por cada diodo.  Una cámara digital necesita un DSP para gestionar el funcionamiento de la cámara.  Realiza el acceso y almacenamiento de fotos en memoria, el proceso de compresión, la interpolación de los colores, gestión de menús, etc.  Uno de los más usados, el TMS320DSC24 de Texas Instruments, funciona a 80 Mhz y es utilizado por Kodak en sus productos.

6 Transmisión de Datos Multimedia - Master IC 2006/2007 6  Codificación y recodificación.  Cada muestra RGB se codifica con una cantidad de bits por componente de color (p.ej., 8 bits/componente → 24 bits/muestra).  A veces resulta interesante codificar el nivel de brillo de una muestra (luminancia, o componente Y) y las diferencias de color (crominancias azul, roja y verde, o componentes Cb, Cr, Cg).  La conversión de RGB a YCbCr (YUV) se realiza mediante una matriz de conversión (aproximada):  Y = 0.3R + 0.6G + 0.1B (Nivel de brillo o luminancia)  U = B - Y (Diferencia de color azul) (equiv. Cb=U/2+128)  V = R - Y (Diferencia de color rojo) (equiv. Cr=V/1.6+128)  Cada uno de los componentes se codifica con 8 bits.  Y (8 bits): rango 16-235  Cb (8 bits) y Cr (8 bits): rango 16-240 2.1 Captura y digitalización de imagen IV La diferencia de color verde (Cg) es redundante y no se almacena, ya que se puede obtener a partir de la Y, la Cb y la Cr.

7 Transmisión de Datos Multimedia - Master IC 2006/2007 7 2.1 Captura y digitalización de imagen V  Subsampling: El ojo es más sensible a la información de luminancia que de crominancia. Y Cb Cr 720 480 o 576 Y 720 480 o 576 Cb Cr 360 480 o 576 Formato 4:4:4 Y 720 480 o 576 Cb Cr 360 240 o 288 Y 720 480 o 576 Cb Cr 180 480 o 576 Formato 4:2:0 Formato 4:2:2 Formato 4:1:1 Muestra Cr + Muestra Cb Muestra Y

8 Transmisión de Datos Multimedia - Master IC 2006/2007 8 2.2 Tipos de imagen (según su resolución)  La resolución de una imagen se mide según el número de píxels por lado (ancho x alto).  En cámaras digitales se suele medir en Megapixels (millones de píxels por imagen) 1)Common Intermediate Format (CIF) (352x288): Utilizado habitualmente en videoconferencia (junto con Quarter CIF) 2)VGA (640x480): Usado por cámaras de baja calidad. 3)n-Megapixels: Ofrecido por cámaras de mayor calidad.  A veces, la resolución real de una cámara digital no coincide con la del CCD de esa misma cámara.  P.ej, una cámara de 3,3 MP ofrece una resolución de 2048x1536.  Parte de la circuitería del CCD que transporta los datos al ADC está situada en determinados diodos que no pueden ser usados.

9 Transmisión de Datos Multimedia - Master IC 2006/2007 Resumen  1. Introducción.  2. Características de la imagen.  2.1 Captura y digitalización de imagen.  2.2 Tipos de imagen (según su resolución)  3. Compresión de imagen. Redundancia espacial.  3.1 Estándar JPEG  3.2 JPEG Escalado  3.3 Wavelets  4. Conclusiones.

10 Transmisión de Datos Multimedia - Master IC 2006/2007 10 3. Compresión de imagen.  Una imagen suele presentar redundancia espacial:  Redundancia espacial:  Las imágenes tienen información redundante susceptible de ser eliminada o reducida (por ejemplo, el color del cielo en una foto suele ser uniforme y azul :-).  El proceso de compresión de imagen consistirá en: 1)Eliminar en la medida de lo posible la redundancia espacial utilizando técnicas de source encoding (normalmente mediante transformada matemática). 2)Codificar los datos obtenidos en el paso anterior usando entropy enconding (elimina aun más la redundancia espacial).  Para conseguir mayores índices de compresión, este proceso será con pérdidas (cuantización de los datos).

11 Transmisión de Datos Multimedia - Master IC 2006/2007 11 3.1 Redundancia espacial: JPEG  Es un estándar ISO (‘91) cuyo origen proviene del grupo JPEG (Joint Photographic Expert Group).  Codifica imágenes de tono-continuo  Dispone de cuatro modos de operación (incluyendo codificación sin perdidas).  Se definen una serie de parámetros que permiten codificar las imágenes para obtener una gran variedad de calidades de compresión.  Factor de compresión ronda 20:1*  Es un sistema de codificación simétrico.  Forma parte de otros estándares de compresión de secuencias de vídeo (MPEG y H.26*).

12 Transmisión de Datos Multimedia - Master IC 2006/2007 12 Prep. de bloques DCTCuantiz. Tabla Run Length Huffman Tabla Imagen original (RGB) Imagen codificada Codificación fuenteCodificación entrópica Codificación JPEG (pasos)  Codificación JPEG en modo secuencial con pérdidas  Paso 1: Preparación de la imagen.  No define el formato de imagen original.  Podría ser RGB, YUV, YIQ, YCrCb, etc.  Convierte la imagen a formato YCbCr utilizando una reducción de color 4:1:1 (sub-sampling)  Ej.: RGB 640x480 (VGA): Y (640x480), Cb y Cr (320x240)  Se divide la imagen en bloques de 8x8 elementos  Ej. anterior: 4800 bloques Y, 1200 Cb y 1200 Cr.

13 Transmisión de Datos Multimedia - Master IC 2006/2007 13 Fx Fy Coeficiente DCT Transformada DCT x y Amplitud Codificación JPEG: Transformada DCT  Paso 2: Transformada discreta del coseno (DCT).  Transforma un dominio de amplitudes al dominio de la frecuencia.  Las componentes frecuenciales más altas son susceptibles de ser eliminadas (percepción visual)  Se aplica esta transformada a cada bloque de 8x8 obteniendo la matriz de coeficientes DCT asociada  Componente (0,0): el nivel de continua DC del bloque (Media)

14 Transmisión de Datos Multimedia - Master IC 2006/2007 14 Codificación JPEG: Transformada DCT(II)  DCT-1D: (vector 8 elementos)  DCT-2D: (matriz 8x8 elementos) Transformada directa Transformada inversa

15 Transmisión de Datos Multimedia - Master IC 2006/2007 15 1507038164010 88562292000 21341240000 46370100 10502000 01000000 00000000 00000000 Coeficientes DCT 11248163264 11248163264 22248163264 44448163264 88888163264 16 3264 32 64 Tabla de cuantificación 150701940000 88561180000 1017610000 11120000 00000000 00000000 00000000 00000000 Coeficientes DCT cuantificados Codificación JPEG: Cuantificación  Paso 3: Cuantificación (quantization).  Se eliminan los coeficientes menos representativos de la DCT (transformación con pérdidas).  Cada coeficiente de la matriz 8x8 es dividido por un valor almacenado en una tabla (quantization table).  El estándar sugiere dos tablas una para la componente Y y otra para las componentes Cb y Cr.  Estas tablas se pueden escalar con otro parámetro Q que nos permitirá ajustar el índice de compresión requerido.

16 Transmisión de Datos Multimedia - Master IC 2006/2007 16 150701940000 88561180000 1017610000 11120000 00000000 00000000 00000000 00000000 150-70-88-10-56-19-4-11-17-1-0-1-6-8-0-0-0-1-1-0-0-0-0-0-2-..(39 0’s) 150-70-88-10-56-19-4-11-17-1-0-1-6-8-A0/3-A1/2-A0/5-2-A0/39 Codificación JPEG: Codificación entropía  Paso 4: Codificación DPCM de los componentes DC de cada bloque.  Bloques sucesivos tienen un valor medio muy similar.  Paso 5: Codificación run-length de todos los componente de un bloque.  Se hace un barrido “zig-zag” con el fin de agrupar todos los componentes nulos.

17 Transmisión de Datos Multimedia - Master IC 2006/2007 17 110001110011100010….. Huffman decoder Run-lenght decoder Zig-zag ordering Inverse Quantization Inverse DCT Codificación JPEG: Codificación entropía  Paso 6: Codificación estadística VLC: Huffman  A lo obtenido en el paso anterior se aplica el algoritmo de Huffman para comprimir aún más la información.  El resultado de este paso es lo que debemos enviar o almacenar.  La decodificación JPEG consiste en realizar el proceso inverso:

18 Transmisión de Datos Multimedia - Master IC 2006/2007 18 Codificación JPEG: Ejemplo real (Quant) DCT Bloque de muestras (pixels)Bloque de muestras transformadas IDCT Bloque de muestras cuantizadasBloque recuperado de muestras Quant

19 Transmisión de Datos Multimedia - Master IC 2006/2007 19 Codificación JPEG: Ejemplo real I (RLE+VLC) Bloque de muestras cuantizadas  Codificación RLE+VLC de los coeficientes cuantizados  Paso 1. Se codifica la DC usando codificación diferencial DPCM Si DC Bloque anterior es 98 → codificar 102-98 Se codifica como: Num. bits necesarios (tabla VLC) + codif + signo DC se codifica como: 101 100 0 Tabla para la DC

20 Transmisión de Datos Multimedia - Master IC 2006/2007 20 Codificación JPEG: Ejemplo real II (RLE+VLC)  Paso 2: Se codifica en zig-zag pares Tabla para pares Bloque de muestras cuantizadas Parte del bloque codificado con VLC Existe código de escape: 0000 01 RRRR RR NNNN NNNN

21 Transmisión de Datos Multimedia - Master IC 2006/2007 21 Codificación JPEG: Ejemplo real III (RLE+VLC) Bloque de muestras cuantizadas  Resultado final de la codificación RLE+VLC Bloque codificado con VLC  Tasa de compresión: (85 bits)  Stream final: 1011000010010100011100001101 … 000100110 (85 bits)  Bits por píxel: (Núm bits/ Núm píxels) 85/64= 1’33 bpp  Factor de compresión:  Tam_comprimida:Tam_original= 85:(8*8*8)= 85:512  1:Tam_original/Tam_comprimida= (85/85):(512/85)= 1:6

22 Transmisión de Datos Multimedia - Master IC 2006/2007 22 Medida objetiva del error: MSE (Mean Square Error) Medida objetiva de la calidad: PSNR (Peak SNR) Valores del ejemplo: MSE = 49’53 PSNR = 31’18 dB Codificación JPEG: Ejemplo real IV (Calidad) Bloque de muestras (pixels) Bloque recuperado de muestras

23 Transmisión de Datos Multimedia - Master IC 2006/2007 Resumen.  1. Introducción.  2. Características de la imagen.  2.1 Captura y digitalización de imagen.  2.2 Tipos de imagen (según su resolución)  3. Compresión de imagen. Redundancia espacial.  3.1 Estándar JPEG  3.2 JPEG Escalado  3.3 Wavelets  4. Conclusiones.

24 Transmisión de Datos Multimedia - Master IC 2006/2007 JPEG escalado  Motivación  Fundamentos del JPEG escalado  Compatibilidad con JPEG estándar  Cuantificación variable  Resultados

25 Transmisión de Datos Multimedia - Master IC 2006/2007 Motivación  Utilización de tamaño de bloque mayor: NxN.  Mayor compactación de energía pero mayor tiempo de cálculo.  Descartar coeficientes de alta frecuencia hasta quedarse con sólo una submatriz de 8x8.

26 Transmisión de Datos Multimedia - Master IC 2006/2007 Fundamentos del JPEG escalado  División de la imagen en bloques de NxN puntos conservando sólo los 8x8 primeros coeficientes.  Utilización de la DCT recortada de N a 8, modificada.  Utilización de nuevas matrices de cuantificación.  Elección de N=16.

27 Transmisión de Datos Multimedia - Master IC 2006/2007 El proceso de codificación/decodificación JPEG escalado Bloques de 16x16 Imagen IDCT 16x168x8 a 16x16 Descuanti-Decodifica. de entropía Decodificador de JPEG escalado Imagen comprimida ficador IDCT 16x16 recortada Bloques de 16x16 Imagen comprimida FDCT 16x1616x16 a 8x8 Cuantifi- cador Codificador de entropía Codificador de JPEG escalado FDCT 16x16 recortada

28 Transmisión de Datos Multimedia - Master IC 2006/2007 Original Tasa 24 - 180K Compresión 78:1 Tasa 0.3 - 2.2K Ejemplo de compresión JPEG escalado JPEG estándarJPEG escalado

29 Transmisión de Datos Multimedia - Master IC 2006/2007 Original Tasa 24 - 180K Compresión 128:1 Tasa 0.18 - 1.4K Ejemplo de compresión JPEG escalado (continuación) JPEG estándarJPEG escalado

30 Transmisión de Datos Multimedia - Master IC 2006/2007 Compatibilidad con JPEG estándar  Aunque el bloque de imagen es de 16x16 el de coeficientes es de 8x8 puntos.  Los coeficientes obtenidos se escalan para que estén en el rango de los que se obtienen en una DCT de 8x8.  Las funciones básicas son similares.  Se incluye información de tamaño real de la imagen, mediante códigos definidos para extensiones.

31 Transmisión de Datos Multimedia - Master IC 2006/2007 Comparación de la DCT de 8 y 16 puntos Funciones básicas de las DCT de 8 y 16 puntos

32 Transmisión de Datos Multimedia - Master IC 2006/2007 Mezcla de formatos ImagenLeída comoSe obtiene JPEG estándar JPEG escalado JPEG estándar JPEG escalado

33 Transmisión de Datos Multimedia - Master IC 2006/2007 Cuantificación variable  En el proceso de cuantificación se consigue la compresión a base de anular coeficientes Para conseguir más ceros hay que incrementar los valores Q vu, lo que afecta a todos los bloques

34 Transmisión de Datos Multimedia - Master IC 2006/2007 Cuantificación variable: propuesta  Utilización de una función de cuantificación con umbral. Sq vu       redondeo    S vu Q vu   ,si S vu Q vu  umbral 0,enotrocaso Clasificación de los bloques en categorías. Utilización de un umbral distinto para cada categoría.

35 Transmisión de Datos Multimedia - Master IC 2006/2007 Ejemplo de clasificación de bloques y asignación de umbrales Zona 1: Hasta 47 ceros Umbral 1,0 Zona 3: de 56 a 59 ceros Umbral 2,5 Zona 4: de 60 a 63 ceros Umbral 1,0 Zona 2: de 48 a 55 ceros Umbral 1,5

36 Transmisión de Datos Multimedia - Master IC 2006/2007 Ejemplo de cuantificación adaptativa: detalle de la cara de Lena Sin cuantificación adaptativa Con cuantificación adaptativa

37 Transmisión de Datos Multimedia - Master IC 2006/2007 Ejemplo de cuantificación adaptativa: detalle del sombrero de Lena Sin cuantificación adaptativa Con cuantificación adaptativa

38 Transmisión de Datos Multimedia - Master IC 2006/2007 Resultados Detalle de la cara de Lena a 0.25 bpp JPEG escalado con cuantificación adaptativa JPEG escaladoJPEG estándar

39 Transmisión de Datos Multimedia - Master IC 2006/2007 Detalle de la cara de Lena a 0.15 bpp JPEG escalado con cuantificación adaptativa JPEG escaladoJPEG estándar

40 Transmisión de Datos Multimedia - Master IC 2006/2007 Relación Señal-Ruido para distintas tasas de bits de la imagen Lena

41 Transmisión de Datos Multimedia - Master IC 2006/2007 Relación Señal-Ruido para distintas tasas de bits de la imagen Catedral

42 Transmisión de Datos Multimedia - Master IC 2006/2007 Relación del SNR de las imágenes con JPEG escalado y adaptativo frente al estándar


Descargar ppt "Transmisión de Datos Multimedia - Master IC 2006/2007 Codificación y compresión de imagen  1. Introducción.  2. Características de la imagen.  2.1 Captura."

Presentaciones similares


Anuncios Google