Matemática, compresión de imágenes y huellas dactilares Dra. Liliana R. Castro Depto. de Matemática (UNS) – IIIE (UNS-CONICET)
Imágenes Imagen analógica Imagen digital
Imágenes digitales Cada cuadradito se denomina píxel (picture element) intensidad Cada cuadradito se denomina píxel (picture element) R: intensidad del rojo G: intensidad del verde B: intensidad del azul Cada píxel tiene un único color
Imágenes digitales Las imágenes en tonos de grises tienen un único valor por píxel. Las imágenes color tienen tres valores por píxel. Las imágenes color ocupan mayor lugar de almacenamiento.
Imágenes digitales 572 filas x 768 columnas 393.216 píxeles 0=negro 128=gris medio 255=blanco
Imágenes digitales 572 filas x 768 columnas 393.216 píxeles 0=negro 128=gris medio 255=blanco
Imágenes digitales 0=negro 128=gris medio 255=blanco 150 154 160 157 106 140 147 142 141 132 171 117 136 144 159 125 121 143 153 138 155 164 169 162 152 190 175 161 158 168 185 203 139 151 145 167 179 165 163 131 51 124 166 119 148 146 66 129 174 156 173 172 170 200 198 189 196 191 188 177 186 180
Imágenes digitales 0=negro 128=gris medio 255=blanco 150 154 160 157 106 140 147 142 141 132 171 117 136 144 159 125 121 143 153 138 155 164 169 162 152 190 175 161 158 168 185 203 139 151 145 167 179 165 163 131 51 124 166 119 148 146 66 129 174 156 173 172 170 200 198 189 196 191 188 177 186 180
Imágenes digitales: almacenamiento ¿Cómo se guardan las imágenes digitales? bit: unidad fundamental de una computadora toma los valores 0 ó 1 byte: unidad fundamental de almacenamiento de una PC está compuesto por 8 bits Es posible almacenar 28=256 bytes valores diferentes de brillo ó intensidad. La imagen tiene 512x768 píxeles; por lo tanto necesitará 512 x768 x 8 = 3.145.728 bits
Imágenes digitales: almacenamiento Para una imagen color de igual número de píxeles, harían falta ¡9.437.184 bites! Los bits de la imagen se concatenan formando una “tira” (stream) de unos y ceros de 3.145.768 elementos (9.437.184). Para almacenarla, una imagen se separa generalmente en dos partes El encabezamiento Ancho de la imagen Alto de la imagen Formato de la imagen (escala de grises, color verdadero, …) Cantidad de bits por píxel (no siempre son 8 …) Técnica de compresión utilizada La imagen misma
Imágenes digitales: almacenamiento Dependerá de la aplicación la resolución espacial (cantidad de píxeles) que elijamos para almacenarlas.
Imágenes digitales: qué hacemos con ellas Las imágenes Las almacenamos, es decir guardamos los datos que la componen en forma electrónica. Las transportamos, es decir transferimos dichos datos, por ejemplo, a través de la red . La resolución de una imagen está vinculada a la cantidad de píxeles y, por lo tanto, a la cantidad de bytes necesarios para almacenarla. Generalmente se habla del tamaño. Más resolución mayor tamaño más tiempo para transportarla
Imágenes digitales: qué hacemos con ellas Tamaño de los datos Transporte de los datos
Compresión ¿Qué es? ¿Para qué? La compresión de imágenes es una operación que permite reducir el tamaño de los datos que representan una imagen digital. ¿Para qué? El objetivo de esta operación es representar una imagen en una forma más compacta, con algún nivel de calidad especificado.
Compresión ¿Relación de compresión? La relación de compresión da una idea del nivel de compresión logrado y se utiliza como una medida de la calidad de compresión de un método. Se expresa como M:1 y significa que el método de compresión permite almacenar M imágenes comprimidas en lugar de una sin comprimir.
El jugo que se recupera tiene sabor similar al del original Compresión ¿Qué realizan las operaciones de compresión? Extraen información esencial de la imagen de modo tal que la misma pueda ser exactamente reconstruida. Este proceso de recontrucción se denomina descompresión. El agua es el elemento redundante Se guarda y se transporta El jugo que se recupera tiene sabor similar al del original Jugo recién exprimido
Compresión: esquemas Los esquemas de compresión de imágenes se dividen en dos grandes grupos esquemas de compresión sin pérdidas, esquemas de compresión con pérdidas. 1 2 0 0 0 0 8 7 7 7 7 7 6 Secuencia original Secuencia comprimida, sin pérdida 1 2 0 *4 8 7 *5 6 Secuencia comprimida, con pérdida 0 *6 7 *7
Compresión: esquemas Los esquemas de compresión de imágenes se dividen en dos grandes grupos esquemas de compresión con pérdidas, esquemas de compresión sin pérdidas. De acuerdo a los requerimientos de la aplicación, será el tipo de esquema a utilizar. La diferencia entre los esquemas de compresión es el algoritmo que utilizan para la compresión y descompresión de una imagen.
Compresión y matemática ¿Cómo aparece la matemática en los esquemas de compresión? Almacenar TODOS los puntos del segmento. Y y = mx+b No se aplica ningún tipo de compresión a los datos. (x1, y1) (x0, y0) X
Compresión y matemática ¿Cómo aparece la matemática en los esquemas de compresión? Almacenar TODOS los puntos del segmento. Y y = mx+b No se aplica ningún tipo de compresión a los datos. (x1, y1) (x0, y0) Almacenar m, b y los puntos inicial y final del segmento (6 datos). X
Compresión y matemática ¿Cómo aparece la matemática en los esquemas de compresión? Almacenar TODOS los puntos del segmento. Y y = mx+b No se aplica ningún tipo de compresión a los datos. (x1, y1) (x0, y0) Almacenar m, b y los puntos inicial y final del segmento (6 datos). X Se comprimen los datos teniendo en cuenta que es un segmento de recta.
Compresión y matemática Podemos hacer lo mismo en caso de una parábola: y = ax2 + bx + c Y Almacenar a, b, c (coeficientes) y los puntos inicial y final del segmento (dónde comienza y termina el gráfico): 7 datos. (x1, y1) (x0, y0) En ambos casos, con menor cantidad de información podemos reconstruir la imagen. X
Compresión y matemática Existen otras funciones matemáticas para representar las imágenes. Guardar las imágenes utilizando esas funciones equivale a guardar los coeficientes. Si se guardan TODOS los coeficientes, tendríamos compresión sin pérdidas. Si se guardan PARTE de los coeficientes, seleccionados con algún criterio, tendríamos compresión con pérdidas.
Compresión y matemática Existen otras funciones matemáticas para representar las imágenes. Guardar las imágenes utilizando esas funciones equivale a guardar los coeficientes. Si se guardan TODOS los coeficientes tendríamos compresión sin pérdidas. Si se guardan PARTE de los coeficientes, seleccionados con algún criterio, tendríamos compresión con pérdidas. Premisa de la compresión: conservar la calidad de la imagen reconstruida, según lo requiera la aplicación.
Compresión y formato ¿Qué formatos utilizan esquemas de compresión? Algunos de los formatos más conocidos BMP GIF JPG TIFF PNG
Compresión y formato ¿Qué formatos utilizan esquemas de compresión? Algunos de los formatos más conocidos BMP (BitMaP) Se utiliza para algunos gráficos. Utiliza un esquema de compresión sin pérdidas. Los archivos tienden a ser grandes. 2:1 GIF JPG TIFF PNG
Compresión y formato ¿Qué formatos utilizan esquemas de compresión? Algunos de los formatos más conocidos BMP GIF (Graphics Interchange Format) 256 colores. Para imágenes simples o solamente delineadas. Permite guardar varias imágenes y mostrarlas secuencialmente en intervalos definidos por el usuario. JPG TIFF PNG
Compresión y formato ¿Qué formatos utilizan esquemas de compresión? Algunos de los formatos más conocidos BMP (o JPEG, Joint Photographic Exchange Group) Admite rango completo de colores. Es el más utilizados para imágenes fotográficas. Utiliza un algoritmo de compresión con pérdidas basado en la denominada Transformada Coseno Discreta (TCD). Permite diferentes relaciones de compresión. Admite transmisión progresiva. GIF JPG TIFF PNG
Compresión y formato ¿Qué formatos utilizan esquemas de compresión? Algunos de los formatos más conocidos BMP GIF (Tagged Image File Format) Admite rango completo de colores. Para almacenar y transportar gráficos o imágenes que no permiten pérdida de calidad. Utiliza esquema de compresión sin pérdidas. 2:1 Los archivos son muy grandes. JPG TIFF PNG
Compresión y formato ¿Qué formatos utilizan esquemas de compresión? Algunos de los formatos más conocidos BMP GIF JPG (Portable Network Graphics) Admite rango completo de colores. Utiliza un algoritmo de compresión sin pérdidas. Reemplaza al GIF para aplicaciones en la red. TIFF PNG
Compresión y formato ¿Qué formatos utilizan esquemas de compresión? Un formato menos conocido … JPG2000
Compresión y formato ¿Qué formatos utilizan esquemas de compresión? Un formato menos conocido … JPG2000 Admite rango completo de colores. Se utiliza para imágenes fotográficas pero no ha sido adoptado como un estándar. El algoritmo de compresión está basado en la denominada Transformada Wavelet Discreta (TWD). Permite compresión con pérdidas y compresión sin pérdidas. Permite transmisión progresiva.
Huellas dactilares ¿Qué es una huella dactilar? Es la impresión visible o moldeada que produce el contacto de las crestas papilares de un dedo de la mano sobre una superficie. Se utiliza generalmente el pulgar o el índice. Es una característica individual que se utiliza como medio de identificación de las personas.
Huellas dactilares Cresta papilar: son glándulas de secreción de sudor situadas en la dermis. Una vez el sudor sale, se derrama por todas las crestas y se mezcla con la grasa natural de la piel dando lugar lugar a que, cuando se toque o manipule un objeto apto para la retención de huellas, las crestas dejen una impresión en el mismo.
Huellas dactilares Dicho sistema de identificación fue inventado por Juan Vucetich, nacido en Croacia actual y nacionalizado argentino. En 1891 la policía bonaerense inició el registro de huellas dactilares. El invento se desarrolló y patentó en Argentina, donde se usó por primera vez en 1892 el sistema de identificación de huellas para esclarecer un crimen. El primer archivo dactiloscópico en América Latina se fundó en México, en el año 1914.
Huellas dactilares Inicialmente Vucetich determinó ciento un rasgos de las huellas para clasificarlas en cuatro grandes grupos. Luego simplificó el método basándolo en cuatro rasgos principales: arcos, lazo derecho, lazo izquierdo, y espirales. Hoy aún se utilizan, entre otros, estos rasgos. Lazos Arcos Espirales
Huellas dactilares: almacenamiento El FBI y el problema del almacenamiento Actualmente poseen 250 millones de huellas recolectadas en tarjetas y unas 80 millones fueron digitalizadas. Por día llegan al archivo de datos alrededor de 37000 tarjetas y unas 7000 por día son almacenadas electrónicamente.
Ejemplo de una tarjeta de huellas dactilares Huellas dactilares: almacenamiento Ejemplo de una tarjeta de huellas dactilares
Huellas dactilares: almacenamiento Cada tarjeta es escaneada utilizando at 500 dpi y con una escala de grises de 8 bits. Cada tarjeta tiene 455 x 975 píxeles y requiere alrededor de 10.7 MB de disco para ser almacenada. Usando técnicas de compresión, el tamaño de la base de datos es de más de … ¡800 terabytes! (1 TB=1012 bytes) En primer lugar se utilizó el formato JPG para guardar las imágenes pero los resultados no fueron aceptables.
Huellas dactilares: almacenamiento Vista parcial de una huella digital escaneada a 500 dpi. La misma vista parcial de la huella almacenada en JPG.
Huellas dactilares: almacenamiento El efecto de bloques producido por el esquema de compresión no permite distinguir las características únicas de las huellas.
Huellas dactilares: almacenamiento Solución En 1993 el FBI adoptó un esquema de compresión basado en la herramienta matemática Wavelet Packets, el estándar denominado Wavelet Scalar Quantization (WSQ). Con este esquema de compresión es posible lograr mayor nivel de compresión y mejor calidad. Se continúa trabajando no solamente en el almacenamiento sino, por ejemplo, en la extracción de características en forma automática.
Huellas dactilares: almacenamiento Original, escaneada a 500 dpi Reconstrcción a partir de la imagen comprimida utilizando WSQ (18:1)
Huellas dactilares: almacenamiento Original Acercamiento de la zona marcada
Huellas dactilares: almacenamiento Original Compresión 19.6:1, formato JPG
Huellas dactilares: almacenamiento Original Compresión 19:1 utilizando WSQ
Huellas dactilares: almacenamiento
Herramientas matemáticas Álgebra lineal (matrices, operaciones con matrices, …) Representación de funciones. Transformaciones. Transformada coseno discreta. Transformada wavelet discreta. Wavelet packets.
¡Muchas gracias por su atención!
“Surfing with wavelets” Ingrid Daubechies
“Promediar” horizontal y verticalmente
“Restar” horizontalmente “Promediar” verticalmente
“Restar” vertically
“Promediar” horizontalmente “Restar” horizontalmente “Restar” verticalmente
Repetir los pasos en la próxima escala
Repetir
Compresión
Compression Ratio: 3.3%
Compression Ratio: 10%
Recuperación de los datos en forma rápida e interactiva
“Promediar” horizontal y verticalmente