Reconocimiento de cara basado en “espectrocara”

Slides:



Advertisements
Presentaciones similares
Autor: Juan Manuel Vuletich Directora: Dra. Ana M.C. Ruedin
Advertisements

DIFRACCIÓN DE FRAUNHOFER
Tema 3: Filtros SEGUNDA PARTE.
PROCESAMIENTO DE IMAGENES
DESCRIPCION DE SISTEMAS
TRANSFORMACIONES GEOMÉTRICAS
OBJETIVO GENERAL Hacer una comparación del porcentaje de compresión del formato MP3 con el porcentaje de compresión de audio en diferentes formatos.
MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS
M. en C. ANDRÉS GERARDO FUENTES COVARRUBIAS
Momentos Daniel Bolaño Asenjo José Juan Corpas Martos
REDES NEURONALES ARTIFICIALES
David G. Lowe Distinctive Image Features from Scale-Invariant Keypoints Aradí Rosales Cruz Visión de alto nivel Enrique Sucar.
Procesamiento digital de Imágenes
Juan Pablo Vásquez Ralf Wilke 18 de Diciembre 2008.
Capítulo 2. Representación de imágenes digitales
TD-33. EXTRACCIÓN DE SUPERFICIE BORDE DE UN CONJUNTO DE DATOS VOLUMÉTRICO Andrés Fernández Peralta Luis Franco Espín Ignacio Gordillo Díaz.
Procesamiento digital de Imágenes
Trabajo De Investigación (9 Créditos) Realizado Por: Raúl Montoliu
J. Trinidad Guillen Bonilla, H. Guillen Bonilla, A. Guillen Bonilla,
Reconocimiento de iris humano Antonio Balderas Alberico Alfonso Sendra Gamero.
Introducción al diseño gráfico
Procesamiento de Imágenes Digitales
Procesamiento Digital de Imágenes y Visión
Sesión 6: Campos de Markov
Cecilia Aguerrebere – Germán Capdehourat Proyecto Final de Reconocimiento de Patrones Reconocimiento de Caras con características locales.
Descripción de Contenidos con Wavelets Jaime Gaviria.
Tema 4. Realzado de imágenes  Qué vamos a estudiar  ¿Qué vamos a estudiar? Un conjunto de técnicas que tratan de conseguir una imagen mejorada y más.
Tratamiento Digital de Imagenes Andres Felipe Rubiano Pinzon Gina Lorena Giraldo Alzate.
Realzado en el dominio de la frecuencia
Reconocimiento y resolución de ecuaciones impresas Luis Fernández Pérez Marco Antonio Formoso Trigo.
Identificación de Personas Mediante Imagen del Iris Fernando Llaca Romero Alberto Morales Calvo Alejandro Rojas López.
Identificación humana automatizada usando imagenes de orejas
EXTRACCIÓN DE CARACTERISTICAS
MÉTODOS DE BINARIZACIÓN DE IMÁGENES EN NIVELES DE GRIS
Reconocedor de Señales de Tráfico Verticales
EXPERIMENTACIÓN NUMÉRICA
Fundamentos Físicos de la Imagen Médica José Macías Jaén Radiofísico Hospitalario Servicio de Radiofísica Hospitalaria Hospital Universitario Virgen Macarena.
Introducción Scalable Edge Enhancement With Automatic Optimization For Digital Radiographic Images Procesamiento de Imágenes Digitales 1.
Evaluación topológica de métodos de binarización
Procesamiento Digital de Imágenes
Informática Médica: Procesamiento de imágenes
Procesamiento de Imágenes digitales
CARPLATE Reconocimiento del marco de la matrícula de un coche
Tema 3: Filtros.
MoMento S Grupo 33: Ignacio Ayllón Benito Félix A. Velázquez Salas.
Ii - Reconocimiento de monedas Invariante a rotaciones
Filtros.
1 Image Segmentation Chapter 9 Dr. Mario Chacón DSP & Vision Lab.
Sismica de reflexion.
Procesamiento Digital de Imágenes
Procesamiento Digital de Imágenes
Filtrado lineal Digital image processing, Gonzalez & Woods, chpt 4
Extracción de características
Aprendizaje No Supervisado y Redes de Kohonen
Reconocimiento De Caracteres Manuscritos
José Oliver Alberto Bonastre José Luis Poza
Juan Antonio Cano Salado Borja Moreno Fernández
FUNDAMENTOS SOBRE P ROCESAMIENTO D IGILTAL DE I MÁGENES (DIP) Copyright 2004 para Diego Luis Aristizábal Ramírez OrquideaJAI Universidad Nacional de Colombia.
PC BD Alexandra Buri H José Rivera De La Cruz.
Reconocimiento de caras usando Histogramas de Gradientes Orientados
El procesamiento óptico y las computadoras ópticas. J. Zacarías Malacara H. Taller de Ciencia para Jóvenes.
Graficación 2D Alumna: Yasmin Rosales Cruz
NÚMEROS COMPLEJOS son una extensión de los números reales, cumpliéndose que . Los números complejos tienen la capacidad de representar todas las raíces.
Pixelación de imágenes avanzada usando el algoritmo slic
Análisis cinemático: POSICION
Procesamiento de Vídeo Digital Máster en Matemática Computacional Francisco Miguel Pérez Romero.
OPTIMIZACION DEL DESEMPEÑO DE ERROR
VARIOGRAMA.
OPERADORES CINEMÁTICOS Roger Miranda Colorado
Unsupervised visual learning of three-dimensional objects using a modular network architecture Ando, Suzuki, Fujita Neural Networks 12 (1999)
Transcripción de la presentación:

Reconocimiento de cara basado en “espectrocara” Procesamiento de Imágenes Digitales Grupo 18: Macarena Carmen Ramos Rivera Juan Manuel Nieto Moreno Álvaro Sánchez Del Águila Jiménez

Contenido Introducción Planteamiento del problema Pipeline de transformaciones Almacenamiento y comparación Experimentación Conclusiones Introducción: Veremos el problema que trataremos en la presentación e introduciremos el concepto de Espectrocara. Planteamiento del problema: Daremos una solución al problema, dividiéndolo en dos bloques que se detallan en el punto 3 y 4 del índice. Pipeline de transformaciones: Explicaremos todas las transformaciones realizadas en el sistema implementado. Almacenamiento y comparación: Estrategias seguidas para el almacenamiento y clasificación de nuevas caras. Experimentación: Resultados estadísticos obtenidos en la práctica. Conclusiones: Conclusiones obtenidas al realizar el trabajo.

Contenido Introducción Planteamiento del problema Pipeline de transformaciones Almacenamiento y comparación Experimentación Conclusiones Introdución: Veremos el problema que trataremos en la presentación e introduciremos el concepto de Espectrocara Planteamiento del problema: Daremos una solución al problema, dividiendolo en dos bloques que se detallan en el punto 3 y 4 del índice Pipeline de transformaciones: todas las transformaciones realizadas en el sistema implementado. Almacenamiento y comparación: Estrategias seguidas para el alamecenamiento y clasificación de nuevas caras Experimentación: Resultados estadísticos obtenidos en la práctica. Conclusiones: Conclusiones obtenidas al realizar el trabajo.

Introducción ¿Quién es? Explicar el problema: queremos reconocer a una persona.

Reconocimiento Facial Un sistema de reconocimiento facial es una aplicación dirigida por ordenador que identifica a una persona en una imagen digital. Consiste analizar las características faciales del sujeto extraídas de la imagen y compararlas con una base de datos.

Espectrocara La representación de espectrocara es invariante a la traslación, escala y rotación en el plano. ¿Puede reconocer la cara con 3 tipos diferentes de rotación? Esta representación, según sus autores, permite representar las imágenes con ayuda de la transformada de Fourier pero añadiendo la propiedad de que sea invariante a la translación, escala y rotación en el plano. La transformada de Fourier es variante a la rotación y que los autores introducen el Spectroface para solventar esto.

Contenido Introducción Planteamiento del problema Pipeline de transformaciones Almacenamiento y comparación Experimentación Conclusiones Introdución: Veremos el problema que trataremos en la presentación e introduciremos el concepto de Espectrocara Planteamiento del problema: Daremos una solución al problema, dividiendolo en dos bloques que se detallan en el punto 3 y 4 del índice Pipeline de transformaciones: todas las transformaciones realizadas en el sistema implementado. Almacenamiento y comparación: Estrategias seguidas para el alamecenamiento y clasificación de nuevas caras Experimentación: Resultados estadísticos obtenidos en la práctica. Conclusiones: Conclusiones obtenidas al realizar el trabajo.

Planteamiento del Problema Espectrocara Comparación Carlos Transformación Para resolver el problema de reconocimiento facial seguimos una estrategia con dos componentes claramente diferenciados. - El primer componente, al que llamamos pipeline de transformación, será usada para realizar a la imagen de entrada todas las transformaciones necesarias para la obtener la representación de la Espectrocara. - El segundo componente, será el sistema de almacenamiento y comparación de Espectrocaras. Una vez diferenciadas las componentes del sistema profundizaremos en estas detallando todos los pasos realizados en los mismos. Antes de introducirnos en los componentes es importante recalcar que nuestro sistema tendrás dos fases, la fase de reconocimiento, cuya traza se representa en esta transparencia, y la fase de entrenamiento, usada para tener la base de datos preparada para la comparación, la traza de esta fase la podemos ver en la siguiente transparencia. La última fase es debido a implementar una solución con clasificación. Entrada Fase de reconocimiento

Planteamiento del Problema Transformación … … Almacenamiento Entrada Se dan un conjunto de imágenes de un sujeto y tras realizar todas las transformaciones para obtener los Espectrocaras de cada una se realiza el almacenamiento siguiendo varias alternativas como comentará mi compañero Álvaro en la parte de experimentación. Fase de entrenamiento

Contenido Introducción Planteamiento del problema Pipeline de transformaciones Almacenamiento y comparación Experimentación Conclusiones Pipeline por que el resultado de una transformación será la entrada de la siguiente a realizar.

Pipeline de Transformaciones Preprocesamiento Extensión Transformada Wavelet Transformada Fourier Coordenadas Polares Transformada Fourier λ = ln ρ

Preprocesamiento Conversión Escala Grises Ecualización de histograma Traducción del valor de los pixeles en el rango de grises. Ecualización de histograma Maximiza el contraste de la imagen sin perder información Normalización de la intensidad Evita los cambios bruscos de iluminación y mejora el contraste de la imagen

Extensión Transformará la imagen convirtiéndola en una cuadrada y con resolución potencia de 2 mayor que 32. Esto se realiza como requisito de las siguientes transformaciones. Este proceso se usa cuando la imagen de entrada no es cuadrada (es decir, cuando la altura es diferente que la anchura de la imagen) y/o cuando la resoluci´on de la imagen de entrada no es m ´ultiplo de 32, que la resoluci ´on 32 x 32 es necesaria para poder usar los pasos siguientes. Hay que hacer los dos pasos siguientes para poder extender la imagen: a. Para extender una imagen no cuadrada, primero hay que coger el n´umero mayor entre el de anchura y el de altura. Luego usamos este n ´umero para la resoluci´on (n x n) y as´ı ampliamos la imagen para tener una imagen cuadrada. b. Para extender una imagen que no es m ´ultiplo de 32, primero, mirando la resoluci ´on de la imagen cuadrada, hay que coger el n ´umero pr ´oximo del m ´ultiplo de 32 (por ejemplo, una imagen de entrada es 60 x 60 y el siguiente m ´ultiplo de 32 es 64). As´ı ampliamos la imagen usando este n ´umero para la resoluci ´on.

Transformada Wavelet Descompone la imagen en cuatro bandas de frecuencias pero usamos la banda LL, porque es la mejor aproximación a la imagen original.

Transformada Wavelet Se calcula el número de iteraciones necesarias para obtener la imagen de banda LL con una resolución 32x32. Siendo: n = log( w / 32) / log 2

Transformada de Fourier Básicamente se obtiene el espectro de frecuencias de una función. Cada porción de la transformada corresponde a una frecuencia espacial diferente sobre el objeto.

Coordenadas Polares El sistema de coordenadas polares es un sistema de coordenadas bidimensional donde cada punto del plano se determina por un ángulo θ y una distancia r. Después de realizar esta transformación tendremos una imagen de 22,627 x 360.

Transformada Fourier λ = ln ρ Esta transformada trata de conseguir la invariabilidad de todas las propiedades de Fourier. Se realiza un mapeado sobre la representación polar del paso anterior de forma que la componente x se transforme en λ = ln ρ.

Contenido Introducción Planteamiento del problema Pipeline de transformaciones Almacenamiento y comparación Experimentación Conclusiones Introdución: Veremos el problema que trataremos en la presentación e introduciremos el concepto de Espectrocara Planteamiento del problema: Daremos una solución al problema, dividiendolo en dos bloques que se detallan en el punto 3 y 4 del índice Pipeline de transformaciones: todas las transformaciones realizadas en el sistema implementado. Almacenamiento y comparación: Estrategias seguidas para el alamecenamiento y clasificación de nuevas caras Experimentación: Resultados estadísticos obtenidos en la práctica. Conclusiones: Conclusiones obtenidas al realizar el trabajo.

Almacenamiento Se han usado dos métodos: Representación vectorial o de clase Representación unitaria Basada en el trabajo Representación vectorial : Es la media de los valores de los pixeles de todas las espectrocaras de la persona Representación unitaria : Se guarda cada espectrocara de la persona Experimental

Almacenamiento Tanto para una como para otra obtenemos: Mapa <String, String> Nombre imagen/vector Nombre de la persona Aleatorio

Comparación Se han usado tres métodos: Distancia euclídea clásica Ventana de 10 Ventana de 20 Basada en el trabajo Experimentales Ventana de 10/20: Coger las 10/20 distancias euclídeas minimas y sacar la moda.

Contenido Introducción Planteamiento del problema Pipeline de transformaciones Almacenamiento y comparación Experimentación Conclusiones

Experimentación Se han realizado diferentes test de JUnit con las siguientes variaciones y premisas: Comparando métodos de almacenamiento. Enfrentando métodos de comparación Siempre la imagen de la persona comparada no estaba entrenada Diferentes conjuntos de entrenamiento: 10, 15, 20 0 25 personas con 9 imágenes entrenadas cada uno.

Tiempo medio: 2,5 seg por persona Experimentación Tiempo medio: 2,5 seg por persona Almacenamiento vectorial

Tiempo medio: 19 seg por persona Experimentación Tiempo medio: 19 seg por persona Almacenamiento masivo

Experimentación Conclusiones sobre la experimentación: No se llega a los valores esperados : En torno al 90%. Aceptable para pocos individuos. Se estabiliza el acierto a partir de un número. La mejora de los métodos experimentales no es significativa debido a su elevado coste computacional y de memoria.

Contenido Introducción Planteamiento del problema Pipeline de transformaciones Almacenamiento y comparación Experimentación Conclusiones

Conclusiones Problemas encontrados: Amplitud del campo de trabajo. Descripción breve o nula de algunos métodos del procesado Explicación detallada de la demostración del método de invariabilidad frente a nula explicación sobre su aplicación. Ausencia de mención sobre el propagación de dimensiones entre procesados. Interpretación más libre de algunos métodos para su implementación. Transformada invariante. Transformade Polar.

Conclusiones No se ha conseguido un porcentaje de acierto como el esperado, posiblemente debido a las complicaciones de la implementación. Se ha podido realizar la completitud del método y la aplicación, así como una experimentación que ha ayudado a conocer el comportamiento real de nuestro programa. Se ha conseguido una aplicación dónde se puede ver un tratamiento real de imágenes.

Conclusiones Posibles ampliaciones: Cambiar el método de invariabilidad por otro de los descartados en el artículo como el Fourier-Mellin, para así poder mejorar el reconocimiento. Mejoras en la interfaz como ajuste de ventana para la transformada polar o cambios en el menú principal. Usar nuevas estrategias de clasificación y comparación.

Bibliografía