Reconocimiento De Caracteres Manuscritos

Slides:



Advertisements
Presentaciones similares
ALGORITMO Un algoritmo es un conjunto finito de instrucciones o pasos que sirven para ejecutar una tarea y resolver un problema. De un modo más formal,
Advertisements

Vera Olivera, David Carlos Marín Rosales, Nicolae Harry
Tema 13. Inferencia estadística Principales conceptos. Muestreo
Tecnología Biométrica: Escritura Manuscrita
RECONOCEDOR DE MATRICULAS
Silvana Arias Carla Espinosa Livia Loaiza INGENIERIA EN SISTEMAS
Resolución de Problemas Algoritmos y Programación
UNIDAD I MODELOS Y TOMA DE DECISIONES
“ANÁLISIS DE EFICIENCIA EN ALGORITMOS DE RECONOCIMIENTO DE IMÁGENES DIGITALES APLICABLES A DISPOSITIVOS MÓVILES BAJO LA PLATAFORMA ANDROID” Miguel Ñauñay.
7. FUNCIONES Y GRAFICAS Definiciones
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN
Tema 6: Compresión de imagen
Programas Son una serie o secuencia de instrucciones entendibles por los ordenadores que permiten la realización de las acciones o tareas para las que.
LAS CARAS DE LA EVALUACION
CALIDAD EN LOS CONTENIDOS VIRTUALES Aspectos Pedagógicos y Didácticos aplicados en los contenidos virtuales.
INTELIGENCIA DE NEGOCIOS
TRANSFORMACIONES LINEALES PARA REDES NEURALES ARTIFICIALES
J. Trinidad Guillen Bonilla, H. Guillen Bonilla, A. Guillen Bonilla,
Población y Muestra.
Introducción al diseño gráfico
Procesamiento de Imágenes Digitales

06. Algoritmo básico de la introducción
Integrantes: Daniel Peña Alfredo Zuñiga
Imagen Digital teoría taller Imagen Digital La imagen digital Por Gabriel Francés 2004.
Cecilia Aguerrebere – Germán Capdehourat Proyecto Final de Reconocimiento de Patrones Reconocimiento de Caras con características locales.
Reconocimiento y resolución de ecuaciones impresas Luis Fernández Pérez Marco Antonio Formoso Trigo.
Combinación de Clasificadores
Investigación Experimental
EXTRACCIÓN DE CARACTERISTICAS
MÉTODOS DE BINARIZACIÓN DE IMÁGENES EN NIVELES DE GRIS
Reconocimiento de Escritura Manuscrita
Introducción Scalable Edge Enhancement With Automatic Optimization For Digital Radiographic Images Procesamiento de Imágenes Digitales 1.
Evaluación topológica de métodos de binarización
RECONOCEDOR DE CARACTERES ARÁBIGOS
Diseño geodésico II II semestre, 2014
Previsión de Ventas. Métodos no paramétricos Previsión de Ventas. Tema 2. 1 Antonio Montañés Bernal Curso
Informática Médica: Procesamiento de imágenes
Universidad Central de Venezuela Facultad de Ciencias Postgrado en Ciencias de la Computación Sistemas Distribuidos Albany Márquez.
Procesamiento de Imágenes digitales
Problema de inclusión en una Curva Digital Por Orellana Muñoz, Alfonso Paz Vicente, Rafael Pérez Medina, Gerardo Rodríguez Naranjo.
CARPLATE Reconocimiento del marco de la matrícula de un coche
Imágenes en el PC Fuente: Curso HTML del CNICE. Tipos de imagen A grandes rasgos podríamos dividir las imágenes digitales en dos grupos: Imágenes vectoriales,
MoMento S Grupo 33: Ignacio Ayllón Benito Félix A. Velázquez Salas.
El Escánner.
Cervantes, el reconocedor de caracteres. Alfonso Gastalver Llamas, Antonio Pérez Sánchez, Cristian Vega Lozano.
INTRODUCCIÓN A LA INTELIGENCIA ARTIFICIAL Y LOS SISTEMAS EXPERTOS
Procesamiento Digital de Imágenes
Extracción de características
INTRODUCCIÓN A LA INGENIERÍA DEL SOFTWARE
Geometría primitiva y Transformaciones
Juan Antonio Cano Salado Borja Moreno Fernández
“... El aprendizaje tiene lugar cuando el alumno “internaliza” o se “apropia” de formas significativas de las acciones mediadas por herramientas, o de.
Realizado por: María Inmaculada Fernández Conde.
Reconocimiento de caras usando Histogramas de Gradientes Orientados
I.- Introducción a los sistemas de información
El ESCÁNER.
Informática aplicada La Informática es la rama de la Ingeniería que estudia el hardware, las redes de datos y el software necesarios para tratar información.
1º Parte. FOTOGRAFIA DIGITAL Las fotografías digitales son imágenes del mundo real digitalizadas. Esta digitalización consiste en tomar una visión del.
Introducción a los TADs
Pixelación de imágenes avanzada usando el algoritmo slic
Análisis cinemático: ACELERACION
FORMATOS GRÁFICOS. INTRODUCCIÓN El campo de la imagen digital es muy amplio y complejo, maneja muchas variables. Para conocerlo en profundidad no basta.
Reconocimiento de cara basado en “espectrocara”
FOTOGRAFIA DIGITAL  Es cualquier imagen fija o en movimiento, que se captura en un medio electronico y se representa como un archivo de informacion leido.
El objetivo de la segmentación es dividir (segmentar) y separar la información original para generar nuevas imágenes que representen las estructuras internas.
República Bolivariana de Venezuela Universidad Nacional Experimental Politécnica de la Fuerza Armada (UNEFA) Carrera: Ingeniería de Sistemas Cátedra: Análisis.
OPTIMIZACION DEL DESEMPEÑO DE ERROR
INGENIERIA EN SISTEMAS FUNDAMENTOS DE COMPUTACION B ACHILLERATO EN I NGENIERÍA I NFORMÁTICA L IC. C ARLOS H. G UTIÉRREZ L EÓN.
PROGRAMA DE INNOVACIÓN Y DESARROLLO TECNOLÓGICO PRODUCTIVO – CONVENIO : SENA-NEW STETIC Proyecto: Sistema de visión industrial para inspección.
Transcripción de la presentación:

Reconocimiento De Caracteres Manuscritos Reconocimiento de caracteres Kanji Antonio Blasco López Francisco Félez Esteban

Indice 1. Introducción al reconocimiento de caracteres manuscritos. 2. Reconocimiento de caracteres Kanji. 3. Aplicación experimental.

Introducción al reconocimiento de caracteres manuscritos Definición: Conjunto de técnicas informáticas cuyo objetivo es reconstituir los caracteres de un documento a partir de su propia imagen. En la actualidad esta disciplina científica no sólo engloba la reconstrucción de caracteres, sino la estructuración de los documentos(títulos, subtítulos, bloques de texto, etc..)

Introducción al reconocimiento de caracteres manuscritos Comenzó aplicándose en documentos para los cuales ninguna forma electrónica estaba disponible. A medida que evoluciona la tecnología, sus aplicaciones han ido en aumento. Los resultados obtenidos hasta ahora distan mucho de ser perfectos. El reconocimiento de caracteres sigue siendo un problema complejo que tropieza con dificultades aún no resueltas y que son actualmente aún objeto de numerosas investigaciones.

Introducción al reconocimiento de caracteres manuscritos Varios factores son la causa de estas dificultades: Ausencia de un objetivo universal. Los resultados dependen mucho de la aplicación. Son técnicas por lo general costosas. Muchas son las causas que pueden provocar que los resultados no sean los correctos. Por ejemplo: - resolución insuficiente de la imagen. - introducción óptica de mala calidad. - documento deteriorado.

Introducción al reconocimiento de caracteres manuscritos En general, los sistemas de reconocimiento de documentos y, por lo tanto, de caracteres comprende las siguientes etapas: 1- Adquisición de la imagen mediante escáneres y cámaras. 2- Pretratamiento (Binarización, Filtrado, Rectificación). 3- Segmentación: delimitar las regiones de interés de la imagen. 4- Reconocimiento de caracteres. La etapa sin duda de mayor dedicación.

Introducción al reconocimiento de caracteres manuscritos 5- Reconocimiento de fuentes. 6- Vectorización: transformar las características de la imagen en una línea poligonal o curvilínea. 7- Reconocimiento de gráficos (si es que los hay). 8- Reconocimiento estructural: determinar la organización lógica de las entidades elementales o compuestas. 9- Clasificación de documentos: ser capaz de distinguir el tipo de documento reconocido.

Introducción al reconocimiento de caracteres manuscritos En particular, en la etapa de reconocimiento de caracteres se divide en dos sub-etapas: 1- Extracción de características: - Permite conocer medidas (tamaño, perímetro, centro de gravedad, momentos..). - Características topológicas(orientación de segmentos, número de agujeros, número de extremidades,etc..).

Introducción al reconocimiento de caracteres manuscritos 2- Etapa de decisión: Tres técnicas destacan sobre las demás: 1- Redes neuronales (capacidad de aprendizaje). 2- Cadenas Ocultas de Markov. Estudios y algoritmos probabilísticos. 3- Voto mayoritario. Combinación de diferentes estrategias. Se escogerá la clase con mayor número de clasificaciones. Es la técnica que mejores resultados ofrece.

Introducción al reconocimiento de caracteres manuscritos La mayoría de los tratamientos requieren para su buen funcionamiento una contribución de información del contexto, dependiente del tipo del documento analizado. Esta información se proporciona por los llamados modelos de documentos. Varias etapas del reconocimiento requieren esta clase de conocimientos: un reconocedor de caracteres utilizará por ejemplo una base de datos de caracteres de referencia o diccionarios lingüísticos; el reconocimiento de fuentes necesitará una base de conocimiento de las características de las fuentes en cuestión.

Indice 1. Introducción al reconocimiento de caracteres manuscritos. 2. Reconocimiento de caracteres Kanji. 3. Aplicación experimental.

Reconocimiento de caracteres Kanji Metodología para el reconocimiento de caracteres. Propuesta por Toru Wakahara y Yoshimasa Kimura. En principio está estudiada para el reconocimiento de caracteres Kanji, aunque puede ser aplicable a los caracteres occidentales.

Reconocimiento de caracteres Kanji Este reconocimiento ofrece un método de normalización adaptativo y basado en la normalización de los patrones de entrada mediante las transformaciones GAT y LAT. Los patrones de entrada pueden estar escalados, rotados, desplazados, ruidosos, etc.. Es por esto por lo que la normalización adquiere tanta importancia. El proceso de reconocimiento requiere de las siguientes fases:

Caracteres manuscritos Captura de los datos Preprocesamiento Extracción de características y clasificación Normalización por GAT & LAT Resultados del reconocimiento

Reconocimiento de caracteres Kanji Captura de los datos Para la captura de los datos lo más común es usar un escáner óptico o una cámara digital. Los datos resultantes son representados por píxeles.

Reconocimiento de caracteres Kanji Preprocesamiento El preprocesamiento a realizar incluye los siguientes aspectos: Reducción de ruido Paso a escala de grises Binarización Tras esto, los píxeles sólo podrán tener dos valores: 0- negro y 1- blanco. Los píxeles negros los llamaremos puntos.

Reconocimiento de caracteres Kanji Extracción de características y clasificación Guardaremos en un vector las coordenadas de los puntos de la imagen de entrada. Para cada uno de los patrones de referencia tendremos un vector que también contendrá las coordenadas de los píxeles negros.

Reconocimiento de caracteres Kanji Normalización por GAT & LAT En primer lugar, la transformación GAT(Global Affine Transformation) escala el patrón de entrada y lo compara con cada uno de los patrones de referencia. En segundo lugar, la transformación LAT(Local Affine Transformation) realiza una reforma local sobre cada punto del patrón de entrada.

Reconocimiento de caracteres Kanji GAT (I) En primer lugar, recorreremos la imagen almacenando los puntos (pixeles negros) en un vector donde almacenamos las coordenadas X e Y. S = {s1, s2, ..., si, ...,sm} Todos los patrones de referencia también tendrán su vector de puntos. R = {r1, r2, ..., ri, ...,sn}

Reconocimiento de caracteres Kanji GAT (II) Debemos normalizar el vector del patrón de entrada antes de compararlo con los patrones de referencia. Para cada punto se hará la siguiente transformación: si * = Asi + b donde A es una matriz 2X2 que representa la rotación y el cambio de escala, y b es un vector que representa a la traslación. Denotaremos el patrón normalizado como:

Reconocimiento de caracteres Kanji GAT (III) Para el cálculo de la matriz A y del vector b necesitaremos del cálculo de tres coeficientes intermedios:

Reconocimiento de caracteres Kanji GAT (IV) Conocidos estos coeficientes aplicaremos el siguiente sistema de ecuaciones lineales: donde ρi,j(D) µi,j(D)/m + νj,i(D)/n.

Reconocimiento de caracteres Kanji GAT (V) Aplicamos los resultados del sistema de ecuaciones para hallar las coordenadas del vector S* (s*= Asi+ b). Ahora comparamos dicho vector con el patrón de referencia, extrayendo el valor DNN :

Reconocimiento de caracteres Kanji GAT (VI) Compararemos el vector S* con cada uno de los patrones de entrada R y aquel patrón cuyo DNN sea el menor será el modelo elegido. Patrón de entrada Patrones de referencia Resultado obtenido

Reconocimiento de caracteres Kanji Consideraciones Alto nivel computacional: Número elevado de píxeles negros Número elevado de patrones de referencia Gran importancia de los sistemas de ecuaciones lineales dentro del procesamiento de imágenes. No sólo válido para caracteres orientales sino para cualquier tipo de reconocimiento de caracteres.

Reconocimiento de caracteres Kanji Resultados experimentales Es más eficaz para caracteres japoneses(Kanji). Depende del grado de complejidad de los patrones de entrada, pero suele acertar en un 90%. En el caso de caracteres occidentales, los resultados son algo peores (80%-90%).

Indice 1. Introducción al reconocimiento de caracteres manuscritos. 2. Reconocimiento de caracteres Kanji. 3. Aplicación experimental.