Detección de líneas de referencia de palabras en cursiva según la Entropía Rodríguez de Torres Jaramillo, Joaquín Carlos Rivas Pérez, Manuel Peña Cantillana,

Slides:



Advertisements
Presentaciones similares
La maximización del beneficio de la empresa
Advertisements

RECONOCEDOR DE MATRICULAS
Capítulo 3: Medidas de posición
Convertidores A/D y D/A
METODO DE ANALISIS DE FALLAS
Realizado por: Alberto Laguarta Calvo Sergio Rios Gil
“ANÁLISIS DE EFICIENCIA EN ALGORITMOS DE RECONOCIMIENTO DE IMÁGENES DIGITALES APLICABLES A DISPOSITIVOS MÓVILES BAJO LA PLATAFORMA ANDROID” Miguel Ñauñay.
Longitud de arco..
PROBLEMAS ELECTROSTÁTICOS
MÁSCARAS DE CONVOLUCIÓN PARA LA DETECCIÓN DE BORDES.
Sesión 14.3 Sistema Coordenado Tridimensional y Vectores en el espacio.
GRÁFICAS Y FUNCIONES María José Peña Mártil MATEMÁTICAS
ESTADÍSTICA UNIDIMENSIONAL
PRESENTACIÓN DE LA INFORMACIÓN
David G. Lowe Distinctive Image Features from Scale-Invariant Keypoints Aradí Rosales Cruz Visión de alto nivel Enrique Sucar.
Como empezar en Access 2000 Abrir Access 2000 Pulsamos INICIO
Guías Modulares de Estudio MATEMATICAS III Parte A
El valor del pixel (tono de gris) varia de una manera continua
Procesamiento de Imágenes Digitales
La teoría del productor y los costes
Procesamiento Digital de Imágenes y Visión
La segmentación de imágenes se ocupa de descomponer una imagen en sus partes constituyentes, es decir, los objetos de interés y el fondo, basándose en.
Mt. Martín Moreyra Navarrete.
Sesión 6: Campos de Markov
(Organización y Manejo de Archivos)
Tema 4. Realzado de imágenes  Qué vamos a estudiar  ¿Qué vamos a estudiar? Un conjunto de técnicas que tratan de conseguir una imagen mejorada y más.
Reconocimiento y resolución de ecuaciones impresas Luis Fernández Pérez Marco Antonio Formoso Trigo.
Preproceso de caracteres extraidos de documentos
Detectores de Borde. Extracción de Características Detección de Líneas. Detección de Puntos de Borde. Detección de Contornos.
Sergio Marín Pulido Alberto Campos Galeano José Carlos Requeijo Puente
EXTRACCIÓN DE CARACTERISTICAS
EL MALLADO HEXAGONAL Dolores Bonilla Silva Daniel González Ortegón Remedios Gutiérrez Martínez.
Capitulo 3 Segmentación.
MÉTODO DE PIXELES DE BORDE
Introducción Scalable Edge Enhancement With Automatic Optimization For Digital Radiographic Images Procesamiento de Imágenes Digitales 1.
RECONOCEDOR DE CARACTERES ARÁBIGOS
Dpto. Matem á tica Aplicada I Mar í a C. Jurado Gonz á lez Tutor: Pedro Real Extracción de Líneas de Referencia Trabajos futuros Vida del proyecto Estructura.
Informática Médica: Procesamiento de imágenes
Procesamiento de Imágenes digitales
Problema de inclusión en una Curva Digital Por Orellana Muñoz, Alfonso Paz Vicente, Rafael Pérez Medina, Gerardo Rodríguez Naranjo.
CARPLATE Reconocimiento del marco de la matrícula de un coche
Tema 3: Filtros.
MoMento S Grupo 33: Ignacio Ayllón Benito Félix A. Velázquez Salas.
Filtro Canny Detección de Esquinas
Eliminación de ruido y Tratamiento de partes alargadas en imágenes digitales.
1 Image Segmentation Chapter 9 Dr. Mario Chacón DSP & Vision Lab.
Conceptos básicos de cartografía
Tema 6: Morfología Segunda parte.
Extracción de características
Estadística PLH 406 Representación Gráfica
Introducción al análisis de expresiones
Reconocimiento De Caracteres Manuscritos
Ingeniería Agrícola en caballos de paso fino Juan G. Ríos Juan G. Ríos Dep. Ingeniería civil Uprm Mayagüez Primer semestre
El Ordenador: Elementos Básicos
Juan Antonio Cano Salado Borja Moreno Fernández
PC BD Alexandra Buri H José Rivera De La Cruz.
GRUPO A. Introducción Tratamiento de Imágenes Experimentación Numérica Conclusiones Bibliografía Desarrollo de Programas 1 - GRUPO A2.
FI Sánchez Pérez Ricardo Diseño electrónico Presenta: Sánchez Pérez Ricardo “APLICACIONES DE LA VISION POR COMPUTADORA “
Graficación 2D Alumna: Yasmin Rosales Cruz
ESTADÍSTICA UNIDIMENSIONAL
Bitmap.
Estadística Reporte Ejecutivo
Pixelación de imágenes avanzada usando el algoritmo slic
Sistemas de Representación Ing. Guillermo Verger
Reconocimiento de cara basado en “espectrocara”
OPTIMIZACION DEL DESEMPEÑO DE ERROR
Universidad de Panamá Escuela de Periodismo Nombre: Wendy Aguilar Profesora Juliana de Alsola Fecha: Martes 22 de Junio del 2010.
Informe evolutivo sobre resultados en la Prueba de Evaluación ESCALA 2014 / 15.
UNIVERSIDAD NACIONAL EXPERIMENTAL DEL TACHIRA UNIDAD DE ADMISION CURSO PROPEDEUTICO ASIGNATURA FISICA Prof. Juan Retamal G.
ALGORITMOS Convenio SENA Institución Educativa Técnica Atanasio Girardot Docente: José Manuel Hernández R. Correo: AÑO.
Transcripción de la presentación:

Detección de líneas de referencia de palabras en cursiva según la Entropía Rodríguez de Torres Jaramillo, Joaquín Carlos Rivas Pérez, Manuel Peña Cantillana, Felipe

Índice Índice Introducción. - On-line. - Off-line. - Analytic aproach. - Holistic aproach. - Resumen. Método propuesto. - Otras técnicas. - Extracción de puntos del contorno. - Generación de histogramas. - Elección del histograma según “la Entropia”. - Deducción de líneas de referencia. Ejemplos prácticos. Bibliografía. Turno de preguntas.

Introducción Reconocimiento de la escritura manual (cursive script recognition): 1. On-line: la escritura manual es producida a través de un dispositivo como un lápiz electrónico o tabletas gráficas 2.Off-line: se trabaja con imágenes digitales introducidas a través de un escáner o cámara digital

Características On-line Uso de lápiz electrónico o tabletas gráficas. Colaboración entre escritor y el computador. Línea de escritura no tiene grosor. Reconocimiento basado en un dato unidimensional, es decir, la línea de escritura es representada mediante una secuencia de puntos cuya localización es función del tiempo.

Características Off-line No necesita de dispositivos especiales para realizar la escritura. No hay ningún tipo de colaboración entre escritor y el computador. La escritura posee grosor. Reconocimiento basado en un dato bidimensional.

Off-line Nos centraremos en el reconocimiento Off-line, donde podemos encontrar dos estrategias fundamentales aplicadas al problema del CSR: Analytical aproach o segmentation-based: En este primer caso, la palabra es considerada como un conjunto de unidades más pequeñas, las técnicas de reconocimiento de palabra se basan en el reconocimiento de esas unidades que la forman. Holistic aproach o word-based: En este segundo caso, el reconocimiento de la palabra se realiza considerando ésta como un todo, es decir, no se intenta identificar los caracteres de los que está compuesta.

Analytical aproach vs Holistic aproach Los puntos de segmentación de la palabra son establecidos correctamente solo cuando se conoce la secuencia correcta de caracteres que forman dicha palabra. El reconocimiento de caracteres sólo es exitoso cuando la segmentación es correcta. Tomar muchos potenciales puntos de segmentación, pero esto se complica bastante al mezclarlo con la elección de los posibles caracteres que forman dicha palabra. Pobre uso de la información contextual obtenida de caracteres vecinos. Analytical aproach:

Analytical aproach vs Holistic aproach Extraer un vector que caracteriza la palabra. Por comparación con prototipos de palabras almacenadas en un diccionario se concluirá que palabra es ésta. Con este método se gana en velocidad y evita todos aquellos problemas surgidos de la segmentación de la palabra en unidades más pequeñas. Se aproxima más al método de lectura humano. El único problema que plantea este método es el de tener un léxico apropiado para el reconocimiento de las palabras. Holistic aproach:

Aplicaciones - Reconocimiento direcciones postales - Lectoras para ciegos - Impresos rellenados manualmente - Talones bancarios

Reconocimiento de palabras cursivas o escritura manual Reconocimiento On-line Reconocimiento Off-line Analytic aproach Holistic aproachResumen Reconocimiento de palabras

Etapas de reconocimiento

Preprocessing Convertir la entrada de escritura manual en una forma más eficiente. Elegir entre modificar la imagen o preservar características. Normalización, reducción de ruido, búsqueda de líneas de referencia

Preprocessing Extracción contorno (contour tracing) Corrección de inclinación (skew correction) Corrección del declive (slant correctíon) Búsqueda de líneas de referencia (reference line finding) o baselines Suavizado (smoothing) Cambio de escala (scaling) Extracción del esqueleto (thinning)

Preprocessing Skew/base-line correction Slant correctionBase-line findingThinning

Slant correction n 1 =3 n 2 =3 n 3 =1

Slant correction

Hyper SPARC 125 MHz

Líneas de referencia Objetivo: Detectar primitivas significativas: ascendentes y descendentes Dividir palabra en 3 partes: superior (ascendentes), central (cuerpo), inferior (descendentes)

Líneas de referencia Problema: Escritura cursiva es a menudo inclinada Enderezamiento => Distorsiones (pérdidas de información) Métodos conocidos complejos (requieren corrección previa de la inclinación, skew correction)

Líneas de referencia Método – 1) Extracción puntos del contorno – 2) Generación histogramas ordenadas – 3) Selección histograma más compacto (entropía menor) – 4) Deducción líneas de referencia

1.- Extracción del contorno Objetivo: Eliminar puntos sobrantes Barras de ‘t’, letras ‘i’, ‘j’ Para encontrar todos los puntos del borde de S, podemos rastrear la imagen y comprobar los cuatro vecinos de cada 1 (negro) para ver si alguno de ellos es 0 (blanco) o vv.

1.- Extracción del contorno

2.-Generación de histogramas Cada ordenada de los puntos es proyectada en un eje cuyo ángulo de inclinación con respecto a la horizontal varía desde +30º hasta –30º en pasos de 1º => 61 proyecciones Calcular histograma de densidad para cada proyección => 61 histogramas

2.-Generación de histogramas Dado un punto del contorno P(x,y) y un ángulo de proyección  con respecto a la horizontal, sus coordenadas en el nuevo sistema de referencia se obtienen aplicando una rotación: aunque solo necesitaremos la proyección y’:

PROYECCIONES (I) X Y Y i son iguales => Puntos siguen dirección OX O P1(X 1,Y 1 ) P2(X 2,Y 2 ) P3(X 3,Y 3 ) X1X1 X2X2 X3X3 Y1Y1 Y2Y2 Y3Y3

X Y Y i son distintos => Puntos NO siguen dirección OX O X1X1 X2X2 X3X3 Y1Y1 Y2Y2 Y3Y3 PROYECCIONES (II) P1(X 1,Y 1 ) P2(X 2,Y 2 ) P3(X 3,Y 3 )

PROYECCIONES (III) X Y Y i son distintos => Puntos NO siguen dirección OX Y i ’ son iguales => Puntos siguen dirección OX’ O X1X1 X2X2 X3X3 Y1Y1 Y2Y2 Y3Y3 P1(X 1,Y 1 ) P2(X 2,Y 2 ) P3(X 3,Y 3 ) X’ Y’ Y’ 1 Y’ 2 Y’ 3

2.-Generación de histogramas

3.- Elección del histograma Entropía: N i = Nº de pixeles con proyección y i en el vector proyección N = Nº total de puntos P i = frecuencia de ocurrencia de la ordenada y i

3.- Elección del histograma Entropía máxima => Todas Pi son iguales => Distribución homogénea, muy extendida (plana) Entropía mínima => Todas Pi son nulas (excepto una) => Distribución heterogénea, poco extendida (abrupta)

3.- Elección del histograma La dirección de la inclinación de la palabra se obtiene minimizando la entropía Se calcula la entropía para cada histograma de densidad y se coge el de mínima entropía

3.- Elección del histograma

4.- Obtención de las líneas Cada histograma presenta 3 picos: central (cuerpo), izquierda (zona ascendentes), derecha (zona descendentes) Ausencia picos laterales (no hay ascendentes / descendentes) Líneas de referencia: rectas separan pico central de las zonas laterales. Ordenadas al origen son los umbrales

4.- Obtención de las líneas Heurística de aproximación : donde f max es la frecuencia del pico central

4.- Obtención de las líneas

Líneas de referencia

Ventajas No causa ninguna deformación en la imagen de partida, lo cual es importante a la hora de detectar la primitivas salientes de la imagen Menos complejo que los métodos que usan regresiones lineales

Ejemplos Elmira Almaden Tennesse Treadwell

Inconvenientes La heurística no siempre se verifica aunque la dirección sea la correcta => Búsqueda adaptativa mejorando los umbrales (thresholding) Problemas con las ‘T’, ‘F’ que originan picos parásitos que impiden la detección del pico central (aunque ocurre pocas veces)

Inconvenientes Four Ten Two Tappan Talmage Mal Bien

Ejemplos FiskillThiells Taberg

Ejemplos one nine seven six

Ejemplos Criterio de la entropíaCriterio del pico maximal dollars eighteen

Comparativa ÉxitosFracasos Método regresiones lineales 61 %39 % Método propuesto85 %15 %

Bibliografía “Offline Cursive Script Word Recognition – a survey” Tal Steinherz, Ehud Rivlin, Nathan Intrator. Revised September 2, Myriam Côté,Utilisation d'un modèle d'accès lexical et de concepts perceptifs pour la reconnaissance d'images de mots cursifs. Thèse de doctorat, Département signal, Ecole nationale supérieure des télécommunications de Paris, Paris, France, 6 juin 1997, 178 pages.