La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Preproceso de caracteres extraidos de documentos

Presentaciones similares


Presentación del tema: "Preproceso de caracteres extraidos de documentos"— Transcripción de la presentación:

1 Preproceso de caracteres extraidos de documentos
Andoni Cortés Vidal Director: Clemente Rodríguez Lafuente

2 Indice presentación Motivación y problemas Procesos Experimentación

3 Motivación y problemas
Reconocimiento off-line de digitos escritos a máquina, obtenidos a partir de formularios del Banco de España. Fases del reconocimiento: Preprocesado del dígito Extracción de las características Clasificación del dígito.

4 Motivación y problemas
Problemas en los dígitos Segmentación Impresora / Escaner Tipo de fuente Números de baja calidad Solución: Mejorar la calidad y eliminar las distorsiones que presentan , utilizando preprocesos

5 1. Errores de segmentación
Extracción del campo segmentación

6 2. Impresora / escáner Extracción del campo segmentación

7 3 3 3 3. Tipo de fuente normal cursiva negrita
Tipos de fuentes de 3 distintas:

8 Preproceso Escala Trazo discontinuo : Ruido : Grosor :
Union dirigida del trazo Dilatación Ruido : Suavizado Eliminación Grosor : Erosión Abrir Agujeros

9 Preproceso Escala: Inconvenientes: Beneficios:
Aumento del cómputo Beneficios: Mayor eficiencia de algunos preprocesos. Librerías: StrechBlt , Leadtools

10 Preproceso Trazo discontinuo Componentes Conexas Metodos: Problemas:
Unión del trazo Dilatación del contenido Problemas: Uniones indeseadas

11 Preproceso Dilatación Imagen Original Imagen Dilatada EE 1 1 1 · 1

12 Preproceso Recuperar Trazo Dilataciones y erosiones
Horizontal  Vertical  H/V/Diagonal

13 ALGORITMO COMPONENTES CONEXAS CASOS UNIR TRAZO DILATACIÓN EL CONTENIDO
Numero de componentes conexas: 8 CASOS UNIR TRAZO DILATACIÓN EL CONTENIDO

14 Preproceso Ruido Componentes Conexas Perfiles Tipos de Ruido:
Con estructura Sin estructura RUIDO CON ESTRUCTURA RUIDO GAUSSIANO

15 Quitar ruido Suavizar Imagen 1 Quitar Punto (perfiles) Cortar Imagen
Tras cortar Por arriba un 20% Suavizar Imagen CONVOLUCION 1 Divisor: 3

16 Quitar ruido Suavizar Imagen a b c d p e f g h Quitar Punto
Cortar Imagen Tras cortar Por arriba un 20% Suavizar Imagen a b c d p e f g h SUAVIZADO FU Mejorar contorno del número. Coincidencia de patrones Dos patrones: Para entrantes de un píxel Para salientes de un píxel.

17 Preproceso Para el grosor Disminuir grosor del número.
Adelgazar imagen con el operador morfológico de erosión. SIN ROTURA SIN ROTURA CON ROTURA CON ROTURA

18 Preproceso Erosión Imagen Original Imagen Erosionada EE 1 1 1 · 1

19 Engordar la imagen Densidad de píxeles negros. Operador dilatación.
engordado El zoom suaviza los efectos del engordado

20 Preproceso Crear Agujeros Curvas de nivel
Creación de agujeros no deseados

21 Experimentación Red 300 patrones
Conjunto de test patrones de más de 1 nCC Sistema 17 clasificadores en paralelo Para trazo discontinuo, para cortados y para basura

22

23 Resultados Mejora el reconocimiento con respecto al zoning un 16,7% en nCC ZOOM 17 Clasificadores RR Mis Rej nC 79,6 20,4 96,31 0,56 3,13 3C 87,1 12,9 95,55 0,75 3,7 2C 90,55 9,45 95,6 0,83 3,57 Media 85,75 14,25 95,82 0,72 3,46

24 Resultados Justificación de los clasificadores nCC 3CC 2CC
32 25 24 Clasificador 2-9 39 36 Clasificador 10-19 4


Descargar ppt "Preproceso de caracteres extraidos de documentos"

Presentaciones similares


Anuncios Google