La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

REPRESENTACIÓN DE DOCUMENTOS Y SU APLICACIÓN PARA DESCOMPOSICIÓN DE PÁGINAS Realizado por: Alberto Laguarta Calvo Sergio Rios Gil Jesús Quintero Hernández.

Presentaciones similares


Presentación del tema: "REPRESENTACIÓN DE DOCUMENTOS Y SU APLICACIÓN PARA DESCOMPOSICIÓN DE PÁGINAS Realizado por: Alberto Laguarta Calvo Sergio Rios Gil Jesús Quintero Hernández."— Transcripción de la presentación:

1 REPRESENTACIÓN DE DOCUMENTOS Y SU APLICACIÓN PARA DESCOMPOSICIÓN DE PÁGINAS Realizado por: Alberto Laguarta Calvo Sergio Rios Gil Jesús Quintero Hernández

2 Representación de Documentos y su Aplicación para la Descomposición de Páginas CONTENIDOS La Aplicación y sus fases Bibliografía Ejemplos Introducción

3 Artículo publicado en Marzo de 1998 Autores: Anil K. Jain y Bin Yu OBJETIVO: Transformación de un documento en papel a formato electrónico diferenciando entre las zonas que son imágenes y las que son textos. Contemplando una posible inclinación del documento Representación de Documentos y su Aplicación para la Descomposición de Páginas Document Representation and its Application to Page Decomposition

4 Pasos para digitalizar y descomponer el documento Representación de Documentos y su Aplicación para la Descomposición de Páginas Escanear el documento Procesar los datos para obtener imagen digitalizada Obtener imagen binaria Análisis geométrico del documento Análisis lógico del documento OCR Tablas Gráficos Imágenes

5 Representación de Documentos y su Aplicación para la Descomposición de Páginas CONTENIDOS La Aplicación y sus fases Ejemplos Introducción Bibliografía

6 Pasos a seguir por la aplicación Imagen Original Escala de grises Binarización de la imagen Creación de bolsas Calculo del ángulo Corrección de la orientación Creación de líneas Identificación de las líneas de texto e imágenes Unificación de la líneas en párrafos Representación de Documentos y su Aplicación para la Descomposición de Páginas

7 Obtención de la imagen binaria Binarización de la imagen Si el píxel sobrepasa un nivel de gris determinado En caso contrario Representación de Documentos y su Aplicación para la Descomposición de Páginas Guardamos en una tabla bidimensional la imagen: 1 0

8 Cálculo del ángulo de giro Generación del Histograma Se rota la imagen entre -5 y 5 grados, en pasos de 1º Cada histograma reflejara el número de píxeles negros para cada fila de la imagen Se realiza un barrido de las filas contando el numero de píxeles negros Tendremos un total de 11 histogramas Representación de Documentos y su Aplicación para la Descomposición de Páginas

9 Este es un ejemplo Del cálculo del Ángulo de giro Este es un ejemplo Del cálculo del Ángulo de giro IMAGEN ORIGINAL IMAGEN ROTADA -5º Calculamos el histograma asociado a -5º Este es un ejemplo Del cálculo del Ángulo de giro IMAGEN ROTADA -4º Calculamos el histograma asociado a -4º Ejemplo de aplicación del cálculo del ángulo de giro Representación de Documentos y su Aplicación para la Descomposición de Páginas

10 Donde: Ni = Número de píxeles negros en la fila i N = Número total de píxeles negros. Pi = Probabilidad de encontrar un píxel negro de la fila i en la imagen. Entropía Por lo tanto nuestro objetivo será quedarnos con el ángulo que menor entropía presente Calculamos la entropía para cada histograma Una distribución es compacta cuando la entropía es mínima Representación de Documentos y su Aplicación para la Descomposición de Páginas Definición: Variable que indica el desorden en un sistema

11 Creación de bolsas Realizamos un análisis de la imagen binarizada Estudiamos cada píxel, aplicando 8 adyacencia, así vamos determinando las bolsas. Representación de Documentos y su Aplicación para la Descomposición de Páginas

12 Reorientación de las bolsas Conocido el ángulo de giro y la posición de la esquina superior izquierda, anchura y altura de las bolsas ( Xu,Yu,W,H ) Aplicamos transformación matemática para obtener las bolsas alineadas horizontalmente Representación de Documentos y su Aplicación para la Descomposición de Páginas

13 Creación de líneas Definimos una distancia horizontal Definimos una distancia vertical Creamos una bolsa que contiene a todas las bolsas, que estén a una distancia horizontal y vertical menores que las definidas Representación de Documentos y su Aplicación para la Descomposición de Páginas

14 Identificación de líneas de texto e imágenes Sumamos las áreas de las bolsas que conforman una línea 1.min[W(bi),H(bi)]>Tis 2.Sea menor que 0.4 Representación de Documentos y su Aplicación para la Descomposición de Páginas Tendremos una imagen si se cumplen los siguientes criterios:

15 Unificación de la líneas en párrafos Comprobamos la distancia vertical entre líneas, si no supera un determinado valor, unimos las líneas en párrafos Representación de Documentos y su Aplicación para la Descomposición de Páginas

16 CONTENIDOS La Aplicación y sus fases Ejemplos Introducción Bibliografía

17 Representación de Documentos y su Aplicación para la Descomposición de Páginas Bibliografía Document Representation and its Application to Page Decomposition Trabajos de años anteriores: Un identificador de áreas de texto en documentos de texto e imagen Extracción de líneas de referencia según entropía

18 Representación de Documentos y su Aplicación para la Descomposición de Páginas CONTENIDOS La Aplicación y sus fases Ejemplos Introducción Bibliografía


Descargar ppt "REPRESENTACIÓN DE DOCUMENTOS Y SU APLICACIÓN PARA DESCOMPOSICIÓN DE PÁGINAS Realizado por: Alberto Laguarta Calvo Sergio Rios Gil Jesús Quintero Hernández."

Presentaciones similares


Anuncios Google