La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Realizado por: Alberto Laguarta Calvo Sergio Rios Gil

Presentaciones similares


Presentación del tema: "Realizado por: Alberto Laguarta Calvo Sergio Rios Gil"— Transcripción de la presentación:

1 REPRESENTACIÓN DE DOCUMENTOS Y SU APLICACIÓN PARA DESCOMPOSICIÓN DE PÁGINAS
Realizado por: Alberto Laguarta Calvo Sergio Rios Gil Jesús Quintero Hernández

2 Introducción CONTENIDOS La Aplicación y sus fases Bibliografía
Representación de Documentos y su Aplicación a la Descomposición de Páginas Representación de Documentos y su Aplicación para la Descomposición de Páginas CONTENIDOS Introducción La Aplicación y sus fases Bibliografía Ejemplos Procesamiento de Imágenes Digitales

3 Document Representation and its Application to Page Decomposition
Representación de Documentos y su Aplicación para la Descomposición de Páginas Introducción Document Representation and its Application to Page Decomposition Artículo publicado en Marzo de 1998 Autores: Anil K. Jain y Bin Yu OBJETIVO: Transformación de un documento en papel a formato electrónico diferenciando entre las zonas que son imágenes y las que son textos. Contemplando una posible inclinación del documento

4 Pasos para digitalizar y descomponer el documento
Representación de Documentos y su Aplicación para la Descomposición de Páginas Pasos para digitalizar y descomponer el documento Escanear el documento Procesar los datos para obtener imagen digitalizada Obtener imagen binaria Análisis geométrico del documento OCR Tablas Análisis lógico del documento Gráficos Imágenes

5 CONTENIDOS Introducción La Aplicación y sus fases Bibliografía
Representación de Documentos y su Aplicación a la Descomposición de Páginas Representación de Documentos y su Aplicación para la Descomposición de Páginas CONTENIDOS Introducción La Aplicación y sus fases Bibliografía Ejemplos Procesamiento de Imágenes Digitales

6 Pasos a seguir por la aplicación
Representación de Documentos y su Aplicación para la Descomposición de Páginas Pasos a seguir por la aplicación Imagen Original Escala de grises Binarización de la imagen Calculo del ángulo Corrección de la orientación Creación de bolsas Creación de líneas Identificación de las líneas de texto e imágenes Unificación de la líneas en párrafos

7 Obtención de la imagen binaria
Representación de Documentos y su Aplicación para la Descomposición de Páginas Obtención de la imagen binaria Binarización de la imagen Guardamos en una tabla bidimensional la imagen: 1 Si el píxel sobrepasa un nivel de gris determinado En caso contrario 1

8 Cálculo del ángulo de giro
Representación de Documentos y su Aplicación para la Descomposición de Páginas Cálculo del ángulo de giro Se rota la imagen entre -5 y 5 grados, en pasos de 1º Se realiza un barrido de las filas contando el numero de píxeles negros Generación del Histograma Cada histograma reflejara el número de píxeles negros para cada fila de la imagen Tendremos un total de 11 histogramas

9 Ejemplo de aplicación del cálculo del ángulo de giro
Representación de Documentos y su Aplicación para la Descomposición de Páginas Ejemplo de aplicación del cálculo del ángulo de giro IMAGEN ORIGINAL IMAGEN ROTADA -5º IMAGEN ROTADA -4º Este es un ejemplo Del cálculo del Ángulo de giro Este es un ejemplo Del cálculo del Ángulo de giro Este es un ejemplo Del cálculo del Ángulo de giro Calculamos el histograma asociado a -5º Calculamos el histograma asociado a -4º

10 Definición: Variable que indica el desorden en un sistema
Representación de Documentos y su Aplicación para la Descomposición de Páginas Entropía Definición: Variable que indica el desorden en un sistema Donde: Ni = Número de píxeles negros en la fila i N = Número total de píxeles negros. Pi = Probabilidad de encontrar un píxel negro de la fila i en la imagen. Calculamos la entropía para cada histograma Una distribución es compacta cuando la entropía es mínima Por lo tanto nuestro objetivo será quedarnos con el ángulo que menor entropía presente

11 Creación de bolsas Realizamos un análisis de la imagen binarizada
Representación de Documentos y su Aplicación para la Descomposición de Páginas Creación de bolsas Realizamos un análisis de la imagen binarizada Estudiamos cada píxel, aplicando 8 adyacencia, así vamos determinando las bolsas.

12 Reorientación de las bolsas
Representación de Documentos y su Aplicación para la Descomposición de Páginas Reorientación de las bolsas Conocido el ángulo de giro y la posición de la esquina superior izquierda, anchura y altura de las bolsas ( Xu,Yu,W,H ) Aplicamos transformación matemática para obtener las bolsas alineadas horizontalmente

13 Creación de líneas Definimos una distancia horizontal
Representación de Documentos y su Aplicación para la Descomposición de Páginas Creación de líneas Definimos una distancia horizontal Definimos una distancia vertical Creamos una bolsa que contiene a todas las bolsas, que estén a una distancia horizontal y vertical menores que las definidas

14 Identificación de líneas de texto e imágenes
Representación de Documentos y su Aplicación para la Descomposición de Páginas Identificación de líneas de texto e imágenes Sumamos las áreas de las bolsas que conforman una línea Tendremos una imagen si se cumplen los siguientes criterios: min[W(bi),H(bi)]>Tis 2. Sea menor que 0.4

15 Unificación de la líneas en párrafos
Representación de Documentos y su Aplicación para la Descomposición de Páginas Unificación de la líneas en párrafos Comprobamos la distancia vertical entre líneas, si no supera un determinado valor, unimos las líneas en párrafos

16 CONTENIDOS Introducción La Aplicación y sus fases Bibliografía
Representación de Documentos y su Aplicación a la Descomposición de Páginas Representación de Documentos y su Aplicación para la Descomposición de Páginas CONTENIDOS Introducción La Aplicación y sus fases Bibliografía Ejemplos Procesamiento de Imágenes Digitales

17 Representación de Documentos y su Aplicación a la Descomposición de Páginas
Representación de Documentos y su Aplicación para la Descomposición de Páginas Bibliografía Document Representation and its Application to Page Decomposition Trabajos de años anteriores: Un identificador de áreas de texto en documentos de texto e imagen Extracción de líneas de referencia según entropía Procesamiento de Imágenes Digitales

18 CONTENIDOS Introducción La Aplicación y sus fases Bibliografía
Representación de Documentos y su Aplicación a la Descomposición de Páginas Representación de Documentos y su Aplicación para la Descomposición de Páginas CONTENIDOS Introducción La Aplicación y sus fases Bibliografía Ejemplos Procesamiento de Imágenes Digitales


Descargar ppt "Realizado por: Alberto Laguarta Calvo Sergio Rios Gil"

Presentaciones similares


Anuncios Google