Reconocimiento de Escritura Manuscrita

Slides:



Advertisements
Presentaciones similares
TÉCNICAS DE REPRESENTACIÓN DE LA INFORMACIÓN
Advertisements

1. Visión Artificial Industrial. Introducción.
Bivariadas y Multivariadas
PHP-MYSQL OPERADORES EN PHP
INTERFAZ DE ACCES DISEÑO DE BASE DE DATOS
Investigación Operativa
Johanna Lizeth Rodríguez Lorena Fda. Chávarro Ramos
DE LAS CUENTAS DE USUARIO Y OPCIONES DE CARPETA
Introducción a Funciones de una variable
Ecuación de Schrödinger
Supongamos que nos plantean el siguiente problema:
Seleccionar texto Seleccionar texto es un proceso muy utilizado para trabajar con un documento ya que permite aplicar las funciones a todo el texto seleccionado.
Método de Gauss-Seidel
La Derivada. Ya vimos: los conceptos, métodos ó instrumentos necesarios para establecer el “comportamiento” de una función.  en un entorno de x o [ 
Resolución gráfica de problemas de Optimización
Teoría de lenguajes y compiladores
TIPOS DE DISEÑO EN LA PRUEBA DE MECs CON ESTUDIANTES La prueba de un MEC puede hacerse de varias maneras, dependiendo de lo que se desea establecer y el.
Procesamiento de Imágenes Digitales
Cap. 9 Sistemas de Partículas
Sesión 6: Campos de Markov
Reconocimiento y resolución de ecuaciones impresas Luis Fernández Pérez Marco Antonio Formoso Trigo.
Ecuaciones Algebraicas
Sergio Marín Pulido Alberto Campos Galeano José Carlos Requeijo Puente
EL MALLADO HEXAGONAL Dolores Bonilla Silva Daniel González Ortegón Remedios Gutiérrez Martínez.
MÉTODO DE PIXELES DE BORDE
Diagramación Mental ¿Quién es el creador de los mapas mentales?
Método geométrico de reconocimiento de caracteres numéricos impresos Jorge Bitar López Eduardo Montero Ruiz Javier Sevillano Jiménez.
Marcas de agua en el dominio del espacio Realizado por: Alejandro Pazos Castillo José Antonio Mateos García Aplicación práctica orientada a la Esteganografía.
Fracciones equivalentes
COMPRESIÓN AUTORREGRESIVA Y CASI SIN PERDIDA Autores: Antonio Fernández Carpio Francisco José Lamela Rincón.
RECONOCEDOR DE CARACTERES ARÁBIGOS
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Metodología para solución de problemas
El Método Científico. Recopilación y elaboración:
Informática Médica: Procesamiento de imágenes
Problema de inclusión en una Curva Digital Por Orellana Muñoz, Alfonso Paz Vicente, Rafael Pérez Medina, Gerardo Rodríguez Naranjo.
Adelgazamiento de Imágenes RGB
CARPLATE Reconocimiento del marco de la matrícula de un coche
MoMento S Grupo 33: Ignacio Ayllón Benito Félix A. Velázquez Salas.
SUBSTRACCIÓN DE IMÁGENES
Profesor: Luis Miguel Iglesias Albarrán
RECURSO EDUCATIVO: Pros y contras Carmen Jardón Fernández Ana Fernández Díaz Alejandra López Ruiz Isabel Ruiz de Zárate Olga Martínez Tapia.
Por fin llegamos al primer átomo !!!
Introducción al análisis de expresiones
Reconocimiento De Caracteres Manuscritos
EJEMPLO: “BANCO HIDRÁULICO”
Tecnologías para el Aprendizaje
Es un programa sorprendente con un diseño mejor y más eficaz que el de las versiones anteriores. Pero quizás le resulte poco familiar. Por ese motivo.
SISTEMAS EXPERTOS (SE) Coronel Jaramillo Ricardo
Juan Antonio Cano Salado Borja Moreno Fernández
Reconocimiento de caras usando Histogramas de Gradientes Orientados
1 Practica 5 Transparencia en AE. Bibliografía José Luis Fernandez. “Postproducción digital”. Escuela de cine y vídeo Gonzalo Pajares. “Imágenes.
MÉTODOS DE ANÁLISIS EN LA TOMA DE DECISIONES EXISTEN PROCEDIMIENTOS DE ORDEN MATEMÁTICO, FINANCIERO, ECONÓMICO, ESTADÍSTICO ENTRE OTROS, PARA LA TOMA DE.
Ing. En sistemas computacionales Fundamentos de investigación
Microsoft Power Point Tema: “Como manejo del Power Point como herramienta estudiantil”.
Guadalupe Martínez Hernández.  La tarea de la Segmentación de imágenes es de : Encontrar un grupo de pixeles “juntos”.  En estadística este problema.
Las fórmulas más usadas en excel
Desarrollo de lógica algorítmica.
Pixelación de imágenes avanzada usando el algoritmo slic
DIAGRAMA DE HILOS Este tipo de diagrama nos ayuda a estudiar la trayectoria detallada del movimiento de materiales, el movimiento de las manos del operario.
Reconocimiento de cara basado en “espectrocara”
INFERENCIA ESTADÍSTICA
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Diseño de rótulos Para hojear, no leer. Capitulo 3.
Mini-video 2 de 5 Materia: Límites de funciones Continuidad de funciones Prácticas con Introducción a Funciones de una variable.
Ing. Haydeli del Rosario Roa Lopez
INFORMÁTICA GRÁFICA - Docente: Diego Fdo. Villalobos G. La Anatomía del Mensaje Visual Informática Gráfica.
Este trabajo tiene como fin demostrar las distintas formas de calcular el área de la función En el intervalo cerrado [-1,1] A través de las sumas de.
Métodos en Java. Estructura de un programa en Java ► La relación con la vida misma la podemos ver en el siguiente comentario: Imaginemos que dos clases.
Cálculo de área por medio de la sumas de Riemann Alumnas: Maciel Gisella, Uliambre Sabrina Profesora: Nancy Debárbora Curso: 3er año del prof. En matemáticas.
Transcripción de la presentación:

Reconocimiento de Escritura Manuscrita Reconocimiento de Escritura Manuscrita. ~Caso Práctico: Un reconocedor de vocales~ Francisco Pazo Sánchez Pablo Maldonado López Manuel Argenis Rodríguez Gutiérrez

1.- Introducción Vamos a ver como hacer un reconocedor de escritura manuscrita, en concreto uno de vocales. Veamos un par de conceptos, como la Visión Artificial, clasificador de imágenes... En todo reconocedor tenemos cuatro fases generales: Obtener el Original a tratar. Preprocesarlo para simplificar su análisis. Sacar sus características más importantes. Procesar estas características para ver a que patrón se acerca más a imagen original. Estas cuatro fases se repetirán en cualquier reconocedor que veamos, sea de lo que sea.

2.- Problemática No sabemos como vemos, es el gran problema de la IA, donde podemos englobar el reconocimiento de escritura manuscrita. ¿cómo saber donde comienza una letra y acaba la anterior? Saber interpretar los espacios y la inclinación de los renglones. Diversidad de patrones de escritura distintos para una misma letra. Muchos otros problemas...

Pero el gran problema en esto, como en casi todo es la falta de cooperación entre los investigadores y la falta de una línea de investigación única, con lo que todo avanzaría a una mayor velocidad

3.- Metodología General Fases del proceso general para reconocer: Adquisición Pretratamiento Segmentación Reconocimiento – Clasificación Post-tratamiento

Adquisición Binarización de la escritura Dos tipos: “en línea” “en diferido” - PDA - Scáners - LCD - Cámaras - Papel electrónico - Imágenes

Pretratamiento Sirve para reducir variables en el problema. Métodos Generales Filtrado y adelgazamiento Enderezar línea base de la escritura Enderezar pendiente en letras Normalizar caracteres (por ahora imágenes)

Pretratamiento Métodos en la escritura “en diferido” Estructuración de Manuscritos Separación de líneas y párrafos Esqueletización Adelgazamiento del trazo completo (erosionando).

Pretratamiento Métodos en la escritura “en línea” Eliminación de puntos aislados Elevaciones de estilo y restablecer uniones Normalizar contornos Normalizar puntos de acentuación

Segmentación Consiste en dividir el documento en diferentes entidades lógicas. Entidades a nivel de palabras Entidades a nivel de letras. ¡Ojo! No serán probablemente ni palabras ni letras Dificultad: No suele haber relación entre estas entidades lógicas y físicas...

Segmentación Misión: Localizar zonas de interés en el texto y separar por ahí. Localizaciones: Palabras Letras C.Conexas Explícitos Proyecciones Implícitos I. Exhaustivos

Reconocimiento Métodos Globales y Métodos Analíticos Reconocimiento de Caracteres Aislados Reconocimiento de Palabras Caracteres Aislados: Globales: Poco adaptados no se usan excepto los basados en programación dinámica.

Reconocimiento Métodos Analíticos: Geométricos y Estadísticos Estructurales Neuro-Miméticos Markovianos Basados en I.A. De Zadeh Mixtos

Reconocimiento Reconocimiento de Palabras Métodos Globales: Por cadenas de símbolos, deterministas y probabilistas. Métodos Analíticos: Generalización de los usados en caracteres aislados. Implícitos: Basados en predicciones y derivados de los markovianos.

Post-tratamiento Se trata de la parte menos metódica. Depende de la aplicación del reconocimiento. Generalmente: Afinan el reconocimiento, valiéndose de conocimientos lingüísticos.

4.- Aplicaciones Las aplicaciones de reconocimiento de escritura manuscrita son cada vez más cercanas y útiles,un claro ejemplo lo tenemos en las PDA´s y Pocket PC´s La policía y los bancos lo usan para comprobar la autenticidad de firmas y documentos. Encontramos varias aplicaciones muy peregrinas, como: El proyecto de una universidad de México para usar esta técnica con antiguos documentos de su República y luego colgarlo en una web para que todo el mundo tenga acceso a ellos También el proyecto de www.manolo.net, con el que impedidos visuales podrán leer cualquier tipo de documento manuscrito con ayuda de un ordenador y un escáner.

5.- Nuestro Método Deberemos de tener en cuenta las cuatro fases de todo reconocedor Primero: Tomar una imagen .jpg, abrirla y guardarla en una matriz cuadrada para su manipulación. Segundo: Preprocesarlo. Es decir, binarizar la imagen y adelgazar la imagen. Tercero: Características. Conseguir el vector de características. Usamos el código cadena de la imagen y calculamos en número de “puntos finales” Cuarto: Con estas características ver a cual de las cinco vocales se parece más nuestra imagen.

5.1.- Imagen original Creamos una imagen jpg en un editor cualquiera, por ejemplo el paint. Volcamos su información en una matriz cuadrada. De esta manera trataremos de una manera mucho más eficaz en nuestros algoritmos la imagen Poco más en este apartado

5.2.- Preprocesado Binarizamos la imagen, es decir, la convertimos en una matriz de 0´s y 1´s. De esta manera eliminamos considerablemente el tamaño de información a tratar. Adelgazamos la imagen. Para hacerlo usamos un algoritmo que va eliminando píxeles no finales y que al quitarlos no cambia la estructura de la imagen. Lo hacemos con varias iteraciones, haciendo recorridos desde el norte, este, sur y oeste, hasta que la imagen ha quedado adelgazada.

5.3.- Vector de Características Para calcular el vector de características hemos hecho uso del Código Cadena en 8-adyacencia, ya conocido por todos. También hemos ideado un método para obtener una característica bastante útil para nuestro reconocimiento. Si nos fijamos en la cantidad de puntos finales de las vocales, podemos ver: La 'A' tiene 2 píxeles terminales La 'E' tiene 3 píxeles terminales La 'I' tiene 4 píxeles terminales La 'O' tiene 0 píxeles terminales La 'U' tiene 2 píxeles terminales

5.4.- Comparación Del código cadena obtenemos si la imagen original tiene componentes cerradas. Otra característica que obtenemos es si la imagen tiene concavidades. Esto junto a nuestro calculo de puntos finales nos es suficiente para saber que letra es la de la imagen original. ¿cómo?, vamos a verlo...

5.4. ¿Como? Tenemos una array[5] donde vamos guardando la posibilidad de que la imagen sea cada una de las vocales Le hemos dado un peso a cada una de las características calculadas. Cuando una letra cumple una característica, su valor dentro del array se incrementa según el peso que tenga dicha característica. Al final, la que tenga un mayor valor será la que el programa de por buena.

6.- Conclusiones El reconocimiento de escritura manuscrita parece que poco a poco va entrando en nuestra vida, con aplicaciones muy cercanas, y claros ejemplos de tecnología casera, como las Palms. No hay que olvidar, no obstante, que es un campo en el que queda aún mucho por estudiar y que mientras que las distintas líneas de investigación sigan por caminos distintos, no avanzará tanto como pudiera. El futuro del reconocimiento de la escritura manuscrita, parece que permitirá dotar de Visión Artificial a programas y autómatas. El campo de las aplicaciones de esta materia es muy amplio y con gran futuro. Debemos intentar que las aplicaciones sean lo más humana posible, y que de verdad llegue a quien la pueda sacar un mayor partido en el sentido humano de la palabra.

¡Fin! Gracias a todos por su atención... Esperemos que no haya sido muy pesado... Suerte a todos en los exámenes... Trabajo realizado por: Francisco Pazo Sánchez Pablo Maldonado López Manuel Argenis Rodríguez Gutiérrez