Mariela Proaño Sangolquí, Enero 2016

Slides:



Advertisements
Presentaciones similares
1 Introducción a la minería de datos. 2 Temario ¿Qué es minería de datos? ¿Qué es minería de datos? ¿Quién usa minería de datos? ¿Quién usa minería de.
Advertisements

Lcda. Ingrid Graü Diseño de Sistemas 1. Lcda. Ingrid Graü Diseño de Sistemas 2.
Plataforma electrónica RAEE Estado de situación y desarrollo informático 15 de junio de 2016.
Centro Nacional de Referencia de Aplicación de las TIC basadas en fuentes abiertas "Un modelo para evaluar el futuro de Proyectos Open Source” 01/09/2007.
INFLUENCIA DE LA MODERNIZACION TECNOLOGICA EN LOS SISTEMAS DE MANTENIMIENTO DE SEÑALIZACION EN LA C.A. METRO DE CARACAS JOHAN PERDOMO C.I.: CARACAS,
Compensaciones y Beneficios Sonia Boiarov. RESULTADO PRINCIPIOS EQUIDAD INTERNA COMPETITIVIDAD EXTERNA INDIVIDUALIDAD HERRAMIENTAS ANALISIS, DESCRIPCION;
Sistemas de Información desarrollados con MÉTRICA © 2008 SADIEL Prohibida su Reproducción Formación vía internet: cómo dejar atrás el pilotaje Octubre.
Diseños de investigación.  Arnau (1995a) define el diseño de investigación como un plan estructurado de acción que, en función de unos objetivos básicos,
Evolución de los MOOC en el ámbito investigador mediante técnicas de análisis de contenido D. G. Reina, S. L. Toral, M. R. Martínez-Torres, F. Barrero.
BASE DE DATOS EN LA WEB POR- OSIRYS MARCIAGA JESUS NIETO.
ARKDIA – CAPACITACIÓN powered by
Metodología de la investigación
Curso de Administración Financiera
SISTEMA DE COSTEO ABC.
Unidad III Etapas del Proceso Administrativo Facilitador:
DEPARTAMENTO DE ELÉCTRICA Y ELECTRÓNICA
Tema DISEÑO E IMPLANTACIÓN DE UNA SOLUCIÓN INFORMÁTICA INTEGRADA QUE APOYE AL DESARROLLO DEL PENSAMIENTO CRÍTICO EN LA CARRERA DE INGENIERÍA EN SISTEMAS.
Sistemas de Información Gerencial Ing. Luis Enrique Acosta Medina.
Legisoffice Versión 1.0..
CURSO DE EXCEL AVANZADO
DIAGRAMAS Una Poderosa Herramienta Gráfica para el Análisis e Interpretación de los Procesos.
Gestión del SAT de un taller con Android
Sistemas de Información Geográfica
DOCUMENTO FUNCIONAL Versión 1.0 GIM ANDROID 2014
DOCUMENTO FUNCIONAL Versión 1.0 GIM ANDROID 2015
EDWIN SANTIAGO YACELGA MALDONADO SANGOLQUÍ – ECUADOR 2016
Uso de tablas de datos de resultados
PROYECTOS DE CIENCIAS ENSEÑANZA MEDIA 2015 COLEGIO INGLÉS DE TALCA
Proyecto de Titulación:
ARQUITECTURA DE HARD WARE COMPONENTES EN BLOQUES DEL PROCESADOR
Francisco Xavier Encalada Acosta Sangolquí, Febrero 2017
BIG DATA e INTERNET DE LAS COSAS
Lenguaje y representación técnica
Indicadores de Gestión Dr. RAFAEL OCTAVIO SILVA LAVALLE ADMINISTRACION II.
INVESTIGACIÓN DE CAMPO
Integrantes: Marina Arrieta JeanyHen Pantoja Jenifer Tellez
TECNOLOGIA.
Programa de Proyectos Modulares de Ingeniería Química
GESTION DEL RIESGO «En el colegio María Auxiliadora Educamos con Calidad para un proyecto de Felicidad» SISTEMA DE GESTION DE CALIDAD.
PRESENTADO POR: IVONNE HERNANDEZ
DEPARTAMENTO DE ELECTRICA Y ELECTRÓNICA
Proyecto de Ipo Panificador de viajes y rutas
DIAGRAMAS Una Poderosa Herramienta Gráfica para el Análisis e Interpretación de los Procesos.
Scratch Presentado por: Sharon Daniela Bustos Barón. 901 J.M.
ESCUELA POLITÉCNICA DEL EJÉRCITO - ESPE
T E M A S D E A N Á L I S I S Análisis Vertical Análisis Horizontal.
Curso de Administración Financiera
Autores: Ñauñay Colcha Jorge Luis Bravo Maldonado Paulo Dennis
Plataforma Nacional de Transparencia
Recomendaciones: Utiliza viñetas para todas las diapositivas.
EVALUACIÓN DE LAS TAREAS DEL PERSONAL DE OFICINA
Titulo de la comunicación – Arial 24
Universidad Tecnológica Fidel Velázquez
¿Cómo ligar la unidad a la prueba?
Modelo Instruccional Dick & Carey
CAPITULO 11: ESTRATEGIA Y EXCELENCIA EN EL DESEMPEÑO Brayam Daniel Olvera Salazar Maleny Judith Coronado González
Titulo de la comunicación – Arial 20
Manual de funciones y de procedimientos
Vicerrectoría Académica Dirección de Formación General Programa de Emprendimiento PROTOTIPOS.
Titulo de la comunicación – Arial 24
FORMATO PARA LA CAPTURA DE INFORMACIÓN DE LOS PROTOCOLOS
“DE LA ACADEMIA AL CIUDADANO”.
Diagramas de Interacción. Escuela de Ingeniería en Sistemas Computacionales Facultad de Ciencias Matemáticas y Físicas Universidad Estatal
CONTROLES Y ESTRUCTURAS BÁSICAS DE PROGRAMACIÓN  1. Algoritmos: conjunto de instrucciones programadas para resolver una tarea específica.  2. Datos:
Implementación de cursos virtuales para la disciplina Sistemas de Telecomunicaciones en la Plataforma Moodle Autor:. Pytsou-Guychel Engoua Tutor:. Yudisleidy.
Ing. Patricia Acosta, MSc. Blog: EXCEL.
Plan de Sistemas de Información (PSI). Plan de Sistemas de Información (PSI) Descripción y Objetivos Tiene como objetivo la obtención de un marco de referencia.
Autor: Dr. C. Buenaventura Lázaro Castells Gil. Profesor Auxiliar
SIMULACIONES 2019 German Vega Quintero John Farley Paez Santamaria.
Transcripción de la presentación:

Mariela Proaño Sangolquí, Enero 2016 ESTUDIO Y ANÁLISIS DE NUEVAS CARACTERÍSTICAS DISCRIMINANTES, A TRAVÉS DE HABILIDADES HUMANAS CON COLABORACIÓN EXTERNA Y MASIVA, Y COMPARACIÓN DE DESEMPEÑO CON RESPECTO A SISTEMAS AUTOMÁTICOS BASADOS EN DTW. Mariela Proaño Sangolquí, Enero 2016

Temario Planteamiento del problema Objetivo Marco Teórico 3.1 Crowdsourcing 3.2 Amazon Mechanical Turk 3.3 Atributos Inspirados en FDEs para Reconocimiento de firma manuscrita Protocolos De Experimentación 4.1 Diseño del sistema de experimentación 4.2 Human Intelligence Tasks (HIT) 4.3 Evolución de FAR y FRR 4.4 Comparación de desempeño y Características Discriminantes Conclusiones y Trabajo Futuro

Planteamiento del problema Genuinas Introducción sobre firmas y su uso en la sociedad Hablar sobre intravariabilidad de firmas Problema en reconocer firmas Q se puede hacer Firmas genuinas y falsificadas de 2 usuarios distintos.

2. Objetivo Estudiar, analizar y comparar el desempeño entre un sistema automático de reconocimiento dinámico de firmas basado en DTW con un sistema que utiliza habilidades humanas por medio de crowdsourcing para la determinación de nuevas características discriminantes.

3. Marco Teórico 3.1 Crowdsourcing 3.2 Amazon Mechanical Turk 3.3 Atributos Inspirados en FDEs para Reconocimiento de firma manuscrita

Características Crowdsourcing Multitud (crowd) definida Tarea con un objetivo claro La recompensa recibida por la multitud es clara El crowdsourcer está claramente identificado La compensación recibida por el crowdsourcer está definida Es un proceso asignado en línea de tipo participativo Utiliza una convocatoria abierta de longitud variable Utiliza el Internet tipo de actividad online participativa individuo, institución, organización sin fines de lucro o compañía conjunto de personas con distintos tipo de conocimiento, pluralidad, y número, a través de una convocatoria libre, a realizar voluntariamente una tarea

Ventajas Crowdsourcing Gran flujo de personas participantes Maximiza resultados Alta rapidez de respuesta Bajo costo de operación

Proyectos Relacionados vía Crowdsourcing Estudios de Investigaciones utilizando Etiquetaciones por humanos como los aplicados a sistemas de reconocimiento automático en la cara1, gait2, y seguridad3. 1L. Best-Rowden, S. Bisht, J. Klontz and A. K. Jain. Unconstrained Face Recognition: Establishing Baseline Human Performance via Crowdsourcing 2D. Martinho-Corbishley, M. S. Nixon, Mark, J. N. Carter. Soft Biometric Recognition from Comparative Crowdsourced Annotations 3S. Panjwani, A. Prakash. Crowdsourcing Attacks on Biometric Systems

3.2 Amazon Mechanical Turk (MTurk) Requesters Workers Personas naturales o empresas Crear HITs HITs implementadas por el requester (menor costo) HITs implementadas por Amazon (mayor costo) 500.000 workers de 190 países Workers y Master workers Sin experiencia en reconocimiento de firmas Categorización por desempeño La plataforma tecnológica permite la realización de trabajos sencillo y de costo reducido que requieren un determinado nivel de inteligencia que una computador no es capaz de efectuar Requester: personas naturales o empresas que se encargan de crear las tareas en MTurk para que los workers trabajen en ellas Workers: realizar tareas sencillas llamadas HITs a cambio de una recompensa monetaria. 500mil de 190 países. Explicar los tipos de workers (normales y masters)

3.2 Amazon Mechanical Turk (MTurk) Requesters Workers Workers aceptan HITs Proyecto Creación de HITs Visualización de HITs disponibles Publicación de HITs Proyecto Terminado Workers realizan y responden HITs Aprobación/Rechazo HITs

3.2.1 Creación de Proyectos

3.2.2 Edición propiedades HIT Descripción de la actividad a los workers

3.2.2 Edición propiedades HIT Configuración de la actividad

3.2.2 Edición propiedades HIT Opciones avanzadas configuraciones workers

3.2.3 Diseño HIT Aquí se realiza la creación y modificación del código de la HIT

3.2.4 Publicación HIT

3.2.5 Administración HIT

3.2.6 Envío y recepción de datos HIT Archivo CSV de entrada Archivo CSV de salida

Atributos 1,2,3 inspirados por los FDEs en reconocimiento de firma 3.3 Atributos Inspirados en FDEs para Reconocimiento de firma manuscrita Presión homogénea Lentitud de grafiado Falta de tension y agilidad Pausas Inicios y finales bruscos Diferencia en la forma de los caracteres, tamnaño y proporción Dirección del movimiento diferente Atributos 1,2,3 inspirados por los FDEs en reconocimiento de firma 1L. Oliveira, E. Justino, C. Freitas, R. Sabourin. The graphology applied to signature verification 2J. Coetzer, B.M. Herbst, J.A. Du Preez. Off-line signature verification: A comparison between human and machine performance. 3T. M. Burkes, D. P. Seiger and D. Harrison. Handwriting examination: Meeting the challenges of science and the law.

4. Protocolos de Experimentación y Análisis 4.1 Diseño del sistema de experimentación 4.2 Human Intelligence Tasks (HIT) 4.3 Evolución de FAR y FRR 4.4 Comparación de desempeño entre sistemas

4.1 Diseño del Sistema de experimentación Workers

4.1.1 Elementos de HIT Instrucciones Firmas Opciones Justificación

4.2 Human Intelligence Tasks (HIT) 4.2.1 HIT 1 Comparación uno a uno (1 train vs. 1 test) HIT 1.1, HIT 1.2 y HIT 1.3 4.2.2 HIT 2 Comparación uno a ocho (1 train vs. 8 test) 4.2.3 HIT 3 Comparación cuatro a uno (4 train vs. 1 test)

4.2.1 HIT 1 (1 train vs. 1 test)

4.2.1 HIT 1 – Análisis Tabla 1 Rendimiento HIT 1.1 – 1.3 Tarea FRR (%) FAR (%) ND (%) HIT 1.1 26.7 30.0 33.3 HIT 1.2 40.0 25.0 HIT 1.3 43.3 21.7 Base De Datos BIOSECURE DS2 → 6 Firmantes Objetivo Analizar el rendimiento del humano con diferente tipo de información tales como estática y dinámica (imagen, trazo y características de la firma.) Tiempo de ejecución 2 minutos (*1’12’’) Cantidad de workers 60

4.2.2 HIT 2 (1 train vs 8 test) - Análisis Base de datos BIOSECURE DS2 → 6 Firmantes Objetivo Evaluar el desempeño del humano en reconocimiento de firmas con poco tiempo y poca información Tiempo de ejecución 1 minuto (*50’’) Cantidad de workers 30 Tabla 2 Rendimiento HIT 2 Tarea FRR (%) FAR (%) HIT 2 80.0 7.8

4.2.3 HIT 3 – Análisis Tabla 3 Rendimiento HIT 3 Base de Datos BiosecurID → 4 Firmantes Objetivo Comparar el rendimiento del humano en un posible escenario real con mayor información. Tiempo de ejecución 3 minutos (2’) Cantidad de workers 60 TAREA FRR (%) FAR (%) HIT 3 31.1 40.3 14% mejoramiento 70 % mejoramiento Umbral

4.3 Evolución de FAR y FRR WORKERS FAR % FRR % 1 37,6 31,4 5 35,7 17,2 Tabla 4 Evolución FAR y FRR de acuerdo al número de respuestas combinadas WORKERS FAR % FRR % 1 37,6 31,4 5 35,7 17,2 10 31,8 13,2 20 30 10,4 50 26,4 8,1 100 23,8 7 200 300 400 40 % mejoramiento FAR 80 % mejoramiento FRR

4.4 Comparación de desempeño entre sistemas Método FRR (%) FAR (%) DTW 2.92 2.93 Manual 9.46 10.96 Crowdsourcing 31.40 37.60 Método FRR (%) FAR (%) DTW 2.92 2.93 Manual 8.88 11.21 Crowdsourcing 7 23.8 Tabla 5 Rendimiento sin combinación de respuestas Tabla 6 Rendimiento para la combinación de 100 respuestas

5. Conclusiones y Trabajos Futuros 5.1 Conclusiones 5.2 Trabajos Futuros

5.1 Conclusiones Crowdsourcing se convierte en una herramienta y recurso importante para el reconocimiento de firmas por su amplia cantidad y variedad de participantes. MTurk es una plataforma apropiada para poner en marcha crowdsourcing. Las HITs, han permitido entrenar a que un humano tenga o mejore la habilidad para poder identificar una firma a través de diferente información expuesta

5.1 Conclusiones La investigación y análisis de respuestas obtenidas de los workers, indican que por sí solos no son competentes y hábiles para el reconocimiento de firma Al combinar las respuestas (500 workers) de cada uno de ellos se observa que el rendimiento mejora en términos de FAR un 40% y FRR un 80%. Los resultados de rendimiento en etiquetación manual y de crowdsourcing aplicados al reconocimiento de firma visualizan un futuro prometedor ya que al combinar sus respuestas podrán dar un mejor rendimiento

5.1 Conclusiones Los criterios de las respuestas de los workers permiten extraer características discriminantes de una firma tales como: dimensión, punto inicial y final, patrón, estilo de letra y desplazamiento.

5.1 Conclusiones Punto inicial y final Dimensión Patrón Punto final

5.1 Conclusiones Estilo de letra Desplazamiento

Área total ocupada por la firma 5.1 Conclusiones Área total ocupada por la firma Perímetro Legibilidad Proporcionalidad

5.1 Conclusiones Área ocupada por un caracter Conexión entre caracteres Presión del punto inicial y final Punto inicial Punto final

5.2 Trabajos futuros 1 Los resultados combinados de rendimiento en etiquetación manual y de crowdsourcing aplicados al reconocimiento de firma visualizan un futuro prometedor en la investigación de selección y depuración de características discriminantes 2 Generación de nuevas HITs vía crowdsourcing en reconocimiento de firmas mejorando o estableciendo nuevos parámetros tales como: número de firmantes, número de workers, niveles de comparación, enfocados a nuevos escenarios de asistencia humana.