PROGRAMA DE MAESTRÍA EN REDES DE INFORMACIÓN Y CONECTIVIDAD MRIC-II ANÁLISIS DEL DESEMPEÑO DE ALGORITMOS DE DETECCIÓN DE EVENTOS VULCANOLÓGICOS BASADOS.

Slides:



Advertisements
Presentaciones similares
¿ Que es una muestra?.
Advertisements

Inteligencia artificial y sus aplicaciones
Jacqueline Chávez Cuzcano
Mariano Alcántara Eduardo
Monitoreo y detección temprana. Parte I Bases epidemiológicas para el control de la enfermedad – Otoño 2001 Joel L. Weissfeld, M.D. M.P.H.
MÉTODOS DE ESTIMACIÓN Y GESTIÓN DEL RIESGO
Relaciones y diferencias entre minería de datos y estadística
ANALISIS DE RIESGOS.
METODOS CUALITATIVOS DE RECOLECCION DE DATOS
SIMULACIÓN DE SISTEMAS DE CONTROL
Control de Gestión Sistemas ABC.
Evaluación de Desempeño
INSTITUTO POLITÉCNICO NACIONAL
K-NN: K vecinos más cercanos
INVESTIGACIÓN SOBRE EL ESTADO DEL ARTE EN EL DESARROLLO DE PROVEEDORES EN MÉXICO
BASES de la ELECTROMEDICINA
Diseño de un Sistema de Control en Tiempo Real para el Kernel del Sistema Operativo utilizando MatLab-SimuLink Por: MARCO ANTONIO ESPINEL CANGUI DIRECTOR:
Técnicas de Capacitación
HERRAMIENTAS PARA EL CONTROL ESTADÍSTICO DE CALIDAD.
APRENDIZAJE WIDROW- HOFF
REDES NEURONALES ARTIFICIALES
UNIVERSIDAD CENTRAL DE VENEZUELA FACULTAD DE HUMANIDADES Y EDUCACIÓN COMISIÓN DE ESTUDIOS DE POSTGRADO MAESTRÍA EN EDUCACIÓN SUPERIOR PERFIL DEL PROFESOR.
Maracaibo, 5 de Noviembre de 2007 Universidad del Zulia Facultad de Ingeniería Instituto de Cálculo Aplicado Universidad del Zulia Facultad de Ingeniería.
Representación del Conocimiento
Aprendizaje Automatizado
República de Colombia Ministerio de Hacienda y Crédito Público LA TECNOLOGÍA COMO HERRAMIENTA PARA LA DETECCIÓN DE LAVADO DE ACTIVOS Bogotá, D.C. Unidad.
Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".
UNIVERSIDAD MICHOACANA DE SAN NICOLÁS DE HIDALGO
Importancia de las aplicaciones de estadística en el control de procesos Guatemala 2010.
Representando para Aprender
DESARROLLO MODELO RESOLUCION MODELO ¿VALIDA? MODELO MODIFICADO IMPLEMENTACION DEFINICION DEL PROBLEMA t.
GRUPO DE INVESTIGACION EN CONTROL INDUSTRIAL
Importancia de Evaluar Sitios Web Diversas características y atributos de calidad de sitios Web tales como usabilidad, navegabilidad, seguridad, características.
RESUMEN En este artículo se describe en forma breve una de las líneas de investigación que se están llevando a cabo en el Laboratorio de Tecnologías Emergentes.
Reconocimiento de Patrones
Descripción de Contenidos con Wavelets Jaime Gaviria.
UNIVERSIDAD NACIONAL INTERCULTURAL DE LA AMAZONIA
Contenido Identificación de sistemas con redes neuronales Modelado de dinámica temporal de las manchas solares.
Facultad de Marketing y Comunicación Asignatura: Administración de Recursos Humanos Titulo: Retorno de la inversión en la capacitación Profesora:
José Ángel González Fraga, Erika. M. Ramos Michel, Facultad de Telemática, Universidad de Colima V TALLER DE PROCESAMIENTO.
Santiago, Diciembre 2010 LEVANTAMIENTO DE PERFILES DE COMPETENCIAS:
Métodos de calibración: regresión y correlación
MEDIDAS DE PRECISIÓN Fijación de complemento = FC Sensibilidad = Se
Acciones Correctivas Preventivas Mejora
INSTITUTO DE CIENCIAS Y ESTUDIOS SUPERIORES DE TAMAULIPAS, A.C.
Sistemas, Procesos y Modelos
PROGRAMAS DE GESTION HUMANA
CICLO DE VIDA Y NORMAALIZACION DE UN SISTEMA DE BASE DE DATOS
UNIDAD 1.- EVALUACIÓN DE DATOS ANALITICOS
Programa de Auditoría Interna
PC BD Alexandra Buri H José Rivera De La Cruz.
LA INVESTIGACION CIENTIFICA
Identificacion con redes neuronales
(Validez de un estudio)
LOS SISTEMAS DE INFORMACIÓN INVESTIGACIÓN DE MERCADOS
Maracaibo, 26 de Mayo de 2006 Universidad del Zulia Facultad de Ingeniería División de Postgrado Maestría en Computación Aplicada Universidad del Zulia.
INSTITUTO DE CIENCIAS Y ESTUDIOS SUPERIORES DE VERACRUZ
El plan de investigación
Entrenamiento, Capacitación, y Desarrollo de los Recursos Humanos.
Métodos de investigación en la psicología clínica
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.
Por: Agustín Audor Julian Tole
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Validación de modelos, de la teoría a la práctica Jorge Enrique Gómez C..
ALEXIS VERA LUIS VERA 5 SEMESTRE Estas herramientas nos sirven para controlar procesos, resolver problemas, tomar decisiones. Además de ser una.

DEPARTAMENTO DE ELÉCTRICA Y ELECTRÓNICA INGENIERÍA EN ELECTRÓNICA Y TELECOMUNICACIONES TEMA: ‘CARACTERIZACIÓN DE SEÑALES SÍSMICAS DEL VOLCÁN COTOPAXI UTLIZANDO.
Identificando a los pobres en América Latina y el Caribe. Conceptos y práctica Luis Tejerina XI Reunión Hemisférica de la Red de Pobreza y Protección Social.
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
Investigación de Mercados
Transcripción de la presentación:

PROGRAMA DE MAESTRÍA EN REDES DE INFORMACIÓN Y CONECTIVIDAD MRIC-II ANÁLISIS DEL DESEMPEÑO DE ALGORITMOS DE DETECCIÓN DE EVENTOS VULCANOLÓGICOS BASADOS EN MACHINE LEARNING‏

Agenda 1 Planteamiento del Problema 2 Justificación 3 Objetivos 4 Metodología 5 Conceptos 6 Resultados 7 Selección de Características 8 Conclusiones 02/04/2015Juan Francisco Morejón 2

Planteamiento del Problema Ecuador Naturaleza Cordillera de los Andes Volcanes activos 02/04/2015Juan Francisco Morejón 3

Planteamiento del Problema Zonas Pobladas Tungurahua Cotopaxi Reventador 02/04/2015Juan Francisco Morejón 4 IGEPN Vigilancia D Elementos tradicionales D Alto costo de implementación D Depende de habilidades humanas

Justificación Plan Nacional de Buen Vivir Políticas y lineamientos Mejorar sistemas de control para identificar y mitigar amenazas ante riesgos naturales Secretaría Nacional de Planificación y Desarrollo Recursos para identificar, analizar, prevenir y mitigar riesgos para enfrentar y manejar eventos de desastre. Secretaría Nacional de Gestión de Riesgos 02/04/2015Juan Francisco Morejón 5

Justificación Investigación de monitorización volcánica han determinado el empleo de WSN Solución robusta y global Estructura de red TransmisiónDetecciónBajo costoClasificación 02/04/2015Juan Francisco Morejón 6 Alerta temprana Decisión oportuna Salvar Vidas

Objetivos Analizar el desempeño de algoritmos de clasificación de eventos vulcanológicos basados en machine learning, para su empleo en sistemas de supervisión y alerta temprana del volcán Cotopaxi. Determinar los algoritmos de clasificación de eventos aplicados a la monitorización volcánica. Implementar a nivel de simulación tres algoritmos de clasificación. Probar y validar tres algoritmos de clasificación con información real para determinar su desempeño. Determinar el/los mejor/es algoritmo/s de clasificación de eventos volcánicos para el volcán Cotopaxi. 02/04/2015Juan Francisco Morejón 7

Agenda 1 Planteamiento del Problema 2 Justificación 3 Objetivos 4 Metodología 5 Conceptos 6 Resultados 7 Selección de Características 8 Conclusiones 02/04/2015Juan Francisco Morejón 8

Metodología – Método de investigación InsumoVariableMétodo ExperimentalIndependiente Eventos vulcanológicos del volcán Cotopaxi Dependiente Algoritmos de clasificación 02/04/2015Juan Francisco Morejón 9

Metodología – Recolección de Información Instituto Geofísico de la Escuela Politécnica Nacional (IGEPN). 914 eventos 759 de tipo Largo Período. 116 de tipo Volcano Tectónico 02/04/2015Juan Francisco Morejón características: Tiempo, frecuencia y escala

Metodología – Evaluación de Resultados Proceso de clasificación efectuado por el IGEPN Proceso de clasificación efectuado por los algoritmos 02/04/2015Juan Francisco Morejón 11 Nota: falsos positivos (FP), falsos negativos (FN), verdaderos positivos (VP) y verdaderos negativos (VN)

Agenda 1 Planteamiento del Problema 2 Justificación 3 Objetivos 4 Metodología 5 Conceptos 6 Resultados 7 Selección de Características 8 Conclusiones 02/04/2015Juan Francisco Morejón 12

Conceptos – Selección de Algoritmos k-NN Nearest Neighbors (k-NN) V Alta precisión V Insensibilidad a los valores atípicos V Fácil implementación D Alto gasto computacional D Sensible al sobreajusteSensible al ruido Ejemplo k-NN donde k=3 02/04/2015Juan Francisco Morejón 13 Parámetro determinante: k

Conceptos – Selección de Algoritmos Decision Trees (DT) V Bajo gasto computacional V Resultados fácilmente interpretados V Maneja características irrelevantes D Propenso al sobreajuste D No maneja valores atípicos D Inconvenientes cuando hay demasiadas ramificaciones Ejemplo de Decision Trees 02/04/2015Juan Francisco Morejón 14 Parámetro determinante: frondosidad

Conceptos – Selección de Algoritmos Neural Networks (NN) V Trabaja con N entradas para producir N salidas V Maneja cambios pequeños en la entrada, ejemplo: ruido V Robustez, ya que puede funcionar si caen elementos de red D Gasto computacional alto D Resultados no muy fáciles de interpretar D Complejidad de aprendizaje para grandes tareas Ejemplo de Neural Networks con 5 “neuronas” 02/04/2015Juan Francisco Morejón 15 Parámetro determinante: neuronas

Conceptos – Machine Learning (ML) Aprendizaje a través de la observación a partir de un comportamiento pasado Machine Learning Técnicas Supervisadas Clasificación Matriz de entrenamiento Matriz de Pruebas Etiquetas Regresión Técnicas no Supervisadas Desarrollo de aplicaciones 1 Recolectar los datos 2 Preparar los datos de entrada 3 Certificar los datos 4 Analizar los datos de entrada 5 Entrenar el algoritmo 6 Probar el algoritmo 02/04/2015Juan Francisco Morejón 16

Conceptos – Machine Learning (ML) 02/04/2015Juan Francisco Morejón 17 Etiquetas Características Algoritmo de clasificación Modelo Predictor Datos Matriz de Prueba Etiquetas esperadas Evaluador de desempeño del modelo Etiquetas reales Datos Matriz de entrenamiento

Conceptos – Características de la señal TIEMPO Duración Tiempo de Alcance Pico Máximo Pico Máximo Entropía Valor RMS Valor de Pico a Pico Relación Pico a RMS Energía en Tiempo Densidad de Cruces por Cero Kurtosis Densidad de Número de Picos sobre RMS FFT Valor Pico FFT Frecuencia de Pico FFT Valor de Media FFT Valor en Umbral Hz Frecuencia Umbral Máxima (10-20 Hz) Valor en Umbral 20 Hz – 30 Hz Frecuencia Umbral Máxima (20-30 Hz) Valor RMS en FFT Relación de Pico a RMS en FFT Energía en FFT Densidad de Número de Picos sobre RMS Segundo Pico Máximo en FFT Frecuencia del segundo pico Tercer Pico Máximo en FFT Frecuencia del tercer pico Valor Máximo y Tiempo en pico de PSD Frecuencia en pico de PSD Valor Max en FFT en 6 niveles Frecuencia en pico FFT en 6 niveles Frecuencia media en FFT en 6 niveles 02/04/2015Juan Francisco Morejón 18 WAVELET Energía en Wavelet Porcentaje de Energía en 6 niveles Valor RMS en 6 niveles Valor de pico a pico en 6 niveles Relación de pico a RMS en 6 niveles

Conceptos – Pre procesamiento Valor MedioDesviación Estándar 02/04/2015Juan Francisco Morejón 19

Conceptos – Conformación de matrices 02/04/2015Juan Francisco Morejón 20

Agenda 1 Planteamiento del Problema 2 Justificación 3 Objetivos 4 Metodología 5 Conceptos 6 Resultados 7 Selección de Características 8 Conclusiones 02/04/2015Juan Francisco Morejón 21

Resultados - k-NN Nearest Neighbors Valor Óptimo de kParámetros de Desempeño Ex (%) Pr (%) Se (%) Es (%) Tiempo (ms) k-NN /04/2015Juan Francisco Morejón 22 - Valor de k escogido: 29

Resultados - Decision Trees Frondosidad del árbolParámetros de Desempeño Ex (%) Pr (%) Se (%) Es (%) Tiempo (ms) Decision Trees /04/2015Juan Francisco Morejón 23 - Valor RMS en FFT - Pico Máximo - Tiempo de alcance pico máximo

Resultados - Neural Networks DesempeñoTiempo de procesamiento 02/04/2015Juan Francisco Morejón 24 Ex (%) Pr (%) Se (%) Es (%) Tiempo (ms) Neural Network

Resultados Generales Exactitud (%) Precisión (%) Sensibilidad (%) Especificidad (%) Tiempo de procesamiento (ms) Decision Trees k-NN Neural Network /04/2015Juan Francisco Morejón 25 Exactitud (%) Precisión (%) Sensibilidad (%) Especificidad (%) Tiempo de procesamiento (ms) Decision Trees k-NN Neural Network Con Normalización Sin Normalización

Agenda 1 Planteamiento del Problema 2 Justificación 3 Objetivos 4 Metodología 5 Conceptos 6 Resultados 7 Selección de Características 8 Conclusiones 02/04/2015Juan Francisco Morejón 26

Selección de Características Embedded Incorpora la selección de variables como parte del proceso de entrenamiento del modelo predictor. Ejemplo: Árboles de decisión. Wrapper Requiere de una gran gasto computacional, sin embargo, el resultado puede disminuir el sobreajuste. Ejemplo: Selección de Características Secuencial Filter Ignora los efectos que el subconjunto de características seleccionado tiene sobre el desempeño Características más relevantes 1 Valor RMS en la FFT9 Valor Máximo en FFT de A6 2 Pico Máximo 1010 Porcentaje de energía en D5 3 Tiempo de alcance pico máximo 11 Valor Máximo en FFT de D6 4 Valor Máximo en FFT de D Porcentaje de energía en D3 5 Frecuencia umbral máxima (20-30 MHz) 1313 Relación de pico RMS en D3 6 Entropía 1414 Valor Máximo en FFT de D3 7 Valor RMS en D Frecuencia Pico FFT en D2 8 Porcentaje de Energía en D Energía en tiempo 02/04/2015Juan Francisco Morejón 27

Selección de Características - Resultados 02/04/2015Juan Francisco Morejón 28

Selección de Características - Resultados Características Relevantes Ex (%) Pr (%) Se (%) Es (%) Tiempo (ms) Decision Trees Selección de Características Decision Trees /04/2015Juan Francisco Morejón 29

Selección de Características - Resultados 02/04/2015Juan Francisco Morejón 30 [1] [1] Desempeño con las primeras 3 características [2] [2] Desempeño con las primeras 6 características Exactitud (%)Precisión (%)Sensibilidad (%)Especificidad (%) Tiempo de procesamiento (ms) Sin Selección Con Selección Sin Selección Con Selección Sin Selección Con Selección Sin Selección Con Selección Sin Selección Con Selección Decision Trees k-NN Neural Network Exactitud (%) Precisión (%) Sensibilidad (%) Especificidad (%) Tiempo de procesamiento (s) Decision Trees k-NN Neural Network Neural Network

Agenda 1 Planteamiento del Problema 2 Justificación 3 Objetivos 4 Metodología 5 Conceptos 6 Resultados 7 Selección de Características 8 Conclusiones 02/04/2015Juan Francisco Morejón 31

Conclusiones De los algoritmos de clasificación de eventos de origen vulcanológico basados en machine learning: k-Nearest Neighbors, Decision Trees, Neural Networks, se identificó que el mejor algoritmo es k-Nearest Neighbors presenta los valores más altos de desempeño en términos de exactitud (98%), precisión (100%), especificidad (100%), sensibilidad (97%) y gasto computacional (7 ms). Estos valores fueron posibles ya que en el pre-procesamiento se efectuó un filtrado de la señal para la remoción de errores, se suprimió la media y tendencia lineal de las señales, se normalizaron los valores y finalmente se realizó una selección de características, que al final permitió eliminar el sobreajuste en esta máquina virtual. La selección de características que se efectuó previamente, contribuyó al mejoramiento de la exactitud, precisión, sensibilidad y especificidad de k-Nearest Neighbors y Neural Networks. El modelo clasificador obtenido a partir del uso de las características más relevantes: valor RMS en la FFT, pico máximo y tiempo de alcance del pico máximo, permitió mejorar el desempeño del modelo clasificador conseguido con el empleo de todos los atributos de las señales. 02/04/2015Juan Francisco Morejón 32

Conclusiones Se identificaron que las características más relevantes que permiten mejorar el desempeño con en el dominio del tiempo son: pico máximo y tiempo de alcance del pico máximo, mientras que en dominio de la frecuencia es el valor RMS en la FFT. El tiempo de procesamiento empleado únicamente para la tarea de clasificación se reduce considerablemente cuando el modelo predictor es obtenido únicamente con las características más significantes, de este modo k-Nearest Neighbors se redujo en 95%, Decision Trees en 90% y Neural Networks en 15%. A pesar de ello, es necesario llegar a un balance entre los resultados de los parámetros de desempeño y el tiempo total empleado, ya que mientras más eficientes son los algoritmos, más recursos son los empleados. En términos generales, el tiempo medio que se emplea para la clasificación por cada evento en k-Nearest Neighbors es de 60 microsegundos, en Decision Trees es de 26 microsegundos y Neural Networks es de 2 milisegundos. Estos valores no consideran el tiempo empleado en pre procesamiento ni obtención del modelo predictor. 02/04/2015Juan Francisco Morejón 33

Trabajos Futuros Estos resultados pueden ser tomados como plataforma de estudio para otros volcanes que presentan actividad volcánica vigente. Como se había manifestado, cada elevación presenta características propias, por tal motivo, es necesario ampliar esta investigación a los volcanes activos más representativos del país. Por los altos valores de desempeño obtenidos en el presente trabajo, el mismo podría ser utilizado en el campo de la Geología para determinar patrones de comportamiento del Volcán Cotopaxi ya que al tener una correcta clasificación de los eventos, los expertos no tendrían que efectuar esta tarea, sino enfocarse únicamente en la conducta del volcán. 02/04/2015Juan Francisco Morejón 34

‏ GRACIAS _____________ Juan Francisco Morejón PROGRAMA DE MAESTRÍA EN REDES DE INFORMACIÓN Y CONECTIVIDAD MRIC-II