La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

PROGRAMA DE MAESTRÍA EN REDES DE INFORMACIÓN Y CONECTIVIDAD MRIC-II ANÁLISIS DEL DESEMPEÑO DE ALGORITMOS DE DETECCIÓN DE EVENTOS VULCANOLÓGICOS BASADOS.

Presentaciones similares


Presentación del tema: "PROGRAMA DE MAESTRÍA EN REDES DE INFORMACIÓN Y CONECTIVIDAD MRIC-II ANÁLISIS DEL DESEMPEÑO DE ALGORITMOS DE DETECCIÓN DE EVENTOS VULCANOLÓGICOS BASADOS."— Transcripción de la presentación:

1 PROGRAMA DE MAESTRÍA EN REDES DE INFORMACIÓN Y CONECTIVIDAD MRIC-II ANÁLISIS DEL DESEMPEÑO DE ALGORITMOS DE DETECCIÓN DE EVENTOS VULCANOLÓGICOS BASADOS EN MACHINE LEARNING‏

2 Agenda 1 Planteamiento del Problema 2 Justificación 3 Objetivos 4 Metodología 5 Conceptos 6 Resultados 7 Selección de Características 8 Conclusiones 02/04/2015Juan Francisco Morejón 2

3 Planteamiento del Problema Ecuador Naturaleza Cordillera de los Andes Volcanes activos 02/04/2015Juan Francisco Morejón 3

4 Planteamiento del Problema Zonas Pobladas Tungurahua Cotopaxi Reventador 02/04/2015Juan Francisco Morejón 4 IGEPN Vigilancia D Elementos tradicionales D Alto costo de implementación D Depende de habilidades humanas

5 Justificación Plan Nacional de Buen Vivir 2013-2017 Políticas y lineamientos Mejorar sistemas de control para identificar y mitigar amenazas ante riesgos naturales Secretaría Nacional de Planificación y Desarrollo Recursos para identificar, analizar, prevenir y mitigar riesgos para enfrentar y manejar eventos de desastre. Secretaría Nacional de Gestión de Riesgos 02/04/2015Juan Francisco Morejón 5

6 Justificación Investigación de monitorización volcánica han determinado el empleo de WSN Solución robusta y global Estructura de red TransmisiónDetecciónBajo costoClasificación 02/04/2015Juan Francisco Morejón 6 Alerta temprana Decisión oportuna Salvar Vidas

7 Objetivos Analizar el desempeño de algoritmos de clasificación de eventos vulcanológicos basados en machine learning, para su empleo en sistemas de supervisión y alerta temprana del volcán Cotopaxi. Determinar los algoritmos de clasificación de eventos aplicados a la monitorización volcánica. Implementar a nivel de simulación tres algoritmos de clasificación. Probar y validar tres algoritmos de clasificación con información real para determinar su desempeño. Determinar el/los mejor/es algoritmo/s de clasificación de eventos volcánicos para el volcán Cotopaxi. 02/04/2015Juan Francisco Morejón 7

8 Agenda 1 Planteamiento del Problema 2 Justificación 3 Objetivos 4 Metodología 5 Conceptos 6 Resultados 7 Selección de Características 8 Conclusiones 02/04/2015Juan Francisco Morejón 8

9 Metodología – Método de investigación InsumoVariableMétodo ExperimentalIndependiente Eventos vulcanológicos del volcán Cotopaxi Dependiente Algoritmos de clasificación 02/04/2015Juan Francisco Morejón 9

10 Metodología – Recolección de Información Instituto Geofísico de la Escuela Politécnica Nacional (IGEPN). 914 eventos 759 de tipo Largo Período. 116 de tipo Volcano Tectónico 02/04/2015Juan Francisco Morejón 10 79 características: Tiempo, frecuencia y escala

11 Metodología – Evaluación de Resultados Proceso de clasificación efectuado por el IGEPN Proceso de clasificación efectuado por los algoritmos 02/04/2015Juan Francisco Morejón 11 Nota: falsos positivos (FP), falsos negativos (FN), verdaderos positivos (VP) y verdaderos negativos (VN)

12 Agenda 1 Planteamiento del Problema 2 Justificación 3 Objetivos 4 Metodología 5 Conceptos 6 Resultados 7 Selección de Características 8 Conclusiones 02/04/2015Juan Francisco Morejón 12

13 Conceptos – Selección de Algoritmos k-NN Nearest Neighbors (k-NN) V Alta precisión V Insensibilidad a los valores atípicos V Fácil implementación D Alto gasto computacional D Sensible al sobreajusteSensible al ruido Ejemplo k-NN donde k=3 02/04/2015Juan Francisco Morejón 13 Parámetro determinante: k

14 Conceptos – Selección de Algoritmos Decision Trees (DT) V Bajo gasto computacional V Resultados fácilmente interpretados V Maneja características irrelevantes D Propenso al sobreajuste D No maneja valores atípicos D Inconvenientes cuando hay demasiadas ramificaciones Ejemplo de Decision Trees 02/04/2015Juan Francisco Morejón 14 Parámetro determinante: frondosidad

15 Conceptos – Selección de Algoritmos Neural Networks (NN) V Trabaja con N entradas para producir N salidas V Maneja cambios pequeños en la entrada, ejemplo: ruido V Robustez, ya que puede funcionar si caen elementos de red D Gasto computacional alto D Resultados no muy fáciles de interpretar D Complejidad de aprendizaje para grandes tareas Ejemplo de Neural Networks con 5 “neuronas” 02/04/2015Juan Francisco Morejón 15 Parámetro determinante: neuronas

16 Conceptos – Machine Learning (ML) Aprendizaje a través de la observación a partir de un comportamiento pasado Machine Learning Técnicas Supervisadas Clasificación Matriz de entrenamiento Matriz de Pruebas Etiquetas Regresión Técnicas no Supervisadas Desarrollo de aplicaciones 1 Recolectar los datos 2 Preparar los datos de entrada 3 Certificar los datos 4 Analizar los datos de entrada 5 Entrenar el algoritmo 6 Probar el algoritmo 02/04/2015Juan Francisco Morejón 16

17 Conceptos – Machine Learning (ML) 02/04/2015Juan Francisco Morejón 17 Etiquetas Características Algoritmo de clasificación Modelo Predictor Datos Matriz de Prueba Etiquetas esperadas Evaluador de desempeño del modelo Etiquetas reales Datos Matriz de entrenamiento

18 Conceptos – Características de la señal TIEMPO Duración Tiempo de Alcance Pico Máximo Pico Máximo Entropía Valor RMS Valor de Pico a Pico Relación Pico a RMS Energía en Tiempo Densidad de Cruces por Cero Kurtosis Densidad de Número de Picos sobre RMS FFT Valor Pico FFT Frecuencia de Pico FFT Valor de Media FFT Valor en Umbral 10-20 Hz Frecuencia Umbral Máxima (10-20 Hz) Valor en Umbral 20 Hz – 30 Hz Frecuencia Umbral Máxima (20-30 Hz) Valor RMS en FFT Relación de Pico a RMS en FFT Energía en FFT Densidad de Número de Picos sobre RMS Segundo Pico Máximo en FFT Frecuencia del segundo pico Tercer Pico Máximo en FFT Frecuencia del tercer pico Valor Máximo y Tiempo en pico de PSD Frecuencia en pico de PSD Valor Max en FFT en 6 niveles Frecuencia en pico FFT en 6 niveles Frecuencia media en FFT en 6 niveles 02/04/2015Juan Francisco Morejón 18 WAVELET Energía en Wavelet Porcentaje de Energía en 6 niveles Valor RMS en 6 niveles Valor de pico a pico en 6 niveles Relación de pico a RMS en 6 niveles

19 Conceptos – Pre procesamiento Valor MedioDesviación Estándar 02/04/2015Juan Francisco Morejón 19

20 Conceptos – Conformación de matrices 02/04/2015Juan Francisco Morejón 20

21 Agenda 1 Planteamiento del Problema 2 Justificación 3 Objetivos 4 Metodología 5 Conceptos 6 Resultados 7 Selección de Características 8 Conclusiones 02/04/2015Juan Francisco Morejón 21

22 Resultados - k-NN Nearest Neighbors Valor Óptimo de kParámetros de Desempeño Ex (%) Pr (%) Se (%) Es (%) Tiempo (ms) k-NN 9697 9594 143 02/04/2015Juan Francisco Morejón 22 - Valor de k escogido: 29

23 Resultados - Decision Trees Frondosidad del árbolParámetros de Desempeño Ex (%) Pr (%) Se (%) Es (%) Tiempo (ms) Decision Trees 96989398 30 02/04/2015Juan Francisco Morejón 23 - Valor RMS en FFT - Pico Máximo - Tiempo de alcance pico máximo

24 Resultados - Neural Networks DesempeñoTiempo de procesamiento 02/04/2015Juan Francisco Morejón 24 Ex (%) Pr (%) Se (%) Es (%) Tiempo (ms) Neural Network97989598 269

25 Resultados Generales Exactitud (%) Precisión (%) Sensibilidad (%) Especificidad (%) Tiempo de procesamiento (ms) Decision Trees96989398 31 k-NN 96979597 143 Neural Network 97989598 269 02/04/2015Juan Francisco Morejón 25 Exactitud (%) Precisión (%) Sensibilidad (%) Especificidad (%) Tiempo de procesamiento (ms) Decision Trees 8579957430 k-NN 66676071146 Neural Network94989098289 Con Normalización Sin Normalización

26 Agenda 1 Planteamiento del Problema 2 Justificación 3 Objetivos 4 Metodología 5 Conceptos 6 Resultados 7 Selección de Características 8 Conclusiones 02/04/2015Juan Francisco Morejón 26

27 Selección de Características Embedded Incorpora la selección de variables como parte del proceso de entrenamiento del modelo predictor. Ejemplo: Árboles de decisión. Wrapper Requiere de una gran gasto computacional, sin embargo, el resultado puede disminuir el sobreajuste. Ejemplo: Selección de Características Secuencial Filter Ignora los efectos que el subconjunto de características seleccionado tiene sobre el desempeño Características más relevantes 1 Valor RMS en la FFT9 Valor Máximo en FFT de A6 2 Pico Máximo 1010 Porcentaje de energía en D5 3 Tiempo de alcance pico máximo 11 Valor Máximo en FFT de D6 4 Valor Máximo en FFT de D1 1212 Porcentaje de energía en D3 5 Frecuencia umbral máxima (20-30 MHz) 1313 Relación de pico RMS en D3 6 Entropía 1414 Valor Máximo en FFT de D3 7 Valor RMS en D2 1515 Frecuencia Pico FFT en D2 8 Porcentaje de Energía en D4 1616 Energía en tiempo 02/04/2015Juan Francisco Morejón 27

28 Selección de Características - Resultados 02/04/2015Juan Francisco Morejón 28

29 Selección de Características - Resultados Características Relevantes Ex (%) Pr (%) Se (%) Es (%) Tiempo (ms) Decision Trees96989398 30 Selección de Características Decision Trees96989398 3 02/04/2015Juan Francisco Morejón 29

30 Selección de Características - Resultados 02/04/2015Juan Francisco Morejón 30 [1] [1] Desempeño con las primeras 3 características [2] [2] Desempeño con las primeras 6 características Exactitud (%)Precisión (%)Sensibilidad (%)Especificidad (%) Tiempo de procesamiento (ms) Sin Selección Con Selección Sin Selección Con Selección Sin Selección Con Selección Sin Selección Con Selección Sin Selección Con Selección Decision Trees 96 98 93 98 313 k-NN9698971009597 1001437 Neural Network 97 98100959398100269230 Exactitud (%) Precisión (%) Sensibilidad (%) Especificidad (%) Tiempo de procesamiento (s) Decision Trees96989398 3 k-NN9810097100 7 Neural Network91909390 190 Neural Network9710093100 230

31 Agenda 1 Planteamiento del Problema 2 Justificación 3 Objetivos 4 Metodología 5 Conceptos 6 Resultados 7 Selección de Características 8 Conclusiones 02/04/2015Juan Francisco Morejón 31

32 Conclusiones De los algoritmos de clasificación de eventos de origen vulcanológico basados en machine learning: k-Nearest Neighbors, Decision Trees, Neural Networks, se identificó que el mejor algoritmo es k-Nearest Neighbors presenta los valores más altos de desempeño en términos de exactitud (98%), precisión (100%), especificidad (100%), sensibilidad (97%) y gasto computacional (7 ms). Estos valores fueron posibles ya que en el pre-procesamiento se efectuó un filtrado de la señal para la remoción de errores, se suprimió la media y tendencia lineal de las señales, se normalizaron los valores y finalmente se realizó una selección de características, que al final permitió eliminar el sobreajuste en esta máquina virtual. La selección de características que se efectuó previamente, contribuyó al mejoramiento de la exactitud, precisión, sensibilidad y especificidad de k-Nearest Neighbors y Neural Networks. El modelo clasificador obtenido a partir del uso de las características más relevantes: valor RMS en la FFT, pico máximo y tiempo de alcance del pico máximo, permitió mejorar el desempeño del modelo clasificador conseguido con el empleo de todos los atributos de las señales. 02/04/2015Juan Francisco Morejón 32

33 Conclusiones Se identificaron que las características más relevantes que permiten mejorar el desempeño con en el dominio del tiempo son: pico máximo y tiempo de alcance del pico máximo, mientras que en dominio de la frecuencia es el valor RMS en la FFT. El tiempo de procesamiento empleado únicamente para la tarea de clasificación se reduce considerablemente cuando el modelo predictor es obtenido únicamente con las características más significantes, de este modo k-Nearest Neighbors se redujo en 95%, Decision Trees en 90% y Neural Networks en 15%. A pesar de ello, es necesario llegar a un balance entre los resultados de los parámetros de desempeño y el tiempo total empleado, ya que mientras más eficientes son los algoritmos, más recursos son los empleados. En términos generales, el tiempo medio que se emplea para la clasificación por cada evento en k-Nearest Neighbors es de 60 microsegundos, en Decision Trees es de 26 microsegundos y Neural Networks es de 2 milisegundos. Estos valores no consideran el tiempo empleado en pre procesamiento ni obtención del modelo predictor. 02/04/2015Juan Francisco Morejón 33

34 Trabajos Futuros Estos resultados pueden ser tomados como plataforma de estudio para otros volcanes que presentan actividad volcánica vigente. Como se había manifestado, cada elevación presenta características propias, por tal motivo, es necesario ampliar esta investigación a los volcanes activos más representativos del país. Por los altos valores de desempeño obtenidos en el presente trabajo, el mismo podría ser utilizado en el campo de la Geología para determinar patrones de comportamiento del Volcán Cotopaxi ya que al tener una correcta clasificación de los eventos, los expertos no tendrían que efectuar esta tarea, sino enfocarse únicamente en la conducta del volcán. 02/04/2015Juan Francisco Morejón 34

35 ‏ GRACIAS _____________ Juan Francisco Morejón PROGRAMA DE MAESTRÍA EN REDES DE INFORMACIÓN Y CONECTIVIDAD MRIC-II


Descargar ppt "PROGRAMA DE MAESTRÍA EN REDES DE INFORMACIÓN Y CONECTIVIDAD MRIC-II ANÁLISIS DEL DESEMPEÑO DE ALGORITMOS DE DETECCIÓN DE EVENTOS VULCANOLÓGICOS BASADOS."

Presentaciones similares


Anuncios Google