La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Maestría en Tecnologías de la Información

Presentaciones similares


Presentación del tema: "Maestría en Tecnologías de la Información"— Transcripción de la presentación:

1 Maestría en Tecnologías de la Información
Trabajo de Tesis “Análisis de la propagación de la señal paroxística en EEGs utilizando técnicas de Data Mining sobre múltiples canales“ Directora Dra. Alicia Mon Integrantes E. Santiago, P. Valenti

2 Agenda Objetivo de la Tesis Introducción a EEG y Epilepsia
Data Mining y la metodología sobre la que se basa la Tesis Definición del problema Procesamiento y análisis de los canales Análisis de los resultados y Conclusiones Trabajos futuros Herramienta desarrollada

3 Objetivo “Extender el trabajo realizado sobre detección automática de paroxismos en EEG utilizando técnicas de Data Mining analizando todos los canales, y aportando información del canal principal sobre el cual se propaga la señal paroxística.” Beneficios Disminución considerable del tiempo de análisis por parte de los expertos Facilitar a los expertos la detección de la topología de la crisis epiléptica

4 Agenda Objetivo de la Tesis Introducción a EEG y Epilepsia
Data Mining y la metodología sobre la que se basa la Tesis Definición del problema Procesamiento y análisis de los canales Análisis de los resultados y Conclusiones Trabajos futuros Herramienta desarrollada

5 Introducción a EEG y Epilepsia
Definición de Epilepsia ElectroEncefaloGrama (EEG) EEG aplicado a la epilepsia Paroxismos Algunas definiciones

6 Epilepsia “Afección neurológica crónica, recurrente y repetitiva, de fenómenos paroxísticos ocasionados por descargas de neuronas cerebrales de forma desordenada y excesiva” Def 1: Enfermedad neurológica crónica caracterizada por la aparición repetida de crisis convulsivas generalizadas o localizadas, o de pérdidas de conciencia súbitas y transitorias. Def 2: una descarga súbita, rápida y excesiva de las células cerebrales Una crisis epiléptica es producida por descargas descontroladas de las neuronas. Esta actividad se transmite de una neurona a otras vecinas, abarcando una gran cantidad de secciones del cerebro, desencadenando las manifestaciones propias de la epilepsia. Sus causas pueden ser muy diversas y sus manifestaciones sumamente variadas. La epilepsia está caracterizada por: - Los ataques tienen un inicio súbito y brusco, con una duración breve, y luego tienden a restablecer las señales cerebrales. Son manifestaciones paroxísticas. - Su principal característica es la repetición de los ataques o crisis. - Es una enfermedad que puede durar muchos años, o inclusive toda la vida de la persona enferma. Los síntomas que experimenta una persona durante una crisis epiléptica dependen del lugar en el cerebro en el cual ocurre la alteración de la actividad eléctrica. Una persona que tiene una crisis puede: - gritar - perder el sentido y desplomarse - ponerse rígido y con espasmos musculares. - puede parecer confundido o aturdido y no podrá responder a preguntas ni instrucciones. Otras personas tienen ataques muy leves que ni siquiera son notados por otros. Algunas veces, la única manifestación de la crisis epiléptica es un parpadeo rápido o algunos segundos de mirada perdida con desconexión del medio. La crisis puede durar desde unos segundos hasta varios minutos.

7 Electroencefalograma (EEG)
Un EEG es una exploración neurofisiológica que se basa en el registro de la actividad bioeléctrica cerebral. Refleja la actividad post-sináptica y el flujo extracelular de grandes poblaciones neuronales. Esas neuronas así como otras células nerviosas, tienen un potencial de descanso el cual es una diferencia de potencial eléctrica entre el interior de la célula y el espacio extracelular. La amplitud de estas señales usualmente se encuentra de 10 a 100 microvolts. En el ejemplo se puede ver un EEG de 17 canales. Ejemplo de EEG

8 EEG aplicado a la Epilepsia
Confirmación del diagnóstico clínico Predicción de posibles recurrencias tras la disminución / supresión del tratamiento antiepiléptico Tipo y etiología de las crisis Detección de actividad Paroxística Etiología: Parte de la medicina que estudia el origen o las causas de las enfermedades Como es obvio suponer, el EEG desempeña un papel fundamental como apoyo a los datos clínicos en el diagnóstico de las epilepsias. Estas patologías se presentan en todas las edades aunque la incidencia es mayor en la infancia y adolescencia así como en la tercera edad. En líneas generales la función del EEG es la confirmación del diagnóstico clínico de epilepsia, predicción de posibles recurrencias tras la disminución / supresión del tratamiento antiepiléptico y quizás el intento de predicción de posibles lesiones cerebrales agudas focales (áreas de contusión, zonas corticales próximas a neoplasias cerebrales o lesiones vasculares corticales). El grueso de pacientes con epilepsias y síndromes epilépticos correctamente diagnosticado y tratados no precisan de estudios EEG de control. Los pacientes afectos de epilepsias no controladas satisfactoriamente precisarán de estudios especiales para poder discernir con mayor certeza si los eventos paroxísticos que padecen son crisis epilépticas, qué tipo de crisis son y cual es la etiología.

9 Punta onda – Onda aguda – Polipuntas
Paroxismos “Ciertos grafoelementos que se presentan en un muy alto porcentaje en pacientes epilépticos, denominados grafoelementos epileptiformes” Analizando los EEGs de pacientes epilépticos, se descubrieron ciertos grafoelementos los cuales se presentaban en un muy alto porcentaje y a los cuales se les denominó grafoelementos epileptiformes. Existen básicamente tres tipos de grafoelementos epileptiformes: - Los primeros, son las puntas, que son aquellas ondas con terminación en punta que tienen una duración menor a 70 ms y cuya amplitud sobrepasa a la del ritmo de base donde aparecen por lo menos en un 50%. - Las segundas, son las ondas agudas, las cuales presentan las mismas características que las puntas, pero con una duración que va de los 70 a los 200 mseg. - Los terceros, son los denominados complejos ya que se integran por la combinación de por lo menos dos grafoelementos siendo el mas frecuente, el llamado complejo punta-onda lenta en donde se asocia una punta con las características antes mencionadas con una onda lenta típicamente con duración mayor a los 200 ms. Punta onda – Onda aguda – Polipuntas

10 Alguna definiciones Actividad de base: es el registro de la actividad eléctrica cerebral en condiciones de reposo o durante el sueño espontáneo, también llamada señal de base. Periodo Ictal: El comienzo de la crisis o periodo ictal se define por el primer cambio eléctrico en el ritmo de base del EEG o alguna manifestación clínica que indica el inicio de la misma. Período Interictal: Los periodos interictales son aquellos entre ataques de epilepsia (crisis), que pueden contener actividad de base o actividad paroxística.

11 Agenda Objetivo de la Tesis Introducción a EEG y Epilepsia
Data Mining y la metodología sobre la que se basa la Tesis Definición del problema Procesamiento y análisis de los canales Análisis de los resultados y Conclusiones Trabajos futuros Herramienta desarrollada

12 Data Mining “Data Mining o KDD es la extracción no trivial de información implícita, previamente desconocida y potencialmente útil de los datos” “Búsqueda de relaciones y patrones globales existentes en una gran base de datos, pero que están ocultos a simple vista, debido a la gran cantidad de información almacenada” Se podría hacer una especie de analogía con el proceso de minería tradicional. Una analogía tiene la presunción que si dos cosas son similares en un área, también serán similares en otras. Tal como la minería tradicional del oro es la búsqueda de pepitas de oro, Data Mining es la búsqueda de pepitas de información. Como el oro que esta oculto dentro de la tierra o bajo el agua, las pepitas de información están ocultas en los datos. La primera analogía compara la definición de las pepitas de oro con la definición de las pepitas de información. Para un minero sin experiencia, el oro es oro, pero para un minero experimentado el tamaño de las pepitas a descubrir tiene una importancia significativa en las técnicas o herramientas a utilizar en el proceso de exploración. Por ejemplo, un minero independiente usará básicamente métodos manuales con los cuales podrá encontrar solamente pepitas de oro de un tamaño considerable. En cambio las compañías de minería industrial tienen la posibilidad a través del uso de herramientas más sofisticadas de poder buscar oro a escala molecular. A su vez dependiendo de lo que se está buscando, ya sea plata, petróleo, etc., el proceso de minería será distinto. Esto muestra la importancia de definir claramente las pepitas de información que son deseadas como así también, que técnicas son las adecuadas para realizar dicha búsqueda. Las técnicas de Data Mining son éstas herramientas sofisticadas que permiten buscar, descubrir y obtener las pepitas de información dentro de grandes volúmenes de datos.

13 Data Mining Fases del proceso de DM Selección de los datos
Preprocesamiento de la información Data Mining Validación del modelo generado Selección: selección o segmentación de los datos de acuerdo a un criterio dado, por ejemplo, para este trabajo de tesis se seleccionaron en primera instancia los archivos de datos, luego los canales, y por último los segmentos de señal sobre los cuales se trabajará. Preprocesamiento: esta es la fase que involucra la limpieza inicial de los datos (Data Cleaning) donde cierta información es removida, la cual es por si innecesaria y puede disminuir el desempeño de las consultas, por ejemplo, es innecesario tener el sexo de un paciente cuando se realizan estudios por embarazo. Además involucra la reconfiguración de los datos para asegurar un formato consistente (Enrichment), ya que existe la posibilidad de que haya inconsistencias debido a que los datos pueden provenir de diferentes fuentes, también reconstrucción de datos faltantes, combinación y / o conversión de campos existentes para generar nuevos datos (Coding). Estos pasos requieren un esfuerzo considerable, generalmente más del 70% del esfuerzo total del proceso de Data Mining. Más adelante se verá como se preprocesaron los datos de entrada utilizando funciones de transformación, FFT, técnicas de windowing, etc. Data Mining: esta fase involucra la selección de los algoritmos o métodos, y el uso de las herramientas para construir, testear y seleccionar modelos. Validación del modelo: testear el modelo sobre un conjunto de datos independiente (que no fue utilizado para generar el modelo) para probar su exactitud o su precisión. Realizar una prueba piloto para determinar la usabilidad del mismo, por ejemplo, si se está generando un modelo sobre un EEG de un paciente, reservar una porción del mismo para realizar las pruebas.

14 Metodología sobre la que se basa la Tesis
Detección de señales paroxísticas (punta onda, ondas agudas y polipuntas) sobre un mono-canal de un EEG utilizando un algoritmos de clasificación de Data Mining. El presente trabajo de tesis utilizó como punto de partida la metodología desarrollada por [CAZ/03] en la cual se realizó la detección de señales paroxísticas en señales EEG de pacientes con problemas de epilepsia del Centro de Epilepsia de la División de Neurología del Hospital Ramos Mejía. Se logró la automatización de la detección utilizando algoritmos de clasificación de Data Mining.

15 Metodología – Paso 1 Los archivos de datos utilizados son señales EEG de pacientes epilépticos asistidos en el Centro de Epilepsia del Hospital Ramos Mejía de la ciudad de Buenos Aires. SELECCIÓN DE LOS DATOS ====================== Le primera etapa es la selección de los datos. Para ello se eligieron un conjunto de archivos EEG de pacientes epilepticos. Se seleccionaron 4 EEGs de 3 pacientes: - B09, B11, 2CH : Entrenamiento y testeo - SA : Medición contra expertos Los EEGs fueron generados con electrodos de inserción profundos intracerebrales, y registrado por un paquete de software llamado HARMONIE El conjunto de datos fue separado un 66% para entrenar, y 34% para prueba.

16 Metodología – Paso 2 PREPROCESAMIENTO DE LOS DATOS
============================== El paso 2 consistió en preparar la información. Para que el algoritmo de DM pueda procesar la información, ésta debe estar representada de una determinada manera, es necesario eliminar los datos incorrectos, se debe aplicar funciones de transformación para resaltar las características inherentes de la morfología de los paroxismos. Cada registro del archivo de datos preprocesados quedó indentificado con un SI si es un paroxismos, o un NADA si es actividad de base.

17 Metodología – Paso 3 Árboles de decisión J4.8 Naive Bayes
GENERACIÓN DE MODELOS ====================== Para la generación de los modelos de detección se utilizó una herramienta de Data Mining llamada WEKA. Este software fue desarrollado por Ian H. Witten y Eibe Frank, investigadores del departamento de Computer Science de la Universidad de Waikato de Nueva Zelanda. Se seleccionaron dos algoritmos de Data Mining (Naive Bayes y Árboles de decisión). Cada ventana de tiempo tomada de los archivos de datos procesados es catalogada con un atributo de clasificación que indica si se trata de una señal paroxística o no (Si indica que se trata de un paroxismo, Nada indica señal de base). Esta información es suministrada por los expertos, para poder generar los modelos de clasificación. Una vez catalogados los datos, son pasados a cada uno de los algoritmos para generar un modelo.

18 Metodología – Paso 4 Matriz de confusión Cobertura de las marcas
Curvas ROC TESTEO DE LOS MODELOS ====================== Una vez generado el modelo de clasificación, se utilizó el 33.6% de los datos apartados para tal fin, y se probó el modelo. Este último conjunto tiene el atributo de clasificación sin asignar, ya que es el modelo el encargado de colocarlo, para determinar de qué tipo de señal se trata. Para poder determinar la eficacia del modelo, se utilizaron varias técnicas (matrices de confusión, cobertura sobre marcas de expertos y curvas ROC).

19 Metodología – Validación contra expertos
========================== El acrónimo ROC simboliza el término en inglés Receiver Operating Characteristic, y es utilizado en detección de señales para caracterizar el compromiso entre la tasa de aciertos y la tasa de falsa alarma sobre un canal ruidoso [WIT/00]. Este tipo de gráfico es una herramienta visual para examinar el desempeño de los clasificadores [SWE/88]. Las curcas ROC se utilizaron para ilustrar la relación entre las tazas de los verdaderos-positivos (VP) y los falsos-positivos (FP).

20 Agenda Objetivo de la Tesis Introducción a EEG y Epilepsia
Data Mining y la metodología sobre la que se basa la Tesis Definición del problema Procesamiento y análisis de los canales Análisis de los resultados y Conclusiones Trabajos futuros Herramienta desarrollada

21 Definición del problema
Necesidad Detección de la zona del cerebro donde se origina la crisis en aquellos pacientes epilépticos candidatos a cirugía. Problema Los estudios que se realizan tienen una duración bastante prolongada, llegando en muchos casos a 72 horas de grabación de señal EEG. Esto hace muy tedioso y agotador el trabajo de los expertos para el análisis de los mismos. Es fundamental en estos casos, poder confirmar que el foco está cercano a la lesión. Es fundamental, para aquellos pacientes epilépticos candidatos a cirugía, poder detectar la zona donde se origina la crisis, denominada zona epileptógena. La metodología utilizada en el campo de la detección de actividad paroxística se basa en el conocimiento del experto. Este trabajo requiere de gran experiencia y de un estudio cuidadoso de las distintas fuentes de información (historia clínica del paciente, EEG, videos, etc.) y de la capacidad de dichos expertos de interpretarlas. Los estudios que se realizan tienen, por lo general, una duración bastante prolongada, llegando en muchos casos a 72 horas de grabación de señal EEG. Esto hace muy tedioso y agotador el trabajo de los expertos para el análisis de los mismos. Es fundamental en estos casos, poder confirmar que el foco está cercano a la lesión. La utilización de algoritmos inteligentes reduce sustancialmente el tiempo computacional, contra las metodologías tradicionales de análisis de señales y por el otro la aplicación de este tipo de tecnología es fácil de adquirir debido a la existencia de herramientas de acceso público disponibles. Si bien, y como ya se planteó anteriormente, existen desarrollos en este área que utilizan algoritmos de Data Mining para la división de los conjuntos de señales, o la agrupación es clases de señales, no se realizaron metodologías que utilicen Data Mining para detectar directamente y clasificar las señales. Esta tarea se realiza con algoritmos matemáticos especiales de detección de señales. La motivación de este trabajo se genera a partir de la implementación de una metodología que ayude a los expertos en epilepsia a la detección de la topografía de la crisis epiléptica en pacientes candidatos a cirugía, automatizando la detección, disminuyendo el tiempo y esfuerzo dedicado y aumentando el porcentaje de eficacia. Esta metodología no sólo aplica en ese objetivo, sino también en la generación de un conjunto de herramientas que asistan a dichos expertos en la automatización de la detección.

22 Agenda Objetivo de la Tesis Introducción a EEG y Epilepsia
Data Mining y la metodología sobre la que se basa la Tesis Definición del problema Procesamiento y análisis de los canales Análisis de los resultados y Conclusiones Trabajos futuros Herramienta desarrollada

23 Procesamiento y análisis de los canales
Etapa 1 Metodología Se desarrolló una metodología que permitió el análisis de todos los canales de un electro-encefalograma, para luego detectar la propagación de la señal paroxística entre los canales involucrados. La metodología planteada se dividió en dos etapas: Etapa 1 Tomar los 10 archivos de detección que tuvieron el mejor desempeño (menor distancia en la matriz ROC) en la detección de paroxismos. Se seleccionó el mismo archivo de datos de un EEG utilizado para la validación de los modelos. Para cada uno de los archivos anteriores se llevó a cabo un preprocesamiento de los 32 canales de datos del EEG, teniendo en cuenta las funciones de transformación y ventanas de windowing utilizadas en cada uno. Luego se clasificaron todas las señales de los canales, separando los paroxismos (marcas) de la señal de base.

24 Procesamiento y análisis de los canales
Etapa 2 Etapa 2 Para cada uno de los 10 archivos de detecciones, se agruparon las marcas obtenidas y luego se graficaron los 32 canales del EEG junto con sus marcas, para poder visualizar la relación existente entre ellos y determinar la propagación de la señal paroxística. Se realizaron comparaciones entre los 10 archivos de detecciones procesados, para validar la metodología.

25 Procesamiento y análisis de los canales
Selección de los datos Preprocesamiento de la información Aplicación de los modelos de detección de paroxismos Análisis de todos los canales

26 Selección de los datos Archivo de datos EEG Archivos de detecciones
Como archivo de datos fue seleccionado el EEG utilizado en el trabajo sobre el cual se basó esta investigación: es un fragmento de un estudio de un paciente, de una duración de 269 segundos, constituido por 32 canales de datos. ARCHIVOS DE DETECCIONES Como archivos de detección de paroxismos fueron seleccionados aquellos que generaron los 10 archivos de detecciones con menor valor de distancia (curvas ROC).

27 Selección de los datos Modelos seleccionados MODELOS SELECCIONADOS
Una vez elegidos los archivos, se seleccionaron los modelos utilizados para su generación. Cada modelo, está asociado a un algoritmo de clasificación de Data Mining, una función de windowing y una función de transformación. A continuación se puede apreciar la tabla con los modelos.

28 Preprocesamiento de la información
Windowing Funciones de transformación R2 y I2 sqr(R2 + I2) y atan(I/R) Hanning Cuadrada WINDOWING Se aplicaron las dos técnicas de windowing que mejores resultados obtuvieron, para atenuar los bordes de la ventana de la señal: Hanning y ventana cuadrada. Las siguientes figuras muestran la señal atenuada al aplicar la técnica. FUNCIONES DE TRANSFORMACIÓN Según los modelos seleccionados, las funciones de transformación que mejores resultados obtuvieron fueron Estas funciones operan sobre los valores obtenidos luego de aplicar la FFT. Como se explicó en capítulos anteriores, sobre una ventana de 64 muestras, la aplicación de la FFT genera 64 valores de salida, donde los primeros 32 corresponden a la parte real; y los siguientes 32 valores a la parte imaginaria. El primer valor de la parte real y de la parte imaginaria contiene la media de todas las muestras de entrada, por lo que son descartados.

29 Preprocesamiento de la información
PREPROCESO Una vez identificados los modelos y sus funciones de transformación, se procedió a aplicarlos sobre el archivo de datos del EEG (CLICK) Este proceso se realizó por cada canal del archivo EEG, generando un nuevo archivo de datos, para utilizado en la siguiente etapa. Estos nuevos archivos de datos fueron creados con un formato especial (.arff), para poder ser procesados por los algoritmos de Data Mining provistos por WEKA, conteniendo una descripción del archivo, un encabezado y una sección con los datos.

30 Aplicación de los modelos de detección de paroxismos
Canal 0 Archivo preprocesado Canal 1 Canal N-1 APLICACIÓN DE LOS MODELOS DE DETECCION Una vez preprocesados los archivos, el siguiente paso consistió en aplicar de a uno los modelos de detección de paroxismos a cada uno de los canales del archivo de datos de EEG. El objetivo de esta etapa es poder detectar todos los paroxismos ocurridos en cada uno de los canales, para luego poder analizarlos en conjunto. El resultado de aplicar un modelo de detección es un archivo de marcas generadas. Estos archivos contienen, para cada ventana de señal procesada un conjunto de valores que la clasifican como un paroxismo o como señal de base. Modelo 1 Canal N

31 Agrupamiento de marcas
El proceso de detección de paroxismos toma como entrada un archivo preprocesado de datos, y luego de aplicar un modelo, genera un archivo de marcas. Este archivo de marcas contiene la clasificación realizada por el modelo de cada uno de los registros del archivo de entrada. Así es como para un paroxismo ubicado en un canal en un tiempo dado, se generan uno o mas registros seguidos en el archivo de marcas del canal, indicando la presencia del evento. Se puede apreciar un paroxismos punta onda que es detectado en 5 ventanas consecutivas. Las características inherentes del mismo, determinaron que el modelo de detección las clasifique como positivos (SI). (CLICK) Así es como después de aplicar el modelo se obtiene un archivo de marcas generadas en el cual se encuentran 5 registros consecutivos clasificados como paroxismo (SI). Fue necesario agrupar todas detecciones en un único registro donde quede identificado el paroxismo. El agrupamiento permite ajustar la detección de paroxismos luego de aplicar un modelo. Una de las características de los 10 archivos de detecciones, a demás del modelo utilizado, es el agrupamiento de marcas. Se puede decir entonces, que en el ejemplo anterior, el evento paroxístico que comenzó en el registro 5 finalizó en el registro 9. Utilizando un agrupamiento de marcas de 6 registros seguidos, este evento no sería reconocido, mientras que los agrupamientos de 1 a 5 sí lo registrarían.

32 Casos a Procesar CASOS A PROCESAR
Teniendo en cuenta el agrupamiento y los modelos seleccionados, se determinó la siguiente lista de casos a procesar, tal como lo muestra la tabla

33 Análisis de todos los canales
Detección del canal principal Cálculo de la cobertura de las marcas Gráfica de todos los canales ANÁLISIS DE TODOS LOS CANALES Una vez generados los archivos de marcas sobre todos los canales, el siguiente paso consistió en analizar los datos recolectados, para poder entregar a los expertos la información necesaria que les permita determinar el sitio de origen de la actividad paroxística, y su propagación a través de los canales involucrados.

34 Detección del canal principal
El primer paso consistió en detectar el canal principal. En aquellos pacientes donde el registro de la señal del EEG se llevó a cabo en los períodos interictales, el canal principal es aquel que tiene el mayor número de paroxismos. Tal es el caso del archivo de datos utilizado para esta investigación. La detección del canal principal se realizó mediante el procesamiento de la información de las marcas, calculando la sumatoria de los paroxismos detectados en cada canal. Posteriormente se localizó aquel que tenía la mayor cantidad de estos paroxismos y se lo marcó como principal. En color azul se puede identificar el canal con mayor cantidad de marcas, por caso analizado.

35 Cálculo de la cobertura de las marcas
% Cobertura del canal principal 5 marcas / 5 marcas  100% 3 marcas / 5 marcas  60% CÁLCULO DE LA COBERTURA DE LAS MARCAS Una vez determinado el canal principal, se procedió a calcular la cobertura de marcas de cada uno de los canales sobre el total de marcas del principal. ¿Que es % Cobertura sobre el canal principal?.. El cálculo se realiza con el coeficiente de las marcas de un canal, sobre las marcas del canal principal. Esta métrica nos da una idea de cuan activo es el canal (paroxismos presentes), con respecto al canal principal. (CLICK) El objetivo de este procedimiento fue el de aportar toda la información necesaria a los expertos para que pudieran determinar el canal principal, y la propagación de la señal sobre los otros canales involucrados.

36 Gráfica de todos los canales
Para poder aportar información visual a los expertos y ayudar a determinar la organización de la descarga epiléptica, se desarrolló una aplicación que permite, entre otras funcionalidades, visualizar por modelo de detección, los paroxismos detectados en cada uno de los canales. En este ejemplo se puede observar que el canal coloreado con rojo (canal 0) fue el que presentó la mayor cantidad marcas. En color naranja se pueden observar los paroxismos detectados en los otros canales. Se puede ver que existe una gran cantidad de actividad paroxística en mas del 90% de los canales en la franja de tiempo presentada.

37 Agenda Objetivo de la Tesis Introducción a EEG y Epilepsia
Data Mining y la metodología sobre la que se basa la Tesis Definición del problema Procesamiento y análisis de los canales Análisis de los resultados y Conclusiones Trabajos futuros Herramienta desarrollada

38 Análisis de los resultados
RESULTADOS OBTENIDOS Como primer análisis se decidió graficar el % de cobertura de los canales, para cada modelo. Esto nos permitió ver en forma gráfica que canales presentan mayor actividad paroxística, después del canal principal. Para poder hacer un mejor análisis, se dividieron los modelos en dos grupos. Se puede apreciar que el canal 0 y el canal 1 presentan la mayor concentración de marcas, y en el 80 % de los casos del grupo 1 fueron seleccionados como canal principal. Existe únicamente un caso que pareciera no presentar la misma tendencia que los demás. Es el caso 3, el cual tiene al canal 8 como el principal. También se puede observar que los canales 16 a 18, y 20 a 24 presentan gran cantidad de actividad paroxística, junto a la del canal principal.

39 Análisis de los resultados
RESULTADOS OBTENIDOS Este grupo es más homogéneo, ya que el 100% de los casos presentan al canal 0 o al canal 1 como el de mayor concentración de marcas. También se puede observar una gran actividad paroxística en los canales 16 a 18, y 20 a 24.

40 Análisis de los resultados
Análisis de las relaciones entre canales RESULTADOS OBTENIDOS Los canales no son independientes unos de otros, ya que una descarga eléctrica producida en una zona del cerebro, afecta a los electrodos cercanos. Para poder analizar la relación existente entre los electrodos (o canales), se analizaron los canales de cada caso por separado. Para ello se aplicó una función sobre el % de cobertura de cada canal. El objetivo es determinar el grupo de canales relacionados con el canal principal e involucrados en la propagación de la señal.

41 Análisis de los resultados
RESULTADOS OBTENIDOS Aquí se pueden ver algunos de las figuras donde se graficaron los datos de cada canal para cada caso estudiado. Como se puede apreciar, existen tres grupos de canales que estarían relacionados con el canal principal. Dependiendo del modelo de detección de paroxismos utilizado y el agrupamiento, los conjuntos varían, pero en el 90 % de los casos, se obtuvieron los mismos conjuntos. Esta información sirve de apoyo a los expertos a la hora de determinar la topología de la propagación de la señal.

42 Análisis de los resultados
RESULTADOS OBTENIDOS En este gráfico se pueden apreciar todos los casos estudiados con sus canales. Las marcas rojas corresponden a los canales cuyo % de cobertura es igual o mayor al promedio. Se puede ver que en la mayoría de los casos los canales involucrados son los mismos. Sin conocer la topología del montaje, se podría deducir que junto con el canal principal, se ven afectados los canales 16 al 17 y 20 al 24. La señal comienza en el canal principal y se propaga hacia ellos. En menor medida se ven afectados los canales 10 y 11, 1, 3 y 5. Esta información resultó de ser de gran utilidad para los expertos.

43 Conclusiones Se ratificó la detección automática de paroxismos en EEGs de pacientes epilépticos, utilizando técnicas de Data Mining. Se pudo ratificar la existencia de una relación entre los canales, y determinar los grupos de canales asociados. Se desarrolló una herramienta que permite la detección automática de paroxismos y asistir a los expertos para determinar la propagación de la señal desde el canal principal hacia los demás involucrados. CONCLUSIONES En la presente tesis se ratificó la detección automática de paroxismos en EEGs de pacientes epilépticos, utilizando técnicas de Data Mining, planteada en el trabajo de detección automática de paroxismos en EEG utilizando técnicas de Data Mining. Se localizaron los paroxismos en todos los canales de un EEG, permitiendo un análisis de toda la actividad paroxística, tanto en forma visual, como en forma analítica. Todos los casos aplicados fueron analizados y permitieron corroborar la existencia de una relación entre el canal principal, donde se origina la actividad, y los canales involucrados en la propagación. Se pudo determinar que existe una relación entre ellos, y cuales fueron los grupos de canales asociados. La detección de paroxismos en múltiples canales, la localización del canal principal y el análisis de la propagación de la actividad paroxística hacia los demás canales involucrados contribuirá con los expertos en la detección de la señal epiléptica en todos los canales de un EEG, reduciendo considerablemente el tiempo de detección realizado manualmente, ya que permitió la automatización del proceso.

44 Agenda Objetivo de la Tesis Introducción a EEG y Epilepsia
Data Mining y la metodología sobre la que se basa la Tesis Definición del problema Procesamiento y análisis de los canales Análisis de los resultados y Conclusiones Trabajos futuros Herramienta desarrollada

45 Trabajos futuros Mejorar los modelos de detección, marcando los FP como señal de base y agregando los VP para aumentar la detección y mejorar la clasificación Modificar la herramienta para permitir seleccionar rangos de tiempo abarcando todos los canales, agruparlos y exportarlos Modificar la herramienta para eliminar un canal ruidoso del análisis TRABAJOS FUTUROS Una mejora a los modelos de detección podría ser realimentarlos, generando un nuevo modelo indicando los falsos positivos como señal de base, para que en futuras detecciones no sean clasificados como paroxismos. También se podrían introducir en los modelos los nuevos paroxismos detectados, para aumentar el desempeño y mejorar la clasificación. Durante las reuniones realizadas con los expertos para este trabajo de tesis, se planteó la necesidad de marcar un rango de tiempo en donde se encuentren un grupo de paroxismos, y permitir agruparlos para realizar un análisis posterior. Una mejora a la herramienta desarrollada podría ser la selección de períodos de tiempo abarcando todos los canales, permitir la agrupación de los mismos, y exportarlos en un formato estándar, por ejemplo el formato EDF (European Data Format), compatible con otros programas de análisis de señal. También se planteó la necesidad de, si se detecta un canal de datos con mucho ruido, permitir su eliminación del análisis; y de poder eliminar un paroxismo detectado por el algoritmo que se presume es un falso positivo. Estas podrían ser otras mejoras a la herramienta desarrollada.

46 Agenda Objetivo de la Tesis Introducción a EEG y Epilepsia
Data Mining y la metodología sobre la que se basa la Tesis Definición del problema Procesamiento y análisis de los canales Análisis de los resultados y Conclusiones Trabajos futuros Herramienta desarrollada

47 Preguntas

48 Archivo preprocesado Declaración de los atributos o campos
Datos procesados

49 Archivo de marcas generadas
La primera columna representa el número de registro La segunda columna representa la clasificación realizada por el modelo La tercera columna representa la probabilidad del registro a pertenecer a la clase asignada La cuarta columna representa la clasificación original

50 Archivo de detecciones
Los registros se agrupan de a pares, identificando una detección La primera columna representa el número de muestra La segunda columna representa la el canal donde se encuentra el paroxismo La tercera columna representa un identificador de inicio (ISI) o fin (F) del paroxismo

51 Herramienta desarrollada

52 Herramienta desarrollada
Configuración

53 Herramienta desarrollada
Selección del EEG a graficar

54 Herramienta desarrollada
Paroxismos detectados


Descargar ppt "Maestría en Tecnologías de la Información"

Presentaciones similares


Anuncios Google