Maestría en Tecnologías de la Información

Slides:



Advertisements
Presentaciones similares
Servicio de Neurología y Neurocirugía
Advertisements

EPILEPSIA Manifestaciones Clínicas Dra. Tania Rodriguez R.
Data Mining Minería de Datos Universidad Tecnológica Metropolitana
Monitoreo y detección temprana. Parte I Bases epidemiológicas para el control de la enfermedad – Otoño 2001 Joel L. Weissfeld, M.D. M.P.H.
Crisis convulsivas Irene Mora Q A53695.
Módulo Tablero de Control Sesión X Lic. Aarón García López.
Servicio de Neurología y Neurocirugía
Diagnóstico y Tratamiento
Introducción a la minería de datos
EPILEPSIA Dr. Pedro G. Cabrera J..
LA EPILEPSIA.
SENA REGIONAL HUILA REGIONAL HUILA CENTRO DE LA INDUSTRIA LA EMPRESA Y LOS SERVICIOS Huila Elementos de Información En teoría de.
ACÚSTICA Y OÍDO HUMANO 1.- Introducción. 2.- Anatomía del oído humano.
VIVIANA ACHURY S. ANGIE NATALIA GARCIA S.. En los últimos años, ha existido un gran crecimiento en nuestras capacidades de generar y colectar datos (Bajo.
INTERFAZ DE ACCES DISEÑO DE BASE DE DATOS
Fechas de control Este mapa muestra un gráfico de burbujas con los días desde el último control de caudal tomado a cada pozo. Se utilizó una escala manual.
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
Por: MARISOL YANETH BURITICA BEDOYA. Me resulta muy interesante difundir el conocimiento de esta enfermedad tan poco conocida que se estima que tienen.
UNIVERSIDAD CATÓLICA DEL MAULE FACULTAD DE CIENCIAS DE LA INGENIERÍA ESCUELA DE INGENIERÍA CIVIL INFORMÁTICA PROFESOR GUÍA: HUGO ARAYA CARRASCO. ALUMNO.
INTELIGENCIA DE NEGOCIOS
Herramientas informáticas Hojas de cálculo
ELECTRONEUROGRAMA ACTIVIDAD ELECTRICA DEL NERVIO
Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".
UNIVERSIDAD MICHOACANA DE SAN NICOLÁS DE HIDALGO
Procesamiento de Imágenes Digitales
Inicialización de Superficies Deformables mediante Elipsoides Generalizados R. Dosil, X. M. Pardo, A. Mosquera, D. Cabello Grupo de Visión Artificial Departamento.
Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".
RESUMEN En este artículo se describe en forma breve una de las líneas de investigación que se están llevando a cabo en el Laboratorio de Tecnologías Emergentes.
Departamento de Salud Pública Facultad de Medicina UNAM
BASES DE DATOS Con Access.
Stifano Flores, Lucia Domínguez, Yelerys Moreno, Héctor.
Control y Mantenimiento de Informes Clínicos
Evaluación de riesgos y análisis de decisiones Gestión Ambiental Tema 11.
Dra. Priscilla Monterrey Neurología
Data Mining aplicado a promociones en tarjetas de crédito/débito Diego Rafael Gómez Izquierdo Universidad de Palermo
Análisis de Sistemas.
EPILEPSIA Enfermedad del sistema nervioso Central (Cerebro) ocasionada por descargas eléctricas excesivas de las células del cerebro (Neuronas), que se.
SISTEMA DE INFORMACION DE CUIDADOS
Plan de Sistemas de Información (PSI)
Andrés Harker Gutiérrez Director: Cesar Julio Bustacara Medina MSc. Asesor: Oscar Xavier Chavarro MSc. Arquitectura de un módulo I/O para objetos 3D Pontificia.
NOMBRES:OLIVARES ALFARO JOSE L. BONETTI ARON GRUPO:308.
GUTIÉRREZ GRANADOS HÉCTOR DANIEL
Aprendizaje No Supervisado y Redes de Kohonen
Especialización en Desarrollo de Software
1 Prof:Paula Quitral INTRODUCCIÓN MINERIA DE DATOS Departamento de Informática Universidad de Rancagua.
IDENTIFICACIÓN PRIORIZADA DE PACIENTES CON ENFERMEDADES CRÓNICAS A TRAVÉS DEL ANÁLISIS DE HISTORIAS CLÍNICAS ELECTRÓNICAS Pontificia Universidad Javeriana.
Evaluación de riesgos y análisis de decisiones
EPILEPSIA Trabajo realizado por: Jaime Garcia, Andrés Moreno y Alejandro Vicente.
Reconocimiento de caras usando Histogramas de Gradientes Orientados
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.
DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.
UNIVERSIDAD TECNOLOGICA DE MÉXICO.
UNIVERSIDAD PEDAGÓGICA NACIONAL “FRANCISCO MORAZÁN” Facultad de Ciencia y Tecnolog í a Departamento de Educaci ó n Espacio Formativo: Metodolog í a de.
KDD y Técnicas de Minería de Datos en Weka
Centro de estudios Tecnologicos del Mar nO.20
Colegio de Bachilleres Plantel 13 Xochimilco - Tepepan
INTERFAZ DE ACCESS  Access es un sistema gestor de bases de datos relacionales (SGBD). Una base de datos suele definirse como un conjunto de información.
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.
Facultad de Ciencias Exactas Universidad Nacional del Centro de la Provincia de Buenos Aires (UNICEN) Nicolás A. Tourné Directora: Dra. Daniela Godoy Tandil,
DATA MINING. Extracción de información oculta y predecible de grandes bases de datos Poderosa tecnología que ayuda a concentrase en la información importante.

CARACTERÍSTICAS ESPECIALES DE LA EXTRACCIÓN DE CONOCIMIENTO DE INFO. NO ESTRUCTURADA Objetivos ligeramente Especiales: Búsqueda de Información Relevante.
Para cada uno de los atributos, indicaremos su campo de descripción. Cuando un campo no dispone de este (como el.
Normalización es un proceso que clasifica relaciones, objetos, formas de relación y demás elementos en grupos, en base a las características que cada.
Rafael Zamora Garrido Julio Ejemplos de objetivos de Minería de Datos Reducir las bajas de clientes actuales en un 5%. Aumentar las contrataciones.
INDICE BIESPECTRAL (bis)
Primera crisis epiléptica afebril
Transcripción de la presentación:

Maestría en Tecnologías de la Información Trabajo de Tesis “Análisis de la propagación de la señal paroxística en EEGs utilizando técnicas de Data Mining sobre múltiples canales“ Directora Dra. Alicia Mon Integrantes E. Santiago, P. Valenti

Agenda Objetivo de la Tesis Introducción a EEG y Epilepsia Data Mining y la metodología sobre la que se basa la Tesis Definición del problema Procesamiento y análisis de los canales Análisis de los resultados y Conclusiones Trabajos futuros Herramienta desarrollada

Objetivo “Extender el trabajo realizado sobre detección automática de paroxismos en EEG utilizando técnicas de Data Mining analizando todos los canales, y aportando información del canal principal sobre el cual se propaga la señal paroxística.” Beneficios Disminución considerable del tiempo de análisis por parte de los expertos Facilitar a los expertos la detección de la topología de la crisis epiléptica

Agenda Objetivo de la Tesis Introducción a EEG y Epilepsia Data Mining y la metodología sobre la que se basa la Tesis Definición del problema Procesamiento y análisis de los canales Análisis de los resultados y Conclusiones Trabajos futuros Herramienta desarrollada

Introducción a EEG y Epilepsia Definición de Epilepsia ElectroEncefaloGrama (EEG) EEG aplicado a la epilepsia Paroxismos Algunas definiciones

Epilepsia “Afección neurológica crónica, recurrente y repetitiva, de fenómenos paroxísticos ocasionados por descargas de neuronas cerebrales de forma desordenada y excesiva” Def 1: Enfermedad neurológica crónica caracterizada por la aparición repetida de crisis convulsivas generalizadas o localizadas, o de pérdidas de conciencia súbitas y transitorias. Def 2: una descarga súbita, rápida y excesiva de las células cerebrales Una crisis epiléptica es producida por descargas descontroladas de las neuronas. Esta actividad se transmite de una neurona a otras vecinas, abarcando una gran cantidad de secciones del cerebro, desencadenando las manifestaciones propias de la epilepsia. Sus causas pueden ser muy diversas y sus manifestaciones sumamente variadas. La epilepsia está caracterizada por: - Los ataques tienen un inicio súbito y brusco, con una duración breve, y luego tienden a restablecer las señales cerebrales. Son manifestaciones paroxísticas. - Su principal característica es la repetición de los ataques o crisis. - Es una enfermedad que puede durar muchos años, o inclusive toda la vida de la persona enferma. Los síntomas que experimenta una persona durante una crisis epiléptica dependen del lugar en el cerebro en el cual ocurre la alteración de la actividad eléctrica. Una persona que tiene una crisis puede: - gritar - perder el sentido y desplomarse - ponerse rígido y con espasmos musculares. - puede parecer confundido o aturdido y no podrá responder a preguntas ni instrucciones. Otras personas tienen ataques muy leves que ni siquiera son notados por otros. Algunas veces, la única manifestación de la crisis epiléptica es un parpadeo rápido o algunos segundos de mirada perdida con desconexión del medio. La crisis puede durar desde unos segundos hasta varios minutos.

Electroencefalograma (EEG) Un EEG es una exploración neurofisiológica que se basa en el registro de la actividad bioeléctrica cerebral. Refleja la actividad post-sináptica y el flujo extracelular de grandes poblaciones neuronales. Esas neuronas así como otras células nerviosas, tienen un potencial de descanso el cual es una diferencia de potencial eléctrica entre el interior de la célula y el espacio extracelular. La amplitud de estas señales usualmente se encuentra de 10 a 100 microvolts. En el ejemplo se puede ver un EEG de 17 canales. Ejemplo de EEG

EEG aplicado a la Epilepsia Confirmación del diagnóstico clínico Predicción de posibles recurrencias tras la disminución / supresión del tratamiento antiepiléptico Tipo y etiología de las crisis Detección de actividad Paroxística Etiología: Parte de la medicina que estudia el origen o las causas de las enfermedades Como es obvio suponer, el EEG desempeña un papel fundamental como apoyo a los datos clínicos en el diagnóstico de las epilepsias. Estas patologías se presentan en todas las edades aunque la incidencia es mayor en la infancia y adolescencia así como en la tercera edad. En líneas generales la función del EEG es la confirmación del diagnóstico clínico de epilepsia, predicción de posibles recurrencias tras la disminución / supresión del tratamiento antiepiléptico y quizás el intento de predicción de posibles lesiones cerebrales agudas focales (áreas de contusión, zonas corticales próximas a neoplasias cerebrales o lesiones vasculares corticales). El grueso de pacientes con epilepsias y síndromes epilépticos correctamente diagnosticado y tratados no precisan de estudios EEG de control. Los pacientes afectos de epilepsias no controladas satisfactoriamente precisarán de estudios especiales para poder discernir con mayor certeza si los eventos paroxísticos que padecen son crisis epilépticas, qué tipo de crisis son y cual es la etiología.

Punta onda – Onda aguda – Polipuntas Paroxismos “Ciertos grafoelementos que se presentan en un muy alto porcentaje en pacientes epilépticos, denominados grafoelementos epileptiformes” Analizando los EEGs de pacientes epilépticos, se descubrieron ciertos grafoelementos los cuales se presentaban en un muy alto porcentaje y a los cuales se les denominó grafoelementos epileptiformes. Existen básicamente tres tipos de grafoelementos epileptiformes: - Los primeros, son las puntas, que son aquellas ondas con terminación en punta que tienen una duración menor a 70 ms y cuya amplitud sobrepasa a la del ritmo de base donde aparecen por lo menos en un 50%. - Las segundas, son las ondas agudas, las cuales presentan las mismas características que las puntas, pero con una duración que va de los 70 a los 200 mseg. - Los terceros, son los denominados complejos ya que se integran por la combinación de por lo menos dos grafoelementos siendo el mas frecuente, el llamado complejo punta-onda lenta en donde se asocia una punta con las características antes mencionadas con una onda lenta típicamente con duración mayor a los 200 ms. Punta onda – Onda aguda – Polipuntas

Alguna definiciones Actividad de base: es el registro de la actividad eléctrica cerebral en condiciones de reposo o durante el sueño espontáneo, también llamada señal de base. Periodo Ictal: El comienzo de la crisis o periodo ictal se define por el primer cambio eléctrico en el ritmo de base del EEG o alguna manifestación clínica que indica el inicio de la misma. Período Interictal: Los periodos interictales son aquellos entre ataques de epilepsia (crisis), que pueden contener actividad de base o actividad paroxística.

Agenda Objetivo de la Tesis Introducción a EEG y Epilepsia Data Mining y la metodología sobre la que se basa la Tesis Definición del problema Procesamiento y análisis de los canales Análisis de los resultados y Conclusiones Trabajos futuros Herramienta desarrollada

Data Mining “Data Mining o KDD es la extracción no trivial de información implícita, previamente desconocida y potencialmente útil de los datos” “Búsqueda de relaciones y patrones globales existentes en una gran base de datos, pero que están ocultos a simple vista, debido a la gran cantidad de información almacenada” Se podría hacer una especie de analogía con el proceso de minería tradicional. Una analogía tiene la presunción que si dos cosas son similares en un área, también serán similares en otras. Tal como la minería tradicional del oro es la búsqueda de pepitas de oro, Data Mining es la búsqueda de pepitas de información. Como el oro que esta oculto dentro de la tierra o bajo el agua, las pepitas de información están ocultas en los datos. La primera analogía compara la definición de las pepitas de oro con la definición de las pepitas de información. Para un minero sin experiencia, el oro es oro, pero para un minero experimentado el tamaño de las pepitas a descubrir tiene una importancia significativa en las técnicas o herramientas a utilizar en el proceso de exploración. Por ejemplo, un minero independiente usará básicamente métodos manuales con los cuales podrá encontrar solamente pepitas de oro de un tamaño considerable. En cambio las compañías de minería industrial tienen la posibilidad a través del uso de herramientas más sofisticadas de poder buscar oro a escala molecular. A su vez dependiendo de lo que se está buscando, ya sea plata, petróleo, etc., el proceso de minería será distinto. Esto muestra la importancia de definir claramente las pepitas de información que son deseadas como así también, que técnicas son las adecuadas para realizar dicha búsqueda. Las técnicas de Data Mining son éstas herramientas sofisticadas que permiten buscar, descubrir y obtener las pepitas de información dentro de grandes volúmenes de datos.

Data Mining Fases del proceso de DM Selección de los datos Preprocesamiento de la información Data Mining Validación del modelo generado Selección: selección o segmentación de los datos de acuerdo a un criterio dado, por ejemplo, para este trabajo de tesis se seleccionaron en primera instancia los archivos de datos, luego los canales, y por último los segmentos de señal sobre los cuales se trabajará. Preprocesamiento: esta es la fase que involucra la limpieza inicial de los datos (Data Cleaning) donde cierta información es removida, la cual es por si innecesaria y puede disminuir el desempeño de las consultas, por ejemplo, es innecesario tener el sexo de un paciente cuando se realizan estudios por embarazo. Además involucra la reconfiguración de los datos para asegurar un formato consistente (Enrichment), ya que existe la posibilidad de que haya inconsistencias debido a que los datos pueden provenir de diferentes fuentes, también reconstrucción de datos faltantes, combinación y / o conversión de campos existentes para generar nuevos datos (Coding). Estos pasos requieren un esfuerzo considerable, generalmente más del 70% del esfuerzo total del proceso de Data Mining. Más adelante se verá como se preprocesaron los datos de entrada utilizando funciones de transformación, FFT, técnicas de windowing, etc. Data Mining: esta fase involucra la selección de los algoritmos o métodos, y el uso de las herramientas para construir, testear y seleccionar modelos. Validación del modelo: testear el modelo sobre un conjunto de datos independiente (que no fue utilizado para generar el modelo) para probar su exactitud o su precisión. Realizar una prueba piloto para determinar la usabilidad del mismo, por ejemplo, si se está generando un modelo sobre un EEG de un paciente, reservar una porción del mismo para realizar las pruebas.

Metodología sobre la que se basa la Tesis Detección de señales paroxísticas (punta onda, ondas agudas y polipuntas) sobre un mono-canal de un EEG utilizando un algoritmos de clasificación de Data Mining. El presente trabajo de tesis utilizó como punto de partida la metodología desarrollada por [CAZ/03] en la cual se realizó la detección de señales paroxísticas en señales EEG de pacientes con problemas de epilepsia del Centro de Epilepsia de la División de Neurología del Hospital Ramos Mejía. Se logró la automatización de la detección utilizando algoritmos de clasificación de Data Mining.

Metodología – Paso 1 Los archivos de datos utilizados son señales EEG de pacientes epilépticos asistidos en el Centro de Epilepsia del Hospital Ramos Mejía de la ciudad de Buenos Aires. SELECCIÓN DE LOS DATOS ====================== Le primera etapa es la selección de los datos. Para ello se eligieron un conjunto de archivos EEG de pacientes epilepticos. Se seleccionaron 4 EEGs de 3 pacientes: - B09, B11, 2CH : Entrenamiento y testeo - SA : Medición contra expertos Los EEGs fueron generados con electrodos de inserción profundos intracerebrales, y registrado por un paquete de software llamado HARMONIE El conjunto de datos fue separado un 66% para entrenar, y 34% para prueba.

Metodología – Paso 2 PREPROCESAMIENTO DE LOS DATOS ============================== El paso 2 consistió en preparar la información. Para que el algoritmo de DM pueda procesar la información, ésta debe estar representada de una determinada manera, es necesario eliminar los datos incorrectos, se debe aplicar funciones de transformación para resaltar las características inherentes de la morfología de los paroxismos. Cada registro del archivo de datos preprocesados quedó indentificado con un SI si es un paroxismos, o un NADA si es actividad de base.

Metodología – Paso 3 Árboles de decisión J4.8 Naive Bayes GENERACIÓN DE MODELOS ====================== Para la generación de los modelos de detección se utilizó una herramienta de Data Mining llamada WEKA. Este software fue desarrollado por Ian H. Witten y Eibe Frank, investigadores del departamento de Computer Science de la Universidad de Waikato de Nueva Zelanda. Se seleccionaron dos algoritmos de Data Mining (Naive Bayes y Árboles de decisión). Cada ventana de tiempo tomada de los archivos de datos procesados es catalogada con un atributo de clasificación que indica si se trata de una señal paroxística o no (Si indica que se trata de un paroxismo, Nada indica señal de base). Esta información es suministrada por los expertos, para poder generar los modelos de clasificación. Una vez catalogados los datos, son pasados a cada uno de los algoritmos para generar un modelo.

Metodología – Paso 4 Matriz de confusión Cobertura de las marcas Curvas ROC TESTEO DE LOS MODELOS ====================== Una vez generado el modelo de clasificación, se utilizó el 33.6% de los datos apartados para tal fin, y se probó el modelo. Este último conjunto tiene el atributo de clasificación sin asignar, ya que es el modelo el encargado de colocarlo, para determinar de qué tipo de señal se trata. Para poder determinar la eficacia del modelo, se utilizaron varias técnicas (matrices de confusión, cobertura sobre marcas de expertos y curvas ROC).

Metodología – Validación contra expertos ========================== El acrónimo ROC simboliza el término en inglés Receiver Operating Characteristic, y es utilizado en detección de señales para caracterizar el compromiso entre la tasa de aciertos y la tasa de falsa alarma sobre un canal ruidoso [WIT/00]. Este tipo de gráfico es una herramienta visual para examinar el desempeño de los clasificadores [SWE/88]. Las curcas ROC se utilizaron para ilustrar la relación entre las tazas de los verdaderos-positivos (VP) y los falsos-positivos (FP).

Agenda Objetivo de la Tesis Introducción a EEG y Epilepsia Data Mining y la metodología sobre la que se basa la Tesis Definición del problema Procesamiento y análisis de los canales Análisis de los resultados y Conclusiones Trabajos futuros Herramienta desarrollada

Definición del problema Necesidad Detección de la zona del cerebro donde se origina la crisis en aquellos pacientes epilépticos candidatos a cirugía. Problema Los estudios que se realizan tienen una duración bastante prolongada, llegando en muchos casos a 72 horas de grabación de señal EEG. Esto hace muy tedioso y agotador el trabajo de los expertos para el análisis de los mismos. Es fundamental en estos casos, poder confirmar que el foco está cercano a la lesión. Es fundamental, para aquellos pacientes epilépticos candidatos a cirugía, poder detectar la zona donde se origina la crisis, denominada zona epileptógena. La metodología utilizada en el campo de la detección de actividad paroxística se basa en el conocimiento del experto. Este trabajo requiere de gran experiencia y de un estudio cuidadoso de las distintas fuentes de información (historia clínica del paciente, EEG, videos, etc.) y de la capacidad de dichos expertos de interpretarlas. Los estudios que se realizan tienen, por lo general, una duración bastante prolongada, llegando en muchos casos a 72 horas de grabación de señal EEG. Esto hace muy tedioso y agotador el trabajo de los expertos para el análisis de los mismos. Es fundamental en estos casos, poder confirmar que el foco está cercano a la lesión. La utilización de algoritmos inteligentes reduce sustancialmente el tiempo computacional, contra las metodologías tradicionales de análisis de señales y por el otro la aplicación de este tipo de tecnología es fácil de adquirir debido a la existencia de herramientas de acceso público disponibles. Si bien, y como ya se planteó anteriormente, existen desarrollos en este área que utilizan algoritmos de Data Mining para la división de los conjuntos de señales, o la agrupación es clases de señales, no se realizaron metodologías que utilicen Data Mining para detectar directamente y clasificar las señales. Esta tarea se realiza con algoritmos matemáticos especiales de detección de señales. La motivación de este trabajo se genera a partir de la implementación de una metodología que ayude a los expertos en epilepsia a la detección de la topografía de la crisis epiléptica en pacientes candidatos a cirugía, automatizando la detección, disminuyendo el tiempo y esfuerzo dedicado y aumentando el porcentaje de eficacia. Esta metodología no sólo aplica en ese objetivo, sino también en la generación de un conjunto de herramientas que asistan a dichos expertos en la automatización de la detección.

Agenda Objetivo de la Tesis Introducción a EEG y Epilepsia Data Mining y la metodología sobre la que se basa la Tesis Definición del problema Procesamiento y análisis de los canales Análisis de los resultados y Conclusiones Trabajos futuros Herramienta desarrollada

Procesamiento y análisis de los canales Etapa 1 Metodología Se desarrolló una metodología que permitió el análisis de todos los canales de un electro-encefalograma, para luego detectar la propagación de la señal paroxística entre los canales involucrados. La metodología planteada se dividió en dos etapas: Etapa 1 Tomar los 10 archivos de detección que tuvieron el mejor desempeño (menor distancia en la matriz ROC) en la detección de paroxismos. Se seleccionó el mismo archivo de datos de un EEG utilizado para la validación de los modelos. Para cada uno de los archivos anteriores se llevó a cabo un preprocesamiento de los 32 canales de datos del EEG, teniendo en cuenta las funciones de transformación y ventanas de windowing utilizadas en cada uno. Luego se clasificaron todas las señales de los canales, separando los paroxismos (marcas) de la señal de base.

Procesamiento y análisis de los canales Etapa 2 Etapa 2 Para cada uno de los 10 archivos de detecciones, se agruparon las marcas obtenidas y luego se graficaron los 32 canales del EEG junto con sus marcas, para poder visualizar la relación existente entre ellos y determinar la propagación de la señal paroxística. Se realizaron comparaciones entre los 10 archivos de detecciones procesados, para validar la metodología.

Procesamiento y análisis de los canales Selección de los datos Preprocesamiento de la información Aplicación de los modelos de detección de paroxismos Análisis de todos los canales

Selección de los datos Archivo de datos EEG Archivos de detecciones ---------------------------------------- Como archivo de datos fue seleccionado el EEG utilizado en el trabajo sobre el cual se basó esta investigación: es un fragmento de un estudio de un paciente, de una duración de 269 segundos, constituido por 32 canales de datos. ARCHIVOS DE DETECCIONES ---------------------------------------------- Como archivos de detección de paroxismos fueron seleccionados aquellos que generaron los 10 archivos de detecciones con menor valor de distancia (curvas ROC).

Selección de los datos Modelos seleccionados MODELOS SELECCIONADOS --------------------------------------------- Una vez elegidos los archivos, se seleccionaron los modelos utilizados para su generación. Cada modelo, está asociado a un algoritmo de clasificación de Data Mining, una función de windowing y una función de transformación. A continuación se puede apreciar la tabla con los modelos.

Preprocesamiento de la información Windowing Funciones de transformación R2 y I2 sqr(R2 + I2) y atan(I/R) Hanning Cuadrada WINDOWING -------------------- Se aplicaron las dos técnicas de windowing que mejores resultados obtuvieron, para atenuar los bordes de la ventana de la señal: Hanning y ventana cuadrada. Las siguientes figuras muestran la señal atenuada al aplicar la técnica. FUNCIONES DE TRANSFORMACIÓN -------------------------------------------------------- Según los modelos seleccionados, las funciones de transformación que mejores resultados obtuvieron fueron Estas funciones operan sobre los valores obtenidos luego de aplicar la FFT. Como se explicó en capítulos anteriores, sobre una ventana de 64 muestras, la aplicación de la FFT genera 64 valores de salida, donde los primeros 32 corresponden a la parte real; y los siguientes 32 valores a la parte imaginaria. El primer valor de la parte real y de la parte imaginaria contiene la media de todas las muestras de entrada, por lo que son descartados.

Preprocesamiento de la información PREPROCESO Una vez identificados los modelos y sus funciones de transformación, se procedió a aplicarlos sobre el archivo de datos del EEG (CLICK) Este proceso se realizó por cada canal del archivo EEG, generando un nuevo archivo de datos, para utilizado en la siguiente etapa. Estos nuevos archivos de datos fueron creados con un formato especial (.arff), para poder ser procesados por los algoritmos de Data Mining provistos por WEKA, conteniendo una descripción del archivo, un encabezado y una sección con los datos.

Aplicación de los modelos de detección de paroxismos Canal 0 Archivo preprocesado Canal 1 Canal N-1 APLICACIÓN DE LOS MODELOS DE DETECCION Una vez preprocesados los archivos, el siguiente paso consistió en aplicar de a uno los modelos de detección de paroxismos a cada uno de los canales del archivo de datos de EEG. El objetivo de esta etapa es poder detectar todos los paroxismos ocurridos en cada uno de los canales, para luego poder analizarlos en conjunto. El resultado de aplicar un modelo de detección es un archivo de marcas generadas. Estos archivos contienen, para cada ventana de señal procesada un conjunto de valores que la clasifican como un paroxismo o como señal de base. Modelo 1 Canal N

Agrupamiento de marcas El proceso de detección de paroxismos toma como entrada un archivo preprocesado de datos, y luego de aplicar un modelo, genera un archivo de marcas. Este archivo de marcas contiene la clasificación realizada por el modelo de cada uno de los registros del archivo de entrada. Así es como para un paroxismo ubicado en un canal en un tiempo dado, se generan uno o mas registros seguidos en el archivo de marcas del canal, indicando la presencia del evento. Se puede apreciar un paroxismos punta onda que es detectado en 5 ventanas consecutivas. Las características inherentes del mismo, determinaron que el modelo de detección las clasifique como positivos (SI). (CLICK) Así es como después de aplicar el modelo se obtiene un archivo de marcas generadas en el cual se encuentran 5 registros consecutivos clasificados como paroxismo (SI). Fue necesario agrupar todas detecciones en un único registro donde quede identificado el paroxismo. El agrupamiento permite ajustar la detección de paroxismos luego de aplicar un modelo. Una de las características de los 10 archivos de detecciones, a demás del modelo utilizado, es el agrupamiento de marcas. Se puede decir entonces, que en el ejemplo anterior, el evento paroxístico que comenzó en el registro 5 finalizó en el registro 9. Utilizando un agrupamiento de marcas de 6 registros seguidos, este evento no sería reconocido, mientras que los agrupamientos de 1 a 5 sí lo registrarían.

Casos a Procesar CASOS A PROCESAR Teniendo en cuenta el agrupamiento y los modelos seleccionados, se determinó la siguiente lista de casos a procesar, tal como lo muestra la tabla

Análisis de todos los canales Detección del canal principal Cálculo de la cobertura de las marcas Gráfica de todos los canales ANÁLISIS DE TODOS LOS CANALES Una vez generados los archivos de marcas sobre todos los canales, el siguiente paso consistió en analizar los datos recolectados, para poder entregar a los expertos la información necesaria que les permita determinar el sitio de origen de la actividad paroxística, y su propagación a través de los canales involucrados.

Detección del canal principal El primer paso consistió en detectar el canal principal. En aquellos pacientes donde el registro de la señal del EEG se llevó a cabo en los períodos interictales, el canal principal es aquel que tiene el mayor número de paroxismos. Tal es el caso del archivo de datos utilizado para esta investigación. La detección del canal principal se realizó mediante el procesamiento de la información de las marcas, calculando la sumatoria de los paroxismos detectados en cada canal. Posteriormente se localizó aquel que tenía la mayor cantidad de estos paroxismos y se lo marcó como principal. En color azul se puede identificar el canal con mayor cantidad de marcas, por caso analizado.

Cálculo de la cobertura de las marcas % Cobertura del canal principal 5 marcas / 5 marcas  100% 3 marcas / 5 marcas  60% CÁLCULO DE LA COBERTURA DE LAS MARCAS Una vez determinado el canal principal, se procedió a calcular la cobertura de marcas de cada uno de los canales sobre el total de marcas del principal. ¿Que es % Cobertura sobre el canal principal?.. El cálculo se realiza con el coeficiente de las marcas de un canal, sobre las marcas del canal principal. Esta métrica nos da una idea de cuan activo es el canal (paroxismos presentes), con respecto al canal principal. (CLICK) El objetivo de este procedimiento fue el de aportar toda la información necesaria a los expertos para que pudieran determinar el canal principal, y la propagación de la señal sobre los otros canales involucrados.

Gráfica de todos los canales Para poder aportar información visual a los expertos y ayudar a determinar la organización de la descarga epiléptica, se desarrolló una aplicación que permite, entre otras funcionalidades, visualizar por modelo de detección, los paroxismos detectados en cada uno de los canales. En este ejemplo se puede observar que el canal coloreado con rojo (canal 0) fue el que presentó la mayor cantidad marcas. En color naranja se pueden observar los paroxismos detectados en los otros canales. Se puede ver que existe una gran cantidad de actividad paroxística en mas del 90% de los canales en la franja de tiempo presentada.

Agenda Objetivo de la Tesis Introducción a EEG y Epilepsia Data Mining y la metodología sobre la que se basa la Tesis Definición del problema Procesamiento y análisis de los canales Análisis de los resultados y Conclusiones Trabajos futuros Herramienta desarrollada

Análisis de los resultados RESULTADOS OBTENIDOS Como primer análisis se decidió graficar el % de cobertura de los canales, para cada modelo. Esto nos permitió ver en forma gráfica que canales presentan mayor actividad paroxística, después del canal principal. Para poder hacer un mejor análisis, se dividieron los modelos en dos grupos. Se puede apreciar que el canal 0 y el canal 1 presentan la mayor concentración de marcas, y en el 80 % de los casos del grupo 1 fueron seleccionados como canal principal. Existe únicamente un caso que pareciera no presentar la misma tendencia que los demás. Es el caso 3, el cual tiene al canal 8 como el principal. También se puede observar que los canales 16 a 18, y 20 a 24 presentan gran cantidad de actividad paroxística, junto a la del canal principal.

Análisis de los resultados RESULTADOS OBTENIDOS Este grupo es más homogéneo, ya que el 100% de los casos presentan al canal 0 o al canal 1 como el de mayor concentración de marcas. También se puede observar una gran actividad paroxística en los canales 16 a 18, y 20 a 24.

Análisis de los resultados Análisis de las relaciones entre canales RESULTADOS OBTENIDOS Los canales no son independientes unos de otros, ya que una descarga eléctrica producida en una zona del cerebro, afecta a los electrodos cercanos. Para poder analizar la relación existente entre los electrodos (o canales), se analizaron los canales de cada caso por separado. Para ello se aplicó una función sobre el % de cobertura de cada canal. El objetivo es determinar el grupo de canales relacionados con el canal principal e involucrados en la propagación de la señal.

Análisis de los resultados RESULTADOS OBTENIDOS Aquí se pueden ver algunos de las figuras donde se graficaron los datos de cada canal para cada caso estudiado. Como se puede apreciar, existen tres grupos de canales que estarían relacionados con el canal principal. Dependiendo del modelo de detección de paroxismos utilizado y el agrupamiento, los conjuntos varían, pero en el 90 % de los casos, se obtuvieron los mismos conjuntos. Esta información sirve de apoyo a los expertos a la hora de determinar la topología de la propagación de la señal.

Análisis de los resultados RESULTADOS OBTENIDOS En este gráfico se pueden apreciar todos los casos estudiados con sus canales. Las marcas rojas corresponden a los canales cuyo % de cobertura es igual o mayor al promedio. Se puede ver que en la mayoría de los casos los canales involucrados son los mismos. Sin conocer la topología del montaje, se podría deducir que junto con el canal principal, se ven afectados los canales 16 al 17 y 20 al 24. La señal comienza en el canal principal y se propaga hacia ellos. En menor medida se ven afectados los canales 10 y 11, 1, 3 y 5. Esta información resultó de ser de gran utilidad para los expertos.

Conclusiones Se ratificó la detección automática de paroxismos en EEGs de pacientes epilépticos, utilizando técnicas de Data Mining. Se pudo ratificar la existencia de una relación entre los canales, y determinar los grupos de canales asociados. Se desarrolló una herramienta que permite la detección automática de paroxismos y asistir a los expertos para determinar la propagación de la señal desde el canal principal hacia los demás involucrados. CONCLUSIONES En la presente tesis se ratificó la detección automática de paroxismos en EEGs de pacientes epilépticos, utilizando técnicas de Data Mining, planteada en el trabajo de detección automática de paroxismos en EEG utilizando técnicas de Data Mining. Se localizaron los paroxismos en todos los canales de un EEG, permitiendo un análisis de toda la actividad paroxística, tanto en forma visual, como en forma analítica. Todos los casos aplicados fueron analizados y permitieron corroborar la existencia de una relación entre el canal principal, donde se origina la actividad, y los canales involucrados en la propagación. Se pudo determinar que existe una relación entre ellos, y cuales fueron los grupos de canales asociados. La detección de paroxismos en múltiples canales, la localización del canal principal y el análisis de la propagación de la actividad paroxística hacia los demás canales involucrados contribuirá con los expertos en la detección de la señal epiléptica en todos los canales de un EEG, reduciendo considerablemente el tiempo de detección realizado manualmente, ya que permitió la automatización del proceso.

Agenda Objetivo de la Tesis Introducción a EEG y Epilepsia Data Mining y la metodología sobre la que se basa la Tesis Definición del problema Procesamiento y análisis de los canales Análisis de los resultados y Conclusiones Trabajos futuros Herramienta desarrollada

Trabajos futuros Mejorar los modelos de detección, marcando los FP como señal de base y agregando los VP para aumentar la detección y mejorar la clasificación Modificar la herramienta para permitir seleccionar rangos de tiempo abarcando todos los canales, agruparlos y exportarlos Modificar la herramienta para eliminar un canal ruidoso del análisis TRABAJOS FUTUROS Una mejora a los modelos de detección podría ser realimentarlos, generando un nuevo modelo indicando los falsos positivos como señal de base, para que en futuras detecciones no sean clasificados como paroxismos. También se podrían introducir en los modelos los nuevos paroxismos detectados, para aumentar el desempeño y mejorar la clasificación. Durante las reuniones realizadas con los expertos para este trabajo de tesis, se planteó la necesidad de marcar un rango de tiempo en donde se encuentren un grupo de paroxismos, y permitir agruparlos para realizar un análisis posterior. Una mejora a la herramienta desarrollada podría ser la selección de períodos de tiempo abarcando todos los canales, permitir la agrupación de los mismos, y exportarlos en un formato estándar, por ejemplo el formato EDF (European Data Format), compatible con otros programas de análisis de señal. También se planteó la necesidad de, si se detecta un canal de datos con mucho ruido, permitir su eliminación del análisis; y de poder eliminar un paroxismo detectado por el algoritmo que se presume es un falso positivo. Estas podrían ser otras mejoras a la herramienta desarrollada.

Agenda Objetivo de la Tesis Introducción a EEG y Epilepsia Data Mining y la metodología sobre la que se basa la Tesis Definición del problema Procesamiento y análisis de los canales Análisis de los resultados y Conclusiones Trabajos futuros Herramienta desarrollada

Preguntas

Archivo preprocesado Declaración de los atributos o campos Datos procesados

Archivo de marcas generadas La primera columna representa el número de registro La segunda columna representa la clasificación realizada por el modelo La tercera columna representa la probabilidad del registro a pertenecer a la clase asignada La cuarta columna representa la clasificación original

Archivo de detecciones Los registros se agrupan de a pares, identificando una detección La primera columna representa el número de muestra La segunda columna representa la el canal donde se encuentra el paroxismo La tercera columna representa un identificador de inicio (ISI) o fin (F) del paroxismo

Herramienta desarrollada

Herramienta desarrollada Configuración

Herramienta desarrollada Selección del EEG a graficar

Herramienta desarrollada Paroxismos detectados