Inteligencia Artificial

Slides:



Advertisements
Presentaciones similares
PRONÓSTICOS EFICIENTES Y RACIONALES DR. LUIS MIGUEL GALINDO.
Advertisements

? ISO/IEC 9126 ISO/IEC Descripción del estándar.
UNIVERSIDAD AUTONOMA SAN FRANCISCO GESTION DE CALIDAD I Ing. Maria del Pilar Vera Prado.
Nathalia Castellanos Gómez Orfidia Ovalle Garzón Psicología 4D
Valencia, Junio de 2016 Modelo de Motor Virtual: 1 Optimización del proceso de cálculo Autor: Roberto Alegre Usach Tutor: D. Francisco Payri González.
TEMA 7: Conflictos laborales, negociación y toma de decisiones
Biblioteca Virtual, Repositorio Institucional y Observatorio Tecnológico Objetivo: Recuperar y gestionar toda la documentación científica, revistas, tesis,
Identificación de tráfico de red basado en Aprendizaje Automático
Ing. José Alberto Salgado Coussin
Un método de clasificación de las técnicas multivariantes
Tema: La Observación. Características de la observación
"Concretizando Nuestra Planificación Curricular"
Comparación de Modelos Neuronales Utilizadas en la Toma de Decisiones
Introducción a los protocolos de enrutamiento dinámico
Inteligencia Computacional
Marisa Ysunza Breña Septiembre de 2011
UNIVERSIDAD ICEP INTELIGENCIA ARTIFICIAL INGENIERÍA EN SISTEMAS COMPUTACIONALES Martes, 24 de Octubre de 2017 REPRESENTACIÓN DEL CONOCIMIENTO Y RAZONAMIENTO.
ACTIVIDAD No 3 Presentado por : Milena Rodriguez
Revisión Sistemática y Meta-análisis
Desarrollo Actividad Número 3
Descripción e interpretación de la estadística
Evaluar para aprender DINEIP
ANÁLISIS DE INVOLUCRADOS Mapa Político
Institución: Facultad de Ciencias d la computación Asignatura:
Aplicación web de reevaluación y recomendación de competencias profesionales, mediante inteligencia artificial.
ESTADISTICA GENERAL.
YADITH MARIA BUSTAMANTE VASQUEZ
Introducción a las Fórmulas.
Evaluación y Control de la Formación
SISTEMA DIGITAL Es una combinación de dispositivos diseñados para manipular cantidades físicas o información que estén representadas en forma digital,
La biotecnología y sus aplicaciones
Unidad 9 Los equipos de trabajo.
Clase Pasada…. ¿Como es la tierra? Geodesia Geoide
Clasificación de estilos musicales
RODRÍGUEZ CARRANZA SARAÍ ABI
Sistema de Comparación de Factores
PROCESO DE DESARROLLO ESTRATÉGICO DE UNA ORGANIZACION
Carla Saldivia – Diego Flores
Sabes Que es un ALGORITMO
SISTEMAS DE PRODUCCIÓN.
Parte I: Introducción a la Documentación Jurídica
Escogiendo los mejores atributos: Ganancia de Información
La EVALUAción como proceso científico
PRESENTACIÓN ORAL Y DEFENSA EFICAZ DEL TRABAJO DE FIN DE GRADO
2016 / 17 ESCALA Informe evolutivo sobre resultados en la Prueba
OBJETIVOS Definir el “índice de seguridad hospitalaria” y sus alcances. Describir los pasos para el cálculo del índice de seguridad hospitalario utilizando.
Plataforma de Gestión de Servicios Sociales
Momentos de una lección
LAS VARIABLES EN LA INVESTIGACIÓN
APROXIMACIÓN CONCEPTUAL
Transmisión de infecciones: BANCO DE SANGRE
Zona Roja Zona Verde Zona Azul
UNIVERSIDAD DE LAS FUERZAS ARMADAS-ESPE
LA DETECCIÓN Y SEGUIMIENTO DE DEPORTISTAS por Manuel Laguna
ESTADISTICA.
SOFWARE EDUCATIVO JOHN WILMER LOPEZ V.
Los Reportes de Evaluación Psicológica Organizacionales
Zona Roja Zona Verde Zona Azul
Modelo DE EVALUACIÓN.
Lingüística computacional
Zona Roja Zona Verde Zona Azul
DETECTOR PREDICTIVO DE CONEXIONES FRAUDULENTAS
Observaciones Revisar observaciones en el apartado de “Notas”, debajo de esta slide. Este archivo se utilizará para elaborar la presentación sobre la.
SISTEMA ROBÓTICO MÓVIL AUTÓNOMO COOPERATIVO PARA MAPEO 2D DE OBSTÁCULOS Y NIVELES DE TEMPERATURA EN UN AMBIENTE CONTROLADO Autor: Illanes Tibanlombo,
Clasificación no-supervisada
Lic Msc Mirian Vega EVALUACIÓN.
Área Temática Profesor (a) Campus
LOS PERIFERICOS.
2da.
ACTIVIDAD RESULTADOS ISCE 2018
Transcripción de la presentación:

Inteligencia Artificial Trabajo Final de Grado Inteligencia Artificial Reducción de la dimensionalidad mediante métodos de selección de características en microarrays de ADN Grado de Ingeniería Informática Maseda Tarin, Miguel 10/01/2019

INDICE 1 INTRODUCCIÓN 2 SELECCIÓN DE CARACTERÍSTICAS 3 MÉTODOS DE SELECCIÓN DE CARACTERÍSTICAS 4 CONJUNTO DE DATOS 5 MÉTODOS DE VALIDACIÓN 6 MÉTRICAS 7 f-score 8 mRMR 9 Sequential Forward Selection 10 Método híbrido 11 Conclusiones

1. INTRODUCCIÓN Los datos por si solos no ofrecen toda la información que en ellos se encuentran Uso de técnicas de DM y ML para obtener un valor añadido a nuestros datos Hay que tratar previamente los datos para poder hacer uso de las técnicas Métodos de tratamiento previo de los datos: Imputación de valores ausentes Filtrado de ruido Reducción de la dimensionalidad Reducción de instancias Discretización Aprendizaje no balanceado

1. INTRODUCCIÓN Métodos de clasificación supervisada Sabemos a qué clase pertenece cada muestra ¿a qué clase pertenecerá una nueva muestra? Maldición de la dimensionalidad Abordaremos la reducción de la dimensionalidad en los conjuntos de datos

2. SELECCIÓN DE CARACTERÍSTICAS Dimensionalidad del conjunto de datos: Número de muestras: 𝑋={𝑥1,𝑥2,…,𝑥𝑛} Número de características: 𝑥𝑖={𝑥𝑖1,𝑥𝑖2,…,𝑥𝑖𝑚} Problema de dimensionalidad: m > n Problema de dimensionalidad grave: m >> n Métodos de reducción de la dimensionalidad: Selección de características Extracción de características

2. SELECCIÓN DE CARACTERÍSTICAS Extracción de características: Transformación del conjunto original Las características originales no son necesarias para la interpretación del modelo Interpretabilidad < Exactitud Selección de características: Seleccionan las características relevantes Las características originales son necesarias para la interpretación del modelo Interpretabilidad = Exactitud

2. SELECCIÓN DE CARACTERÍSTICAS Tipos de características (descripción de Kohavi): Fuertes Débiles Irrelevantes Hay que tener en cuenta las características redundantes Relevantes Débiles pero no redundantes Débiles redundantes

2. SELECCIÓN DE CARACTERÍSTICAS Beneficios de la selección de características: Modelos más precisos y rápidos Reducción del espacio de almacenamiento y búsqueda Mayor comprensión sobre el conjunto de datos Modelos más simples, mejorando su visualización Pueden reducir los costes a la hora de recopilar nueva información

3. MÉTODOS DE SELECCIÓN DE CARACTERÍSTICAS Filtro La selección es independiente al algoritmo utilizado Coste computacional bajo Gran capacidad de generalización Univariantes y multivariantes Wrapper Utilizan un algoritmo ML que mide la eficacia de las características Gran coste computacional Se usan cuando el coste computacional no es un problema Empotrados La selección de características se realiza en el propio algoritmo de ML Menor coste computacional que los métodos wrapper Híbridos Combinación de métodos de filtro y wrapper Buscan obtener las ventajas de estos métodos

4. CONJUNTO DE DATOS Microarray de ADN: LEUCEMIA Contiene un total de 72 muestras Cada muestra tiene 7.129 características (genes) Se divide en dos clases: Leucemia mieloide aguda, AML (25 muestras) Leucemia linfoblástica aguda, ALL (47 muestras)

5. METODOS DE VALIDACION Aplicación de los métodos de selección de características Stratified k-fold (5 hojas): Conjunto de entrenamiento Conjunto de test k-fold (10 hojas) al conjunto de entrenamiento: Conjunto de validación Algoritmos de aprendizaje: k Neighbours Classifier Decision Tree Classifier Support Vector Classifier

6. METRICAS Exactitud (accuracy) Precisión (precision) Exhaustividad (recall) TP = true positive TN = true negative FP = false positive FN = false negative

7. f-score Ventajas: Inconvenientes: Tiempo de ejecución casi nulo Función f_score de la biblioteca scikit-Feature Valoración individual de las características Ordena de mejor a peor Ventajas: Tiempo de ejecución casi nulo Muy buenos resultados Inconvenientes: No elimina redundancia

8. mRMR Ventajas: Inconvenientes: Función mRMR de la biblioteca scikit-Feature Método multivariante Ordena según relevancia Ventajas: Descarta características redundantes Inconvenientes: Tiempos de ejecución elevados No tiene tan buenos resultados como f-score

9. Sequential Foward Selection Función SFS de la biblioteca mlxtend Algoritmo utilizado para la evaluación: SVC Añade características una a una Ventajas: Niveles de clasificación aceptables Inconvenientes: Tiempos de ejecución muy elevados No tiene tan buenos resultados como f-score

10. MÉTODO HÍBRIDO Combinación de los métodos: Ventajas: Buenos niveles de clasificación Menor tiempo de ejecución que el método wrapper Inconvenientes: Tiempos de ejecución no tan rápidos como los de filtro No supera los resultados de f-score Combinación de los métodos: f-score mRMR SFS_b SFS_f

11. CONCLUSIONES Los conjuntos de datos microarray de ADN proponen un desafío para los algoritmos de aprendizaje La reducción de la dimensionalidad es un paso previo para obtener los mejores resultados Los mejores resultados se obtienen con el método f-score Nuestro método híbrido solo supera al método f-score con el algoritmo DTC Método Atributos Algoritmo Accuracy Filtro: f-score 45 KNN 98,57% Híbrido 35 DTC 93,04% 305 SVC