SISTEMA DE SELECCIÓ D’ATRIBUTS BASAT EN ALGORISMES GENÈTICS

Slides:



Advertisements
Presentaciones similares
Interpretació estadística dels indicadors de centre
Advertisements

TFG – Àrea Enginyeria del programari
AUTOGESTIÓ I INNOVACIÓ EN L’AULA OBERTA
Sistema de gestió APPCC
MOBILITAT D’ESTUDIANTS ERASMUS
Mètodes d’entrenament de la força
d' a s s i s t è n c i a al g o v e r n l o c a l
Què és la tecnologia?.
MESURA DEL RADI DE LA TERRA (seguint Eratóstenes)
ORIENTACIÓ I COORDENADES GEOGRÀFIQUES
Introducció i guia ràpida de l’aprovació de la despesa
Equacions amb dues incògnites.
Xarxa Productes de la terra
i el que no es pot avaluar
“ESCOLTA’M” La vinculació del tutor/a com a factor protector i alhora creador de resiliència en els infants de risc d’exclusió social.
Variables qualitatives
AVALUAR-QUALIFICAR PER COMPETÈNCIES
Fronts de reacció-dispersió per poblacions Neolítiques
Programa Pacient Expert ICS en MPOC
Implantació del protocol Inserqual en la fase d’acollida
CUIDATGE.
SELECTIVITAT 2013.
APRENENTATGE MULTINIVELL
uoc-domo CONTROL DOMÒTIC AMB ARDUINO UOC-DOMO
ESTADÍSTIQUES I WEBQUEAST
Models de Qualitat 17 d’Octubre de 2017.
Disseny i implementació d’una base de dades relacional
Introducció a l’Experimentació
COMENTARI DE GRÀFICS.
El nou pla docent de la UB: Adequació al sistema ECTS
Avaluació de preparació Agile <nom de la solució>
(Robert S. Baron & Norbert L.Kerr )
Fet per Adriana, Helena i Marta (6B)
Víctor Ruiz Marquès Enginyeria en Informàtica   Juan Martínez Bolaños
DINÀMICA GENERAL DE LA POBLACIÓ
Journal citation report
DISSENY GRÀFIC D’UN PORTAL DE TRANSPARÈNCIA PER AJUNTAMENTS
d'ensenyança-aprenentatge
Servei d’Assistència en RRHH Aspectes pràctics de la implementació en nòmina del R.D. Llei 8/2010 DOCUMENT INTERN DE TREBALL 3 juny 2010.
Reconstrucció filogenètica
INDEX 1.- Introducció 2.- Abast i objectius del projecte
DINÀMICA DELS FACTORS BIOLÒGICS: Grans grups d’edat
Inteligencia Artificial Adquisición automática del conocimiento
LES XARXES LOCALS i els seus components.
Dibuix Tècnic Sistemes de representació.
Proves de competències bàsiques als 14 anys
Llorenç Seguí capllonch 11 de juny de 2018
Resum Informe d’Enquesta d’Opinió de l’Empleat
Daniel Miró Pettican TFG Primer semestre/
Agent Tutor Eloi Puertas Prats 13/04/2019 Agent Tutor.
La imatge corporativa Una eina fonamental en l’actualitat
Introducció Al posicionament Web.
CFA Sebastià Juan Arbó Curs
Projecte Fi de Carrera - J2EE Alumne: Daniel Clemente Marcè
LA NOVA SELECTIVITAT I L’ACCÉS A LA UNIVERSITAT
Estudiant: Eva Muñoz Altimis
Sistema de descàrrega d’aplicacions per a mòbils intel·ligents
Propostes de millora en el GIR
MESURA DEL RADI DE LA TERRA (seguint Eratóstenes)
Curs de Llenguatge Administratiu Valencià Juli Martínez Amorós
més enllà del PIB: de la mesura a la política i les polítiques
Anàlisi d’un lloc web implementant actualització del contingut
Promoció de la salut i programació sanitària
DA46: PROCÉS D’ADAPTACIÓ FINAL 01/01/2013 Subdirecció Màrqueting MUTUALISTES EN OPCIÓ ALTERNATIVA AL RETA.
Introducció a l’anàlisi d’agrupaments (cluster)
Gestió del coneixement
Anàlisi de la qualitat de vida de les persones majors a Mallorca
La intervenció dels especialistes d’Educació Especial al centre
FASES DE PROJECTE TECNOLÒGIC
de materials i instruments
Transcripción de la presentación:

SISTEMA DE SELECCIÓ D’ATRIBUTS BASAT EN ALGORISMES GENÈTICS Rubén Nicolàs i Sans

Índex Motivació Introducció als algorismes genètics Sistema de selecció d’atributs basat en algorismes genètics Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny de l’aplicació Resultats Conclusions i línies de futur Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

1. Motivació Punt de partida Introducció al projecte Sistema de selecció d’atributs basat en algorismes genètics Punt de partida Introducció al projecte Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Punt de partida Sistema de selecció d’atributs basat en algorismes genètics Necessitem extreure coneixement sobre conjunts de dades Grans volums de dades Dades incompletes i sorolloses Com s’extreu normalment la informació? A través de les fases de la mineria de dades: Preprocés de les dades: Neteja, selecció... Extracció del coneixement Interpretació dels resultats En quina fase treballarem? Selecció de les dades Tenir menys atributs Tenir atributs menys sorollosos Tenir atributs més representatius Evitar la necessitat d’un expert humà en aquest procés Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Introducció al projecte Sistema de selecció d’atributs basat en algorismes genètics Alguns processos de selecció d’atributs utilitzen algorismes de cerca exhaustiva Cerquen una solució òptima Té un elevat cost computacional Altres utilitzen algorismes Greedy Poden caure en un mínim local La solució amb algorismes genètics permetria Trobar una bona solució en un temps computacional raonable Cercar solucions en paral·lel (evitant mínims locals) Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

2. Introducció als algorismes genètics Sistema de selecció d’atributs basat en algorismes genètics Trets característics Què són els algorismes genètics? Vocabulari Representació Fases Inicialització Avaluació Selecció Creuament Mutació Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Trets característics (I) Sistema de selecció d’atributs basat en algorismes genètics Què són els algorismes genètics? Són algorismes de cerca Es basen en la selecció natural Cada generació crea un nou conjunt d’individus a partir de parts dels individus més adaptats de la generació anterior En alguns casos es prova una nova part per millorar els resultats Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Trets característics (II) Sistema de selecció d’atributs basat en algorismes genètics Vocabulari Individu Solució completa del problema a resoldre Població Conjunt d’individus amb el qual treballa l’algorisme genètic Fitness Qualitat d’una solució del problema Gen Unitat mínima d’informació d’un individu Representació 1 Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Fases d’un algorisme genètic (I) Sistema de selecció d’atributs basat en algorismes genètics INICIALITZACIÓ POBLACIÓ 1 AVALUACIÓ POBLACIÓ 2 inicialitza població avalua població mentre ! condició finalització fer aplica selecció aplica creuament aplica mutació fimentre MUTACIÓ SELECCIÓ POBLACIÓ 4 CREUAMENT POBLACIÓ 3 Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Fases d’un algorisme genètic (II) Sistema de selecció d’atributs basat en algorismes genètics Inicialització Els algorismes genètics es basen en l’evolució d’una població d’individus Cal una població inicial per poder evolucionar La població es pot crear de diferents maneres Valors prefixats Fer n poblacions aleatòries i triar el millor individu de cadascuna Crear-la aleatòriament Avaluació Fase que determina la qualitat dels individus (fitness) Es determina a partir de passar els individus a la funció d’avaluació És clau per trobar una bona solució Té el cost computacional més alt Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Fases d’un algorisme genètic (III) Sistema de selecció d’atributs basat en algorismes genètics Selecció Està inspirada en la selecció natural de Darwin Aquesta funció copia a la nova població els individus de la població inicial segons la seva funció objectiu Els individus amb un millor fitness haurien de tenir més probabilitat de contribuir a la següent generació Alguns mètodes de selecció són: Tournament Selection Roulette Wheel Selection 1 2 3 4 5 6 Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Fases d’un algorisme genètic (IV) Sistema de selecció d’atributs basat en algorismes genètics Creuament Es produeix en dues fases Triar un cert nombre d’individus de la població a partir d’una probabilitat determinada Creuar els individus seleccionats anteriorment El creuament dels individus pot fer-se de diferents maneres Entre elles destaquen: One-point crossover Two-point crossover Uniform crossover Mutació És el canvi aleatori del valor d’un atribut d’un individu Evita la pèrdua prematura de material genètic útil com a efecte de la combinació massa tancada de coneixement existent Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

3. Introducció a la selecció d’atributs Sistema de selecció d’atributs basat en algorismes genètics Trets característics Vocabulari Què és la selecció d’atributs? Tipus de selecció Mètodes Filter Mètodes Wrapper Comparativa entre tipus de selecció Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Trets característics (I) Sistema de selecció d’atributs basat en algorismes genètics Vocabulari Conjunt de dades Entrada dels processos de mineria de dades Instància Cadascun dels exemples (files) d’un conjunt de dades Atribut Cadascun dels valors o característiques d’una instància Classe Atribut que permet classificar les instàncies Classificació Procés per assignar una instància a una classe determinada S.C Model Conjunt de dades Nou exemple Classe Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Trets característics (II) Sistema de selecció d’atributs basat en algorismes genètics Què és la selecció d’atributs? És part del preprocés de les dades Intenta automatitzar la cerca dels atributs més representatius de la base de dades de casos Pot disminuir els problemes de soroll Pretén evitar atributs innecessaris que alenteixen la cerca i/o la fan menys precisa Selecció d’atributs Sistema classificador N atrib. n atrib. On n: [0..N] BD Casos Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Tipus de selecció (I) Mètodes Wrapper Són mètodes amb feedback Sistema de selecció d’atributs basat en algorismes genètics Mètodes Wrapper Són mètodes amb feedback Incorporen un algorisme d’aprenentatge automàtic al procés de selecció d’atributs Valoren els possibles conjunts d’atributs aplicant el sistema classificador amb els atributs seleccionats Es repeteix el procés fins aconseguir la valoració del nombre d’encerts desitjada Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Tipus de selecció (II) Funcionament dels mètodes wrapper Sistema de selecció d’atributs basat en algorismes genètics Funcionament dels mètodes wrapper SELECCIÓ D’ATRIBUTS Atributs Sistema Classificador Modificació de la BD Casos segons atrib. seleccionats BD Casos BD Casos’ Cerca Percentatge d’encerts Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Tipus de selecció (III) Sistema de selecció d’atributs basat en algorismes genètics Detall del sistema classificador SISTEMA CLASSIFICADOR Train BD’ train’ BD’ train Validació Percentatge d’encerts BD’ validació Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Tipus de selecció (IV) Alguns mètodes wrapper Sistema de selecció d’atributs basat en algorismes genètics Alguns mètodes wrapper Autor [Sistema] Selecció inicial Control de la cerca Criteri de finalització Algorisme de classificació Aha i Bankern [Beam] Aleatòria Comparació No millora Veí més proper Caruana i Freitag [Cap] Greedy Tots utilitzats Arbre de decisió Doak Millora insuficient Arbre de decisió/Bayes John, Kohavi i Pfleger Langley i Sage [Oblivion] Tots Empitjora Langley i Sage [Sel. Bayer] Cap Bayes Moore i Lee [Race] Singh i Provan [K2-AS] Skalak Mutació Prou iteracions Townsend-Weber i Kibler Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Tipus de selecció (V) OBLIVION (Exemple de mètode Wrapper) Sistema de selecció d’atributs basat en algorismes genètics OBLIVION (Exemple de mètode Wrapper) Segueix el següent procés: Selecciona tots els atributs Mentre la estimació d’encerts no disminueixi Busca l’atribut que menys aporti a la bona classificació i eliminar-lo Utilitza per a la cerca l’algorisme de Greedy Classifica a través del veí més proper Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Tipus de selecció (VI) Mètodes Filter Són mètodes sense feedback Sistema de selecció d’atributs basat en algorismes genètics Mètodes Filter Són mètodes sense feedback Són independents de l’algorisme d’aprenentatge posterior Fan una anàlisi estadística de les dades Fan una predicció de quins són els atributs rellevants Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Tipus de selecció (VII) Sistema de selecció d’atributs basat en algorismes genètics Alguns mètodes Filter (*) Algorisme de classificació de la fase de classificació posterior a la selecció Autor [Sistema] Selecció inicial Control de la cerca Criteri de finalització Algorisme de classificació (*) Almualim [Focus] Cap Breadth-first Consistència Arbre de decisió Koller i Sahami Tots Greedy Llindar Arbre de decisió/Bayes Kira i Rendell [Relief] - Ordenació Kubat Bayes Schlimmer Sistemàtica Singh i Provan Absència de guany Xarxa Bayesiana Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Tipus de selecció (VIII) Sistema de selecció d’atributs basat en algorismes genètics RELIEF (Exemple de mètode Filter) Segueix el següent procés: Avalua individualment cada atribut segons la seva correlació amb la funció objectiu Tria els k atributs amb millor avaluació La tria del valor de k es realitza a partir de proves amb el conjunt de sortida Utilitza ID3 per crear un arbre de decisió a partir dels atributs seleccionats Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Comparativa entre tipus de selecció Sistema de selecció d’atributs basat en algorismes genètics Els mètodes wrapper solen donar millors resultats que els mètodes filter Els mètodes wrapper s’adapten millor a l’algorisme d’aprenentatge posterior que els mètodes filter El cost computacional dels mètodes wrapper és més alt que el dels mètodes filter Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Algorismes genètics en selecció d’atributs Sistema de selecció d’atributs basat en algorismes genètics Disseny de l’algorisme Esquema general Representació Fitness Fases Elitisme Sistema classificador Model de dades Conversió de tipus Tractament d’atributs desconeguts Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Disseny de l’algorisme (I) Sistema de selecció d’atributs basat en algorismes genètics Esquema general SELECCIÓ D’ATRIBUTS Atributs Modificació de la BD Casos segons atrib. seleccionats 3NN (veí més proper) BD Casos BD Casos’ Algorisme Genètic Percentatge d’encerts Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Disseny de l’algorisme (II) Sistema de selecció d’atributs basat en algorismes genètics Representació Cada individu es forma amb gens binaris Cada gen representa un atribut 1 significa atribut seleccionat i 0 no seleccionat Fitness És el nombre d’encerts del veí més proper Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Disseny de l’algorisme (III) Fases Sistema de selecció d’atributs basat en algorismes genètics Inicialització Totalment aleatòria Selecció S’aplica Roulette Wheel Selection Creuament Triar els individus que es creuen Es seleccionen aleatòriament amb Probabilitat de Creuament 0,6 Es creuen en grups consecutius de dos individus aplicant One-point crossover Considerant punt de tall 3 X 0 1 0 0 1 1 0 0 0 0 1 1 1 1 1 1 0 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 0 0 0 1 1 1 1 1 1 0 0 0 1 1 0 1 0 1 Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Disseny de l’algorisme (IV) Fases Sistema de selecció d’atributs basat en algorismes genètics Mutació Per a cada individu es tria aleatòriament si pateix o no mutació, amb probabilitat (0,001*num. atributs) Si cal mutar es tria el bit que pateix mutació de manera aleatòria Així estalviem càlculs respecte a l’anàlisi de mutació bit a bit Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Disseny de l’algorisme (V) Sistema de selecció d’atributs basat en algorismes genètics Elitisme S’estableix per evitar la pèrdua de bones solucions Segueix el procés Buscar i guardar el millor individu de la població Fer una iteració completa de l’algorisme genètic Si l’individu ha desaparegut de la població, tornar-lo a introduir en el lloc del pitjor individu Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Sistema classificador Sistema de selecció d’atributs basat en algorismes genètics Utilitzem com a funció de fitness el percentatge d’encerts de classificació del veí més proper (3-NN) BD’ train Classificació 3-NN Percentatge d’encerts BD’ train’ BD’ validació Validació BD BD’ test 90% (9 fold) 10% (1 fold) 60% 40% Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Model de dades Conversió de tipus Tractament d’atributs desconeguts Sistema de selecció d’atributs basat en algorismes genètics Conversió de tipus Utilitzem sempre una representació de tipus real Atributs numèrics No tenen conversió Atributs booleans 1 si és cert i 0 si és fals Tipus nominals A cada categoria se li assigna un número real Tractament d’atributs desconeguts Se’ls assigna un identificador que els inhibeix en el càlcul de la distància entre individus de l’algorisme del veí més proper Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

5. Disseny de l’aplicació Sistema de selecció d’atributs basat en algorismes genètics Diagrama de classes Diagrama de seqüència Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Diagrama de classes Sistema de selecció d’atributs basat en algorismes genètics GeneticAlg KNN_Aval LlegirFitxer MemCasos Cas Nominals Calaix Main Calaix Nominals LlegirFitxer GeneticAlg MemCasos Main KNN_Aval Cas Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Diagrama de seqüència (I) Sistema de selecció d’atributs basat en algorismes genètics Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Diagrama de seqüència (II) Sistema de selecció d’atributs basat en algorismes genètics Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Diagrama de seqüència (III) Sistema de selecció d’atributs basat en algorismes genètics Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Diagrama de seqüència (IV) Sistema de selecció d’atributs basat en algorismes genètics Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Diagrama de seqüència (V) Sistema de selecció d’atributs basat en algorismes genètics Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

6. Resultats Tria del nombre d’iteracions Metodologia de les proves Sistema de selecció d’atributs basat en algorismes genètics Tria del nombre d’iteracions Metodologia de les proves 10-fold Stratified Cross Validation Tractament de l’aleatorietat Mitjana Desviació estàndard Resultats pràctics Taula de resultats Comparativa amb Relief i B+b Conclusions respecte als resultats Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Tria del nombre d’iteracions Sistema de selecció d’atributs basat en algorismes genètics El nombre d’iteracions triat és de 1500 Guany en nombre d’encerts Disminució del nombre d’atributs Dades en tant per cent Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Metodologia de les proves (I) Sistema de selecció d’atributs basat en algorismes genètics 10-fold Stratified Cross Validation Es divideix el conjunt d’entrenament en deu subconjunts (folds) Es fan totes les proves deu cops utilitzant com a conjunt de test un fold diferent cada cop i com a conjunt d’entrenament els nou restants Els resultats finals són la mitjana d’aquestes deu proves Aquest mètode s’ha aplicat a totes les proves realitzades i sobre els mateixos folds per tal de comparar-los adientment Tractament de l’aleatorietat Totes les proves on intervenen factors aleatoris es repeteixen quatre cops amb llavors d’aleatorietat diferents i es fa la mitjana dels resultats Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Metodologia de les proves (II) Sistema de selecció d’atributs basat en algorismes genètics Mitjana És la mesura utilitzada per donar el valor mitjà d’encerts del sistema S’aplica sobre els resultats dels deu folds provats Desviació estàndard Indica la distància per excés o defecte en que és probable errar respecte al valor promig Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Resultats pràctics (I) Taula de resultats Sistema de selecció d’atributs basat en algorismes genètics Sense Selecció Alg. Genètics B+b Relief N.Atrib. % encerts N. Atrib. N.Atrib AUD 69 64,78±9,42 35,55±2,5 74,42±6,52 21,20±1,32 54,73±10,65 8,90±2,02 29,25±9,34 AUS 14 67,52±4,67 5,03±0,65 83,14±3,99 2,90±0,32 58,48±8,32 2,70±0,67 70,89±6,58 BAL 4 80,78±4,73 3 69,10±2,96 1,90±0,32 58±8,37 BPA 6 63,54±7,62 5,53±0,9 63,31±7,46 62,13±11,28 1 54,99±13,08 GLS 9 68,26±8,13 5,1±1,15 60,65±12,64 2 49,21±6,05 6,10±0,32 68,60±10,50 H-C 13 63,13±7,96 5,95±0,71 79,54±5,12 3,90±0,74 64,65±9,42 * HEP 19 68,65±10,46 8,60±0,94 77,47±6,38 69,69±18,04 ION 34 85,51±5,40 13,68±1,81 86,49±2,83 4,50±0,53 86,08±5,66 IRS 96±3,44 2,90±0,61 94,33±3,78 92,67±3,78 89,33±10,98 LAB 16 81,38±11,80 8,78±0,94 76,92±12 4,00±1,63 66,86±11,34 5,40±2,07 78,81±13,44 LYM 18 77,01±8,08 9,05±1,03 77,97±6,92 6,50±0,71 70,67±12,61 6,40±1,65 78,70±14,22 MMG 21 65,80±6,31 9,18±1,49 64,03±6,33 - PRT 17 42,30±7,89 10,90±1,04 38,41±4,83 2,60±1,96 18,35±11,30 SON 60 82,65±7,49 28,33±1,79 88,58±2,69 1,70±0,48 54,52±8,26 SOYB 35 59,13±3,19 17,85±2 81,30±4,6 12,80±1,14 56,97±17,24 10,40±3,31 34,23±11,30 VEH 66,28±3,76 9,10±0,69 70,05±4,22 46,34±4,88 9,70±1,77 61,09±5,10 VOTE 100 8,90±1,13 8,40±3,06 1,70±0,82 VOW 97,47±2,39 9,58±0,61 96,52±1,62 1,00 16,67±1,86 WNE 74,76±11,18 5,95±0,55 94,53±4,56 62,90±8,91 10,20±0,42 88,11±11,14 ZOO 55,37±14,73 8,35±1,20 89,10±91,30 5,6±0,52 91,43±7,89 4,50±1,08 48,47±13,99 Promig 20,85 73,02 10,62 78,88 5,21 65,80 4,95 66,22 Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Resultats pràctics (II) Comparativa Sistema de selecció d’atributs basat en algorismes genètics Sense Selecció Alg.Genètics B+b Relief AUD 64,78 74,42 54,73 29,25 AUS 67,52 83,14 58,48 70,89 BAL 80,78 69,1 58 BPA 63,54 63,31 62,13 54,99 GLS 68,26 60,65 49,21 68,6 H-C 63,13 79,54 64,65 - HEP 68,65 77,47 69,69 ION 85,51 86,49 86,08 IRS 96 94,33 92,67 89,33 LAB 81,38 76,92 66,86 78,81 LYM 77,01 77,97 70,67 78,7 MMG 65,8 64,03 PRT 42,3 38,41 18,35 SON 82,65 88,58 54,52 SOYB 59,13 81,3 56,97 34,23 VEH 66,28 70,05 46,34 61,09 VOTE 100 VOW 97,47 96,52 16,67 WNE 74,76 94,53 62,9 88,11 ZOO 55,37 89,1 91,43 48,47 Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Resultats pràctics (III) Comparativa Sistema de selecció d’atributs basat en algorismes genètics Respecte al percentatge d’encerts Respecte al nombre d’atributs Sense Selecció Alg. Genètics B+b Relief Nº Millors 8 12 2 Nº Pitjors 3 1 7 Sense Selecció Alg. Genètics B+b Relief Nº Millors 10 Nº Pitjors 20 1 Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Resultats pràctics (IV) Comparativa Sistema de selecció d’atributs basat en algorismes genètics Rànquing promig respecte a la mitjana dels percentatges d’encerts Recompte de dominàncies respecte a la no selecció Sense Selecció Alg. Genètics B+b Relief 1,95 1,55 2,88 2,73 Domina És equivalent És dominat Algorismes Genètics 11 9 Relief 4 12 B+B Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Resultats pràctics (V) Comparativa Sistema de selecció d’atributs basat en algorismes genètics Gràfic de dispersió de resultats respecte al nombre d’atributs i el percentatge d’errors Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Resultats pràctics (V) Comparativa Sistema de selecció d’atributs basat en algorismes genètics Gràfic de dispersió de resultats respecte al nombre d’atributs i el percentatge d’errors Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Resultats pràctics (V) Comparativa Sistema de selecció d’atributs basat en algorismes genètics Gràfic de dispersió de resultats respecte al nombre d’atributs i el percentatge d’errors Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Resultats pràctics (V) Comparativa Sistema de selecció d’atributs basat en algorismes genètics Gràfic de dispersió de resultats respecte al nombre d’atributs i el percentatge d’errors Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Resultats pràctics (VI) Comparativa Sistema de selecció d’atributs basat en algorismes genètics Aplicant t-Student amb interval de confiança del 95% Recompte dels casos en que és significativament millor, pitjor o igual cada mètode respecte a la no selecció Significativament millor Significativament pitjor Equivalent Alg. Genètic 8 11 Relief 1 6 7 B+b Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Resultats pràctics (VII) Comparativa Sistema de selecció d’atributs basat en algorismes genètics Aplicant t-Student amb interval de confiança del 95% Recompte dels casos en que és significativament millor, pitjor o igual cada mètode respecte a l’algorisme genètic Significativament millor Significativament pitjor Equivalent Relief 8 6 B+b 9 7 Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

7. Conclusions i línies de futur Sistema de selecció d’atributs basat en algorismes genètics Conclusions respecte als resultats Cost del projecte Línies de futur Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Conclusions respecte als resultats Sistema de selecció d’atributs basat en algorismes genètics La implementació basada en algorismes genètics té un major compromís entre el nombre d’encerts i el d’atributs L’excés en la reducció del nombre d’atributs de Relief o B+b fa baixar excessivament el nombre d’encerts En la majoria dels casos l’algorisme genètic permet reduir el nombre d’atributs i al mateix temps millorar el percentatge d’encerts (o no empitjorar-lo significativament) La reducció del nombre d’atributs permet baixar el cost del classificador i fer més interpretables les solucions Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Cost del projecte El cost total del projecte ha estat de 920 hores Sistema de selecció d’atributs basat en algorismes genètics El cost total del projecte ha estat de 920 hores Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur

Línies de futur Multiobjectiu Assignació de pesos als atributs Sistema de selecció d’atributs basat en algorismes genètics Multiobjectiu Donar importància al decrement del nombre d’atributs i a l’augment del percentatge d’encerts al mateix temps Assignació de pesos als atributs Donar el grau d’importància de cada atribut en lloc de la seva selecció o no selecció Motivació Introducció als algorismes genètics Introducció a la selecció d’atributs Algorismes genètics en selecció d’atributs Disseny Resultats Concl. i Línies de futur