La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Red de Minería y Aprendizaje Grupo de Aprendizaje Automático Universidad de Oviedo en Gijón www.aic.uniovi.es/MLGroup Selección de Atributos en Aprendizaje.

Presentaciones similares


Presentación del tema: "Red de Minería y Aprendizaje Grupo de Aprendizaje Automático Universidad de Oviedo en Gijón www.aic.uniovi.es/MLGroup Selección de Atributos en Aprendizaje."— Transcripción de la presentación:

1 Red de Minería y Aprendizaje Grupo de Aprendizaje Automático Universidad de Oviedo en Gijón www.aic.uniovi.es/MLGroup Selección de Atributos en Aprendizaje de Preferencias (usando SVM)

2 Red de Minería y Aprendizaje Índice de la presentación Aprendizaje de Preferencias Máquinas de Vectores Soporte SVM para Aprendizaje de Preferencias Selección de Atributos Resultados Experimentales Conclusiones

3 Red de Minería y Aprendizaje Aprendizaje de Preferencias Aplicaciones típicas:  Calidad de productos  Recuperación de información  Interfaces adaptativas Problemas en los que los métodos de regresión fracasan ¿Por qué fracasan?  Las calificaciones proceden de diferentes fuentes (distintas escalas)  Tienen un sentido relativo

4 Red de Minería y Aprendizaje Aprendizaje de Preferencias

5 Red de Minería y Aprendizaje Aprendizaje de Preferencias No intenta predecir las etiquetas numéricas Datos: conjuntos de relaciones de preferencia { (v i, u i ) : i=1..l } donde v i es considerado mejor que u i (v i > u i ) Reflejan el sentido relativo de las calificaciones Soluciones:  Clasificadores: no transitivos  Funciones de Preferencia

6 Red de Minería y Aprendizaje Funciones de Preferencia f:  d   tal que f(v) > f(u) siempre que v > u Si consideramos f lineal, en ese caso f w (x) = + w,x, + w,v, > + w,u, (v-u), + (u-v), -

7 Red de Minería y Aprendizaje Máquinas de Vectores Soporte Introducidas en los 90 por Vapnik Se basan en la Minimización del Riesgo Estructural (SRM) 92: maximización del margen y uso de kernels 95: margen blando Rápido desarrollo: algoritmos más eficientes, diseño de kernels “No hay nada más práctico que una buena teoría”

8 Red de Minería y Aprendizaje Maximización del Margen

9 Red de Minería y Aprendizaje Hiperplano Óptimo

10 Red de Minería y Aprendizaje Problema Primal Maximizar el margen equivale a minimizar la norma Minimizar: Sujeto a:

11 Red de Minería y Aprendizaje Teoría de Optimización Se usa la teoría de Lagrange (o de Kuhn-Tucker) Lagrangiana: Diferenciar y sustituir

12 Red de Minería y Aprendizaje Problema Dual Maximizar: Sujeto a: ¡Podemos usar KERNELS!

13 Red de Minería y Aprendizaje Propiedades de la solución Margen Problema de Optimización cuadrática:  convexidad  no hay mínimos locales  resoluble en tiempo polinomial Dualidad: permite el uso de kernels Esparsidad: sólo son necesarios los puntos cerca del margen (vectores soporte)

14 Red de Minería y Aprendizaje Margen blando

15 Red de Minería y Aprendizaje Margen blando Minimizar: Sujeto a: Maximizar: Sujeto a:

16 Red de Minería y Aprendizaje Clasificadores no-lineales Solución 1: crear una red neuronal Problemas:  Topología  Mínimos locales  Muchos parámetros Solución 2: transformar (kernel) el espacio de entrada en un espacio de características, y aplicar un clasificador lineal. Hay que decidir:  qué espacio de características es el adecuado para el problema  el grado de sobreajuste (C)

17 Red de Minería y Aprendizaje Clasificadores no-lineales Maximizar: Sujeto a: Kernel Polinómico Kernel Gaussiano Kernel Perceptrón Multicapa

18 Red de Minería y Aprendizaje Espacio de características Input spaceFeatures space K

19 Red de Minería y Aprendizaje Kernels

20 Red de Minería y Aprendizaje SVM puede resolver problemas de… Clasificación binaria Multiclasificación Regresión Clustering y … de Aprendizaje de Preferencias

21 Red de Minería y Aprendizaje SVM para Preferencias [Herbrich] Minimizar: Sujeto a: Dual:

22 Red de Minería y Aprendizaje FSS en Aprendizaje de Preferencias Kernel Lineal Ranking de conjunto de atributos: permite construir d subconjuntos de atributos  Relieve (Kohavi, John, 97), modificación de Relief (Kira, Rendell, 92)  RFE (Recursive Feature Elimination) (Guyon et al.,02) Selección del mejor subconjunto:  Cross-Validation  ADJ (Schuurmans, 97) métrica entre modelos

23 Red de Minería y Aprendizaje RFE (Recursive Feature Elimination) Backward Feature Elimination: borra un atributo por iteración Criterio (kernel lineal): menor (w i ) 2 siendo w i el coeficiente del atributo i en el hiperplano inducido por SVM Obtiene una lista ordenada de subconjuntos de atributos

24 Red de Minería y Aprendizaje RFE (Recursive Feature Elimination) Funcion SVM-RFE(T, fs): Una lista ordenada de subconjuntos de atributos //T: Conjunto de relaciones de preferencias //fs: Conjunto de atributos |fs|=d //L: Lista ordenada de subconjuntos de atributos F d = fs; L = [ F d ]; //Inicialmente, un subconjunto con todos los atributos Para cada j desde d hasta 2 do w = SVM( T ); //Se entrena SVM r = //Criterio de selección F j-1 = F j \ f r ; //Se borra el atributo r de F j L = L + [F j-1 ]; //Se añade el subconjunto con el resto de attr. T = {x' i : x' i is x i 0 T con f r borrado}; //Borra atributo r de T FinPara Retorna L; //L: lista ordenada de subconjunto de atributos FinFuncion

25 Red de Minería y Aprendizaje ADJ (Schuurmans) Permite la selección entre múltiples hipótesis ordenadas por su complejidad Adaptable para técnicas FSS Define una métrica en el espacio de hipótesis La distancia entre dos hipótesis w Fi y w Fj es: err(w Fi (x), w Fj (x)) mide las discrepancias en un punto del espacio de ejemplos

26 Red de Minería y Aprendizaje ADJ (Schuurmans) Hipótesis seleccionada: d’ se mide las discrepancias en las predicciones sobre dos conjuntos T y U

27 Red de Minería y Aprendizaje Resultados Experimentales Problema real: Calificación de bovinos Idea: morfología del animal debe servir para evaluar la capacidad como productor de carne Sistema:  Obtención de medidas morfológicas (técnicas de Visión Artificial)  Calificación (ordenación) por grupos de expertos  Aplicación de sistemas de aprendizaje de preferencias Proceso costoso: la selección de atributos debe jugar un papel decisivo

28 Red de Minería y Aprendizaje Resultados Experimentales

29 Red de Minería y Aprendizaje Resultados Experimentales

30 Red de Minería y Aprendizaje Resultados Experimentales Relief + CVRelief +ADJRelief +QADJSVM %Acie.#Atrs%Acie.#Atrs%Acie.#Atrs%Acie. BULLS-Z-12095,439,394,4210,594,425,994,17 BULLS-Z-14195,4412,494,4213,294,678,294,68 BULLS-L-16595,6920,895,4418,395,4414,694,42 BULLS-L-19396,4525,495,6925,295,6922,194,68 COWS-Z-1209315,292,4318,392,4315,293,19 COWS-Z-14193,1916,392,820,792,812,292,81 COWS-L-16593,1942,693,5651,193,3718,293 COWS-L-19393,3723,393,562192,819,493 Media94,4720,6694,0422,393,9513,2393,74

31 Red de Minería y Aprendizaje Resultados Experimentales RFE+CVRFE+ADJRFE+QADJSVM %Acie.#Atrs%Acie.#Atrs%Acie.#Atrs%Acie. BULLS-Z-12096,466,495,9614,596,219,194,17 BULLS-Z-14196,693,996,966,896,76,494,68 BULLS-L-16596,24,595,724,195,446,694,42 BULLS-L-19396,75,795,951095,956,294,68 COWS-Z-12094,144,993,574,293,574,293,19 COWS-Z-14193,954,293,1918,793,575,492,81 COWS-L-16594,334,994,147,694,25,8693 COWS-L-19393,566,593,1810,293,186,393 Media95,255,1394,8312,0194,856,2693,74

32 Red de Minería y Aprendizaje Resultados Experimentales RFE+CVRFE+ADJRFE+QADJSVM %Acie.#Atrs%Acie.#Atrs%Acie.#Atrs.%Acie. A-10-098,151096,851296,851283,6 A-10-596,951096,951096,951081,3 A-10-1080,95794,451194,451177,15 A-10-1581,5535795090,151374,3 A-10-2079,23977,654377,654371,9 A-20-094,32294,524952183,65 A-20-595,252292,952592,952582,55 A-20-1094,42193,452293,452278,7 A-20-15786378,555678,555674,1 A-20-2074,154970,5154754671,1 A-30-091,853894,53194,53182,45 A-30-593,93186,255192,753280,8 A-30-1085,44180,159288,453277,85 A-30-1579,655375,810783,82975,45 A-30-2073,856372,858373,852271,1 A-40-092,54494,154094,154083 A-40-586,954486,954486,954481,35 A-40-10766376,37177,552678,25 A-40-15776476,957376,957375,4 A-40-2070,755271,058370,755872,65 Media85,0441,0584,4954,186,5432,377,83

33 Red de Minería y Aprendizaje Conclusiones El aprendizaje de preferencias resuelve tareas en las que la regresión fracasa Las máquinas de vectores soporte pueden aprender preferencias Se están desarrollando técnicas de selección de atributos para SVM Trabajo futuro, FSS para kernels no lineales

34 Red de Minería y Aprendizaje Grupo de Aprendizaje Automático Universidad de Oviedo en Gijón www.aic.uniovi.es/MLGroup Selección de Atributos en Aprendizaje de Preferencias (usando SVM)


Descargar ppt "Red de Minería y Aprendizaje Grupo de Aprendizaje Automático Universidad de Oviedo en Gijón www.aic.uniovi.es/MLGroup Selección de Atributos en Aprendizaje."

Presentaciones similares


Anuncios Google