La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Aprendizaje Automatizado Caso de Estudio. Problema a resolver (I)

Presentaciones similares


Presentación del tema: "Aprendizaje Automatizado Caso de Estudio. Problema a resolver (I)"— Transcripción de la presentación:

1 Aprendizaje Automatizado Caso de Estudio

2 Problema a resolver (I)

3 Problema a resolver (II) El problema consiste en clasificar como 'rojo' o 'azul' nuevos puntos pertenecientes a C(0, 1). Este problema se puede resolver mediante la utilizaci ó n de f ó rmulas matem á ticas. A partir de un conjunto de puntos ya clasificados, se generar á un modelo para clasificar un nuevo conjunto.

4 Selecci ó n del clasificador Recordamos los criterios: – Capacidad de representaci ó n – Legibilidad – Tiempo de c ó mputo on-line. – Tiempo de c ó mputo off-line. – Ajuste de par á metros. – Robustez ante el ruido. – Sobreajuste. – Minimizaci ó n del error.

5 Ajuste de par á metros Obtenemos á rboles de decisi ó n tomando conjuntos de entrenamiento de tama ñ os 300, 600 y 900 datos. Obtenemos redes neuronales tomando 600, 900, 1200 y 1500 datos y variando la cantidad de neuronas en la capa intermedia en 2, 6 y 10.

6 Conjuntos de datos Contamos con el archivo 'espirales.mat', que contiene 1500 puntos ya clasificados. Cargamos al Workspace de Matlab: >> load('espirales')

7 Á rboles de Decisi ó n >> X1 = espirales(1:2, 1:300)'; >> y1 = espirales(3, 1:300)'; >> t1 = classregtree( X1, y1, 'method','classification' ); t1 es un árbol de decisión que clasifica puntos en las espirales rojas o azules ¿Con qué error? >> X1test = espirales(1:2, 301:550)'; >> y1result = eval(t1, X1test); >> gscatter(X1test(:,1), X1test(:,2), y1result, 'rb', 'oo')

8 Á rboles de Decisi ó n

9 Á rboles de decisi ó n Nos interesa la proporci ó n de los clasificados correctamente: archivo.m y1correctos = espirales(3, 301:550)'; y1resultDouble = double(cell2mat(y1result)) - 48; N = length(y1result); propCorrectos = 0; for i = 1:N if (y1correctos(i) == y1resultDouble(i)) propCorrectos = propCorrectos + 1; end; propCorrectos = propCorrectos / N; propCorrectos = 0.86

10 Á rboles de Decisi ó n La funci ó n test computa el costo del á rbol que es 1 - propCorrectos. ¿ Se puede mejorar esa proporci ó n de clasificados correctamente? – El conjunto de entrenamiento fue elegido arbitrariamente. De forma an á loga estudiamos los dem á s conjuntos de datos de tama ñ os 600 y 900. Se vuelcan todas las operaciones a un script.

11 Á rboles de Decisi ó n Resultados: costo de los distintos á rboles generados. mínimo

12 Redes Neuronales X = espirales(1:2, 1:600); target = targetEspirales(:, 1:600); Xtest = espirales(1:2, 601:850); % 600 datos y 2 neuronas en la capa intermedia net = newpr(X, target, 2); [net, tr] = train(net, X, target); y = sim(net, Xtest); error = min(tr.vperf);

13 Redes Neuronales Resultados mínimo

14 An á lisis Ambos modelos se comportaron de forma similar ante: – La capacidad de representaci ó n. – El tiempo de c ó mputo on-line. Los á rboles obtenidos soportan cierta legibilidad. El tiempo de c ó mputo off-line fue mucho menor en los á rboles de decisi ó n. Con redes neuronales hay m á s opciones para el ajuste de par á metros. El menor error se logr ó con las redes neuronales.


Descargar ppt "Aprendizaje Automatizado Caso de Estudio. Problema a resolver (I)"

Presentaciones similares


Anuncios Google