La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Aplicación JAVA implementando Arboles de Decisión

Presentaciones similares


Presentación del tema: "Aplicación JAVA implementando Arboles de Decisión"— Transcripción de la presentación:

1 Aplicación JAVA implementando Arboles de Decisión
Minería de Datos y JAVA Aplicación JAVA implementando Arboles de Decisión

2 Arboles de Decisión Características
Son modelos usados en la minería de datos para examinar los datos e inducir las reglas para realizar predicciones. Es un árbol dirigido desde su nodo “raíz” hacia sus nodos “hojas”. Se forma a partir de una muestra de entidades catalogadas en estudio y representa una forma de clasificación de sus miembros en clases a partir de los valores de sus atributos.

3 Algoritmo recursivo “Divide y Vencerás”
Un árbol de decisión es un clasificador que utiliza el algoritmo recursivo “Divide y Vencerás” para catalogar una entidad dentro de una población a partir de una muestra previamente clasificada. Se encuentra dentro de las técnicas de Datamining de “aprendizaje supervisado”, ya que sin la muestra previamente clasificada no es posible utilizar la técnica.

4 Hay 2 clasificaciones de arboles de decisión:
Árboles de clasificación Árboles de regresión Usados para predecir variables discretas Usados para predecir variables continuas

5 Clasificación de los nodos:
Raíz: es el nodo del cual parten todos los demás, no hay ningún nodo que este dirigido hacia él, o sea, no tiene nodo padre. Hoja: es un nodo del cual no salen aristas dirigidas hacia ningún otro nodo (no hay sub-arboles a partir de él). No tiene nodos hijos. El resto son nodos normales, los cuales tienen un nodo padre, y al menos 1 nodo hijo.

6 Resolución del Problema
Se utiliza un árbol de clasificación. Se implementa el algoritmo ID3. Se utiliza Java como lenguaje de programación. El Árbol se crea a medida que se desea profundizar en sus nodos. Se separo al proyecto en 4 Capas Obtención de Muestra Cálculos de Entropía y Ganancia de Información Creación del Árbol Obtención de la Categoría

7 Resolución del Problema Capa: Obtención de Muestra
Se obtiene de un Excel con el siguiente formato: Se introducen en una Matriz que contendrá las categorías y las columnas de los atributos. Día Estación Viento Lluvia Categoría sábado otoño fuerte no Puntual miércoles invierno leve Muy Atrasado martes Atrasado

8 Resolución del Problema Capa: Cálculos Entropía/IG
Compuesta esencialmente por las siguientes tres funciones: Calcular la entropía de la columna categoría. Calcular la entropía de cada columna a partir de un valor dado. Calcular la ganancia de información (IG) de cada columna. El encargado de realizar estas funciones es la Matriz.

9 Resolución del Problema Capa: Creación del Árbol
Utiliza la capa de cálculos para poder generar la raíz, los nodos y las hojas del árbol. En primer lugar obtiene la raíz (la columna de mayor IG) Luego a partir de las siguientes funciones genera los nodos y las hojas: Obtener Resultados (genera los nodos y las hojas) Obtener Resultado a partir de un valor (genera un nodo o una hoja, es utilizada por la función anterior) El encargado de realizar estas funciones es la Matriz. En la misma iteración solo se crean los nodos y las hojas de un mismo nivel del árbol.

10 Resolución del Problema Capas: Obtención de la Categoría
A partir de un Excel con el siguiente formato se pretende categorizar una cierta cantidad de sucesos: Se realiza la creación del primer nivel del árbol, el cual incluye los nodos u hojas que dependen de la columna de mayor IG. Luego a partir del valor que se quiere categorizar y se encuentra en la columna de mayor IG, se busca entre las hojas y los nodos del nivel creado su categoria: Si es un Nodo: se crea el siguiente nivel del árbol y se itera este paso hasta llegar a una hoja. Si es una hoja: esta contiene la categoría correcta y es la que se devuelve. Día Estación Viento Lluvia Categoría sábado otoño fuerte no  ¿?

11 Resolución del Problema Capas: Obtención de la Categoría (cont.)
Siguiendo el ejemplo anterior en la primera iteración se generara el siguiente árbol:

12 Resolución del Problema Capas: Obtención de la Categoría (cont.)
En la segunda iteración el árbol se completara de la siguiente manera En esta iteración se frena la creación del árbol, ya que se obtuvo la categoría correcta.

13

14

15


Descargar ppt "Aplicación JAVA implementando Arboles de Decisión"

Presentaciones similares


Anuncios Google