La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Grupo de investigación en Bases de Datos y Sistemas de Información Inteligentes Departamento de Ciencias de la Computación e Inteligencia Artificial ETS.

Presentaciones similares


Presentación del tema: "Grupo de investigación en Bases de Datos y Sistemas de Información Inteligentes Departamento de Ciencias de la Computación e Inteligencia Artificial ETS."— Transcripción de la presentación:

1 Grupo de investigación en Bases de Datos y Sistemas de Información Inteligentes Departamento de Ciencias de la Computación e Inteligencia Artificial ETS Ingeniería Informática - Universidad de Granada

2 TMiner Data Mining en Java Entorno integrado de minería de datos desarrollado en Java. JDBC da acceso prácticamente a cualquier base de datos existente en el mercado.

3 TMiner Modelo conceptual

4 TMiner Interfaz Windows Los trabajadores del conocimiento pueden analizar sus propios datos utilizando un interfaz estándar de tipo WIMP...

5 TMiner Interfaz Web Como applet y como aplicación web

6 TMiner Sistema de ayuda en línea TMiner ofrece una interfaz bilingüe (español e inglés) con un sistema de ayuda en línea en formato HTML

7 TMiner Monitorización Siempre podemos ver el uso de memoria de la aplicación TMiner

8 TMiner Infraestructura Component-based data mining frameworks: OLAP vs. OLTP in the middle tier Fernando Berzal, Ignacio Blanco, Juan Carlos Cubero & Nicolás Marín Communications of the ACM, December 2002

9 TMiner Selección de los datos

10 Mediante el controlador JDBC adecuado se accede a la base de datos…

11 TMiner Selección de los datos Con TMiner podemos analizar cualquiera de los conjuntos de datos de la base de datos

12 TMiner El conjunto de datos

13 Una vez seleccionado el conjunto de datos, podemos empezar a trabajar con él

14 TMiner El conjunto de datos TMiner permite realizar consultas SQL

15 TMiner El conjunto de datos Importar datos desde ficheros…

16 TMiner El conjunto de datos … o exportar los datos de la base de datos

17 TMiner Preparación de los datos

18 Una vez seleccionado el conjunto de datos, podemos aplicar distintas técnicas de Data Mining

19 TMiner Preparación de los datos En primer lugar, seleccionamos las columnas del conjunto de datos con las que vamos a trabajar

20 TMiner Preparación de los datos A continuación, agrupamos los valores de cada atributo en función de cómo queramos interpretarlos

21 TMiner Preparación de los datos Cuando los atributos son de tipo numérico, podemos utilizar distintas técnicas de discretización

22 TMiner Preparación de los datos Incluso se pueden asignar etiquetas descriptivas a los conjuntos en que agrupamos los valores de los atributos

23 TMiner Técnicas de Data Mining

24 Ya sólo nos queda elegir qué algoritmos utilizar, indicar valores adecuados para sus parámetros y esperar a ver los resultados que se obtienen…

25 TMiner Técnicas de Data Mining

26 TMiner Árboles de decisión Algoritmos ID3, C4.5 …

27 TMiner Listas de decisión Metodología STAR: Algoritmos AQ y CN2

28 TMiner Reglas de asociación Algoritmos Apriori y TBAR

29 TMiner Reglas de asociación Clasificación con reglas de asociación

30 Técnicas disponibles Extracción de reglas de asociación (TBAR) Extracción de reglas de asociación (TBAR) Modelos de clasificación Modelos de clasificación –Árboles de decisión –ART –Listas de decisión y algoritmos STAR (AQ & CN2) –Clasificadores paramétricos y no paramétricos e.g. Clasificadores euclídeos y cuadráticos, k-NN, LVQ, DSM... Algoritmos de agrupamiento [clustering] Algoritmos de agrupamiento [clustering] e.g. K-Medias, GRASP, ISODATA...

31 TMiner Análizador Numérico

32 Analizador Numérico Técnicas de clasificación y agrupamiento El Analizador Numérico es la parte de TMiner encargada de trabajar con números

33 Analizador Numérico Técnicas de clasificación y agrupamiento Incluye técnicas de edición y condensado de datos, distintos métodos de construcción de clasificadores y múltiples algoritmos de agrupamiento

34 Analizador Numérico Técnicas de clasificación y agrupamiento Visualización de conjuntos de datos, estadísticas y distribuciones de clases

35 Analizador Numérico Técnicas de clasificación y agrupamiento Estadísticas por clases

36 Analizador Numérico Técnicas de clasificación y agrupamiento

37 Analizador Numérico Técnicas de clasificación y agrupamiento Clasificadores paramétricos (lineales y cuadráticos)

38 Analizador Numérico Técnicas de clasificación y agrupamiento Clasificadores no paramétricos: k-NN

39 Analizador Numérico Técnicas de clasificación y agrupamiento Aprendizaje adaptativo: LVQ y DSM

40 Analizador Numérico Técnicas de clasificación y agrupamiento Métodos de agrupamiento: K-MEANS, GRASP, ISODATA…

41 Clasificación con árboles de decisión A partir del algoritmo C4.5: Reglas de división Entropía Ganancia de información Índice de Gini MaxDif Ramas else Árboles n-arios con atributos numéricos

42 Clasificación con ART ARTTDIDT ART: A hybrid classification method Fernando Berzal, Juan Carlos Cubero, Daniel Sánchez & José María Serrano Machine Learning, 2004

43 Clasificación con ART

44 Extracción de reglas de asociación TBAR: efficient method for association rule mining in relational databases Fernando Berzal, Juan Carlos Cubero, Nicolás Marín & José María Serrano Data & Knowledge Engineering, 37 (2001), 47-64

45 Más información... Fernando Berzal Galiano Juan Carlos Cubero Talavera


Descargar ppt "Grupo de investigación en Bases de Datos y Sistemas de Información Inteligentes Departamento de Ciencias de la Computación e Inteligencia Artificial ETS."

Presentaciones similares


Anuncios Google