TMiner Data Mining en Java

Slides:



Advertisements
Presentaciones similares
Data Mining Minería de Datos Universidad Tecnológica Metropolitana
Advertisements

Libro Blanco XBRL Objetivos del grupo de Tecnología de XBRL España: Objetivo general: Facilitar a las entidades interesadas en implantar XBRL el acceso.
Relaciones y diferencias entre minería de datos y estadística
DATA MINING MINERIA DE DATOS Gersom Costas.
Algoritmos de Minería Los métodos básicos.
EDSI Universidad del Cauca 2011
Data Mining Integrantes: Rojas Correa, Trinidad Romanskyy, Bohdan
K-NN: K vecinos más cercanos
COMPONENTIZACIÓN DE ALGORITMOS GENETICOS Y SU IMPLEMENTACIÓN EN UNA PLATAFORMA ABIERTA PARA APRENDIZAJE COMPUTACIONAL.
Informe caso de estudio Implementación de un Datawarehouse
Presentación del estado del arte
VIVIANA ACHURY S. ANGIE NATALIA GARCIA S.. En los últimos años, ha existido un gran crecimiento en nuestras capacidades de generar y colectar datos (Bajo.
Métodos clasificación
Inteligencia Artificial Adquisición automática del conocimiento
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
Optimización de sistemas de trading
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
 Sistemas Expertos  ¿Qué es un sistema experto?  Los Sistemas Expertos, rama de la Inteligencia Artificial, son sistemas informáticos que simulan el.
MÉTODO DE INVESTIGACIÓN PARA SOLUCIONAR PROBLEMAS DE UNA INDUSTRIA Técnicas Estadísticas.
INTELIGENCIA DE NEGOCIOS
FUNDAMENTOS DE DATA MINING Y SUS APLICACIONES N. QUEIPO, S. PINTOS COPYRIGHT 2000 CLASIFICACIÓN NO SUPERVISADA.
MAIRA LUCIA ORTIZ CAMILO ORTEGON DIAZ CRISTIAN CAMILO VARGAS
Sesión 2: Métodos Probabilísticos Básicos
UNIVERSIDAD MICHOACANA DE SAN NICOLÁS DE HIDALGO
Weka.
Departamento de Informática Universidad Técnica Federico Santa María 1 RMA/2001 Proyecto West PROYECTO WEST Presentación Tarea Nº4 Raúl Monge Anwandter.
Business Intelligence y Data Mining
RESUMEN En este artículo se describe en forma breve una de las líneas de investigación que se están llevando a cabo en el Laboratorio de Tecnologías Emergentes.
Mt. Martín Moreyra Navarrete.
Técnicas Supervisadas Aproximación no paramétrica
Reconocimiento de Formas en Data Mining
USO DE LA PLATAFORMA LIMESURVEY
INTRODUCCIÓN MINERÍA DE DATOS
Resolución de Problemas y Algoritmos Entorno de Programación Lazarus - FreePascal Año 2014 Departamento de Ciencias e Ingeniería de la Computación Universidad.
PARTE I: INTRODUCCIÓN José Hernández Orallo
Proceso KDD MSc. Carlos Alberto Cobos Lozada
Un método alternativo para la construcción de árboles de decisión
CARPLATE Reconocimiento del marco de la matrícula de un coche
04/02/031 UML con Poseidon Soledad Penadés Comadrán Laboratorio de Sistemas de Información Facultad de Informática Universidad Politécnica de Valencia.
1 TEMA 1: NECESIDAD DE LA INFORMACIÓN PARA LA TOMA DE DECISIONES EN LA EMPRESA Las bases de datos ocupan un lugar determinante en cualquier área. No sólo.
Inteligencia de Negocios (Presentación)
REVISTAS ELECTRÓNICAS Cómo buscar revistas y artículos.
“Introducción a las Ciencias de la Informática”
¿Por qué usar Data Mining?  Proporciona un punto de encuentro entre los investigadores y las personas de negocios.  Ahorra grandes cantidades de dinero.
INTELIGENCIA DE NEGOCIOS Agosto 2010 UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO.
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.
DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.
KDD y Técnicas de Minería de Datos en Weka
UNIDAD II CREACION Y EDICIÓN DE AUDIO Y VIDEO
Aplicación JAVA implementando Arboles de Decisión
ENCUESTA A BIBLIOTECAS DE UNIVERSIDADES PRIVADAS 2002.
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.
INTRODUCCIÓN A SPSS Statistic Package for Social Sciencies.
Internet Internet es una red de alcance mundial, compuesta por redes de datos privadas y públicas que se comunican entre si, independientemente del hardware.
Tabla de frecuencia Estándar: Interpreto datos de información
Taller de Inteligencia de Negocios SQL Server Analysis Services Data Mining Semana 11.
1 Descubrimiento de Patrones de Desempeño Académico en la Competencia de Lectura Crítica Contrato
RECURSO EDUCATIVO ABIERTO Reposito de recurso educativo abierto: Toda la UNAM en línea Por: Yussel Daniel Mondragón 04- Diciembre
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Minería de Datos MC BEATRIZ BELTRÁN MARTÍNEZ FACULTAD DE CIENCIAS DE LA COMPUTACIÓN. Primavera 2016.

CURSO DE FORMACIÓN AL PORTAL WEB DE LA UNIVERSIDAD CARLOS III DE MADRID ORACLE PORTAL Manual disponible en:
Support Vector Machines.  Vocabulario básico: ◦ Repositorio de datos ◦ Atributos y Instancias ◦ Aprendizaje supervisado  Clasificación (Clase) ◦ Aprendizaje.
Autor: Carlos Eric Teliszewski Universidad de Palermo (UP)
Aprendizaje en las Escuelas del Siglo XXI CIER: Administración Técnica Barranquilla, Abril de 2014.
Extracción de conocimiento a partir de Recursos Digitales para el Aprendizaje Mtro. Alfredo Zapata González Escuela Superior de Informática.
Curso de programación Visual Chart 6 (1ªEd.)
ASPECTOS BÁSICOS IRENE LÓPEZ-REY SÁNCHEZ-CANO DIEGO FRAILE SERRANO MARTÍN CORBACHO LOARTE ALFONSO JOSÉ GÓMEZ BLÁZQUEZ.
Rafael Zamora Garrido Julio Ejemplos de objetivos de Minería de Datos Reducir las bajas de clientes actuales en un 5%. Aumentar las contrataciones.
Transcripción de la presentación:

Grupo de investigación en Bases de Datos y Sistemas de Información Inteligentes Departamento de Ciencias de la Computación e Inteligencia Artificial ETS Ingeniería Informática - Universidad de Granada

TMiner Data Mining en Java Entorno integrado de “minería de datos” desarrollado en Java. JDBC da acceso prácticamente a cualquier base de datos existente en el mercado.

TMiner Modelo conceptual

TMiner Interfaz Windows Los “trabajadores del conocimiento” pueden analizar sus propios datos utilizando un interfaz estándar de tipo WIMP...

TMiner Interfaz Web Como applet... ... y como aplicación web

TMiner Sistema de ayuda en línea TMiner ofrece una interfaz bilingüe (español e inglés) con un sistema de ayuda en línea en formato HTML

TMiner Monitorización Siempre podemos ver el uso de memoria de la aplicación TMiner

TMiner Infraestructura “Component-based data mining frameworks: OLAP vs. OLTP in the middle tier” Fernando Berzal, Ignacio Blanco, Juan Carlos Cubero & Nicolás Marín Communications of the ACM, December 2002

TMiner Selección de los datos

TMiner Selección de los datos Mediante el controlador JDBC adecuado se accede a la base de datos…

TMiner Selección de los datos Con TMiner podemos analizar cualquiera de los conjuntos de datos de la base de datos

TMiner El conjunto de datos

TMiner El conjunto de datos Una vez seleccionado el conjunto de datos, podemos empezar a trabajar con él

TMiner El conjunto de datos TMiner permite realizar consultas SQL

TMiner El conjunto de datos Importar datos desde ficheros…

TMiner El conjunto de datos … o exportar los datos de la base de datos

TMiner Preparación de los datos

TMiner Preparación de los datos Una vez seleccionado el conjunto de datos, podemos aplicar distintas técnicas de Data Mining

TMiner Preparación de los datos En primer lugar, seleccionamos las columnas del conjunto de datos con las que vamos a trabajar

TMiner Preparación de los datos A continuación, agrupamos los valores de cada atributo en función de cómo queramos interpretarlos

TMiner Preparación de los datos Cuando los atributos son de tipo numérico, podemos utilizar distintas técnicas de discretización

TMiner Preparación de los datos Incluso se pueden asignar etiquetas descriptivas a los conjuntos en que agrupamos los valores de los atributos

TMiner Técnicas de Data Mining

TMiner Técnicas de Data Mining Ya sólo nos queda elegir qué algoritmos utilizar, indicar valores adecuados para sus parámetros y esperar a ver los resultados que se obtienen…

TMiner Técnicas de Data Mining

TMiner Árboles de decisión Algoritmos ID3, C4.5 …

TMiner Listas de decisión Metodología STAR: Algoritmos AQ y CN2

TMiner Reglas de asociación Algoritmos Apriori y TBAR

TMiner Reglas de asociación Clasificación con reglas de asociación

Técnicas disponibles Extracción de reglas de asociación (TBAR) Modelos de clasificación Árboles de decisión ART Listas de decisión y algoritmos STAR (AQ & CN2) Clasificadores paramétricos y no paramétricos e.g. Clasificadores euclídeos y cuadráticos, k-NN, LVQ, DSM... Algoritmos de agrupamiento [clustering] e.g. K-Medias, GRASP, ISODATA...

TMiner Análizador Numérico

Técnicas de clasificación y agrupamiento Analizador Numérico Técnicas de clasificación y agrupamiento El Analizador Numérico es la parte de TMiner encargada de trabajar con números

Técnicas de clasificación y agrupamiento Analizador Numérico Técnicas de clasificación y agrupamiento Incluye técnicas de edición y condensado de datos, distintos métodos de construcción de clasificadores y múltiples algoritmos de agrupamiento

Analizador Numérico Técnicas de clasificación y agrupamiento Visualización de conjuntos de datos, estadísticas y distribuciones de clases

Analizador Numérico Técnicas de clasificación y agrupamiento Estadísticas por clases

Técnicas de clasificación y agrupamiento Analizador Numérico Técnicas de clasificación y agrupamiento

Analizador Numérico Técnicas de clasificación y agrupamiento Clasificadores paramétricos (lineales y cuadráticos)

Analizador Numérico Técnicas de clasificación y agrupamiento Clasificadores no paramétricos: k-NN

Analizador Numérico Técnicas de clasificación y agrupamiento Aprendizaje adaptativo: LVQ y DSM

Analizador Numérico Técnicas de clasificación y agrupamiento Métodos de agrupamiento: K-MEANS, GRASP, ISODATA…

Clasificación con árboles de decisión A partir del algoritmo C4.5: Reglas de división Entropía Ganancia de información Índice de Gini MaxDif Ramas ‘else’ Árboles n-arios con atributos numéricos

“ART: A hybrid classification method” Clasificación con ART ART TDIDT “ART: A hybrid classification method” Fernando Berzal, Juan Carlos Cubero, Daniel Sánchez & José María Serrano Machine Learning, 2004

Clasificación con ART

Extracción de reglas de asociación “TBAR: efficient method for association rule mining in relational databases” Fernando Berzal, Juan Carlos Cubero, Nicolás Marín & José María Serrano Data & Knowledge Engineering, 37 (2001), 47-64

Más información... Fernando Berzal Galiano fberzal@decsai.ugr.es Juan Carlos Cubero Talavera jc.cubero@decsai.ugr.es