Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –

Slides:



Advertisements
Presentaciones similares
Data Mining Minería de Datos Universidad Tecnológica Metropolitana
Advertisements

DATA MINING MINERIA DE DATOS Gersom Costas.
DATA MINING Bibliografía:
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
INTELIGENCIA DE NEGOCIOS
VII Reunión sobre casos prácticos de inspección y vigilancia de mercados y entidades. Santiago de Chile Marcelo García R Sonia Muñoz C. Santiago, 17 de.
Juan Pedro Febles KDD y MD “KDD y MD” “KDD y MD” Dr. Juan Pedro Febles Rodríguez BIOINFO CITMA2005
Business Intelligence y Data Mining
La Información en las Organizaciones. Datos Externos Datos Internos Datos Personales Data Mining Data Warehouse Data Marts Meta Data OLAP Queries DSS.
Chihuahua, 9-11 de octubre de 2003 José Hernández Orallo
5/8/2015Metamodelamiento1 METAMODELADO Carlos Mario Zapata J.
Escalabilidad en los Algoritmos de Aprendizaje de Redes Bayesianas ISL – Dpto de Informática – UCLM - Albacete.
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.
DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.
KDD y Técnicas de Minería de Datos en Weka
SISTEMAS DE BASES DE DATOS MASIVOS (U. N.) / GESTIÓN Y EL PROCESAMIENTO DE GRANDES VOLÚMENES DE DATOS (U. de A.) Francisco Moreno & Freddy Duitama 2015-II.
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.

LAS 14 AREAS TEMATICAS DE LA COMPUTACIÓN En los años la ACM(Association for Computing Machinery) y la IEEE (Institute for Electrical and Electronic.
Bases de Datos Cartográficas Laura Sebastiá Departamento de Sistemas Informáticos y Computación.
1 Introducción a la minería de datos. 2 Temario ¿Qué es minería de datos? ¿Qué es minería de datos? ¿Quién usa minería de datos? ¿Quién usa minería de.
 No es una publicación original  Examina la bibliografía ya publicada  Controla, coteja y analiza un trabajo ya realizado.
Prospectiva Introducción
HERRAMIENTAS DE INTELIGENCIA DE NEGOCIOS
ARQUITECTURAS DE BUSINESS INTELLIGENCE. ARQUITECTURA TRADICIONAL.
Dr. Francisco J. Mata 1 Metodologías para Minería de Datos Tema 4.
1 Ingeniería del conocimiento Sesión 1 ¿Por qué estudiar aprendizaje automático?
MÁSTER MNTI: “ Tecnologías inteligentes y del conocimiento con aplicaciones en medicina”
Data Warehouse RONALD FERNANDO QUINTERO VEGA DIEGO ALEJANDRO VALENCIA RIVERA INTELIGENCIA DE NEGOCIOS CREAD-HONDA 2017.
La Ingeniería de Sistemas
UNIVERSIDAD DE BURGOS Escuela Politécnica Superior
Herramienta de moldeado pulmonar
Motivación Data Mining
Nuevas tecnologías aplicables a la gestión documental: la gestión y la conservación Mayo 2017.
DATA MINING y el Posgrado en Explotación de datos y descubrimiento del conocimiento Ana S. Haedo Departamento de Computación F.C.E.y N. UBA Redbio Rosario.
Análisis y catalogación de las fuentes que definen las competencias demandadas en el campo de la Interacción Persona-Ordenador Raquel Lacuesta Jesús Gallardo.
BASE DE DATOS INTRODUCCION.
Susana Masapanta Carrión Ángel Velázquez Iturbide Marzo 2017
09 de mayo del 2016Pg. 1 ING. BERTHA MAZON, UNIDAD III: SOLUCIONES DE INTELIGENCIA DE NEGOCIOS.
SIG para la Agricultura de Precisión
INFORMÁTICOS.
PARTE I: INTRODUCCIÓN.
TRABAJO DE TITULACIÓN “MANEJO BASICO DE INDICADORES DE PARTICIPACION CIUDADANA UTILIZANDO ALGORITMOS Y TECNICAS DE MINERIA DE DATOS COMO APOYO EN LA GESTION.
Ingeniería de Software II Conferencia 8
PORTAL WEB Estandarización de Indicadores de acuerdo a la Clasificación Industrial Internacional Uniforme, Matriz Productiva.
Representación del Conocimiento
Resumen: Análisis de requerimientos
4. PROCESO DE LA TOMA DE DECISIONES EN LOS SISTEMAS
RODRÍGUEZ CARRANZA SARAÍ ABI
CC60K Temario semestre
Universidad Nacional Autónoma de Honduras Carrera de Ingeniería en Sistemas IPAC IS-501 Base de Datos I Tema 0: Información Detallada del Espacio.
APLICACIÓN DE NUEVAS TECNOLOGÍAS EN LA CONSERVACIÓN Y ANÁLISIS DEL PATRIMONIO CULTURAL Herramientas para la Investigación.
Desarrollo de Software (SIG) Estudiante: Alejandro Milan Villarroel Hidalgo.
INTELIGENCIA DE NEGOCIOS Business Intelligence(BI) Una herramienta para tomar decisiones.
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
 La minería de datos o exploración de datos (es la etapa de análisis de "Knowledge Discovery in Databases" o KDD) es un campo de la estadística y las.
Cover Análisis y diseño de sistemas 7. Métricas en el proceso de software personal.
Métodos estadísticos en Bioinformática
TALLER DE LECTURA Y REDACCIÓN VI Sesión 1.
DATOS ABIERTOS EN EL CONTEXTO DE LA INTELIGENCIA ARTIFICIAL
 Es básicamente un proceso automático en el que se combinan descubrimiento y análisis.  El proceso consiste en extraer patrones en forma de reglas o.
“DE LA ACADEMIA AL CIUDADANO”.
1 DATA MINING Arantza Garcia Arrastia Curso 2004/2005.
Inteligencia Artificial y Redes Neuronales
INTELIGENCIA DE NEGOCIOS Business Intelligence. Inteligencia de Negocios Algo peor que no tener información disponible es tener mucha información Y no.
AUTOMATIZACIÓN Y CONTROL DE PROCESOS Cristian Camilo Agudelo Calderón Universidad de Caldas 2019.
Almacenes de datos Data warehouse y OLAP. Gestión de los datos y del conocimiento.
1 DATA MINING Arantza Garcia Arrastia Curso 2004/2005.
Transcripción de la presentación:

Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática – Universidad de Granada (Spain) Fundamentos de Minería de Datos Introducción al Data Mining Fernando Berzal

1 Extracción de patrones (“conocimiento”) en grandes cantidades de datos ¿Qué es la minería de datos? Definición Técnicas de Data Mining Evaluación de resultados Sistemas de Data Mining Temas de investigación Bibliografía

2 Extracción de patrones (“conocimiento”) en grandes cantidades de datos Requisitos n No trivial n Implícito n Previamente desconocido n Potencialmente útil ¿Qué es la minería de datos? Definición Técnicas de Data Mining Evaluación de resultados Sistemas de Data Mining Temas de investigación Bibliografía

3 ¿Qué es la minería de datos? Definición Técnicas de Data Mining Evaluación de resultados Sistemas de Data Mining Temas de investigación Bibliografía “Data rich, Information poor” Conocimiento (patrones interesantes)

4 Extracción de conocimiento en bases de datos KDD (Knowledge Discovery in Databases) Definición Técnicas de Data Mining Evaluación de resultados Sistemas de Data Mining Temas de investigación Bibliografía

5 Extracción de conocimiento en bases de datos n Limpieza de datos (eliminación de ruido e inconsistencias) n Integración de datos (combinación de múltiples fuentes de datos) n Reducción/Selección de datos (identificación de datos relevantes para el problema) n Transformación de datos (preparación de los datos para su análisis) n Minería de datos (técnicas de extracción de patrones y medidas de interés) n Presentación de resultados (técnicas de visualización y de representación del conocimiento) KDD (Knowledge Discovery in Databases) Definición Técnicas de Data Mining Evaluación de resultados Sistemas de Data Mining Temas de investigación Bibliografía

6 Extracción de conocimiento en bases de datos KDD (Knowledge Discovery in Databases) Definición Técnicas de Data Mining Evaluación de resultados Sistemas de Data Mining Temas de investigación Bibliografía

7 Carácter multidisciplinar Data Mining Bases de datos Estadística IA Visualización Aprendizaje Representación del conocimiento Evaluación de resultados Resumen de datos Presentación de resultados Gestión de grandes cantidades de datos Definición Técnicas de Data Mining Evaluación de resultados Sistemas de Data Mining Temas de investigación Bibliografía

8 En función de su propósito general: Técnicas descriptivas Técnicas predictivas También se pueden clasificar atendiendo a n el tipo de datos que hay que analizar n el tipo de “conocimiento” que se obtiene n el tipo de herramienta que utiliza n el dominio de aplicación Clasificación de técnicas Definición Técnicas de Data Mining Evaluación de resultados Sistemas de Data Mining Temas de investigación Bibliografía

9 n Bases de datos relacionales n Bases de datos multidimensionales (DW) n Bases de datos transaccionales n Series temporales, secuencias y data streams n Datos estructurados (grafos, redes sociales) n Datos espaciales y espaciotemporales n Textos e hipertextos (p.ej. Web) n Bases de datos multimedia (p.ej. imágenes) Fuentes de datos Definición Técnicas de Data Mining Evaluación de resultados Sistemas de Data Mining Temas de investigación Bibliografía

10 Caracterización o resumen Discriminación o contraste Patrones frecuentes, asociaciones y correlaciones Clasificación y predicción Detección de agrupamientos (clustering) Detección de anomalías (outliers) Análisis de tendencias (series temporales) Técnicas de Data Mining Definición Técnicas de Data Mining Evaluación de resultados Sistemas de Data Mining Temas de investigación Bibliografía

11 Un resultado es interesante si… n es comprensible (por seres humanos) n es válido con cierto grado de certeza n es potencialmente útil n es novedoso o sirve para validar una hipótesis El interés de los resultados se puede evaluar n objetivamente (criterios estadísticos) n subjetivamente (perspectiva del usuario) Evaluación de resultados Definición Técnicas de Data Mining Evaluación de resultados Sistemas de Data Mining Temas de investigación Bibliografía

12 Una tarea de minería de datos puede describirse en términos de… n Datos relevantes (lo que hay que analizar) n Tipo de conocimiento (lo que se desea obtener) n Conocimiento previo (background knowledge, para guiar el proceso) n Medidas de interés (para evaluar los resultados obtenidos) n Técnicas de representación (para representar los resultados obtenidos) Sistemas de Data Mining Definición Técnicas de Data Mining Evaluación de resultados Sistemas de Data Mining Temas de investigación Bibliografía

13 Sistemas de Data Mining Arquitectura típica Limpieza, integración, selección y transformación de datos Base de datos o Data Warehouse Motor de minería de datos Evaluación de patrones Interfaz de usuario DB DW WWW … Base de conocimiento Definición Técnicas de Data Mining Evaluación de resultados Sistemas de Data Mining Temas de investigación Bibliografía

14 Temas de investigación n n Técnicas eficientes de minería de datos n n Escalabilidad n n Técnicas incrementales n n Algoritmos paralelos n n Incorporación de conocimiento previo n n Evaluación de resultados (interés) n n Interacción con el usuario n n Técnicas interactivas (a distintos niveles de abstracción) n n Técnicas de presentación y visualización de resultados n n Análisis de “nuevos” tipos de datos n n Estructuras complejas (grafos, redes sociales) n n Bases de datos heterogéneas… Definición Técnicas de Data Mining Evaluación de resultados Sistemas de Data Mining Temas de investigación Bibliografía

15 Bibliografía: Libros de texto Jiawei Han & Micheline Kamber: “Data Mining: Concepts and Techniques” Morgan Kaufmann, 2006, ISBN Pang-Ning Tan, Michael Steinbach & Vipin Kumar: “Introduction to Data Mining” Addison-Wesley, 2006, ISBN Definición Técnicas de Data Mining Evaluación de resultados Sistemas de Data Mining Temas de investigación Bibliografía

16 Bibliografía: Investigación REVISTAS ACM Transactions on KDD ACM Transactions on KDD IEEE Transactions on Knowledge and Data Engineering IEEE Transactions on Knowledge and Data Engineering Data Mining and Knowledge Discovery (DMKD) Data Mining and Knowledge Discovery (DMKD) ACM SIGKDD Explorations ACM SIGKDD Explorations Data & Knowledge Engineering (DKE) Data & Knowledge Engineering (DKE)CONGRESOS KDD (ACM SIGKDD International Conference on KDD) KDD (ACM SIGKDD International Conference on KDD) ICDM (IEEE International Conference on Data Mining) ICDM (IEEE International Conference on Data Mining) SDM (SIAM Data Mining Conference) SDM (SIAM Data Mining Conference) PKDD (Principles and Practices of KDD) PKDD (Principles and Practices of KDD) SIGMOD (Management of Data) SIGMOD (Management of Data) CIKM (Information and Knowledge Management) CIKM (Information and Knowledge Management) WEB: Definición Técnicas de Data Mining Evaluación de resultados Sistemas de Data Mining Temas de investigación Bibliografía