Chihuahua, 9-11 de octubre de 2003 José Hernández Orallo

Slides:



Advertisements
Presentaciones similares
Procesamiento y Análisis en Línea OLAP
Advertisements

OLAP - Herramienta para el A.D.
ORACLE OLAP Integrantes: *Aizaga, Martiniano *Gallegos, Marina
DATA MINING MINERIA DE DATOS Gersom Costas.
DATA WAREHOUSE Presentador Por: Andrés Fabián Cortes Solano.
Complejidad Algorítmica: Análisis de algoritmos
INTERNET y la docencia universitaria MANUEL AREA MOREIRA
Director: Ing. Washington Pérez Codirector: Ing. Andrés de la Torre
TMiner Data Mining en Java
Minería de Datos con Clementine SPSS 11.1
Sistema de soporte a la toma de decisiones
Curso de doctorado impartido por Dr. Quiliano Isaac Moro
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
DATA WAREHOUSE Joseba Gil Noelia Suaña. ÍNDICE 1. Introducción. 2. ¿Qué es Data Warehouse? 3. Arquitectura. 4. Ventajas/Inconvenientes.
Análisis y Diseño de Sistemas
INTELIGENCIA DE NEGOCIOS
SEMANA Introducción.
El Proceso Software Ingeniería en Informática
Métodos y Herramientas Computacionales para el Análisis y la Visualización Informétrica Responsable: Dr. Humberto Carrillo Calvet.
Introducción al Proceso de Desarrollo de Software Patricio Letelier Departamento de Sistemas Informáticos y Computación Universidad.
Evaluación y modelado del rendimiento de los sistemas informáticos Xavier Molero, Carlos Juiz, Miguel Rodeño Prentice Hall, 2004 ISBN
Implementación de Datawarehouse
José Antonio Aranda Román
Business Intelligence y Data Mining
Análisis y Diseño del Software
INTRODUCCIÓN MINERÍA DE DATOS
“DISEÑO E IMPLEMENTACIÓN DE UN PROTOTIPO DE IDENTIFICACIÓN DACTILAR PARA EL SISTEMA DE RECAUDO PERSONAL EN EL NUEVO TRANSPORTE PÚBLICO DE PASAJEROS EN.
PARTE I: INTRODUCCIÓN José Hernández Orallo
CONTEXTA Introducción a FEDORA y modelos de extensión que provee Pablo Inostroza Valdera 11 de julio de 2007.
La Información en las Organizaciones. Datos Externos Datos Internos Datos Personales Data Mining Data Warehouse Data Marts Meta Data OLAP Queries DSS.
Proceso KDD MSc. Carlos Alberto Cobos Lozada
Por: Yimy A. Hernández Ing. Industrial ECCI
Curso de Lógica Difusa Prof. José Edinson Aedo Cobo, Msc. Dr. Ing.
1 Ingeniería del Software Curso German Rigau Ingeniería Técnica en Informática de Sistemas.
Introducción al Proceso de Desarrollo de Software Patricio Letelier Centro de Formación de Postgrado – Depto. Sistemas Informáticos y Computación Universidad.
Las TIC’s en la educación
MODELO DE INTEGRACIÓN ENTRE COMPUTACIÓN EN GRILLA Y SISTEMAS MULTIAGENTES David De La Peña Javier M. Morales Enrique González Director Mayo de 2005 Reporte.
Realizado por: Alejandro Palacios Sánchez
Inteligencia de Negocios (Presentación)
1 Prof:Paula Quitral INTRODUCCIÓN DATAWAREHOUSE Departamento de Informática Universidad de Rancagua.
Universidad Tecnológica del Centro Programa de la Asignatura ARQUITECTURA DEL COMPUTADOR Universidad Tecnológica del Centro Programa de la Asignatura ARQUITECTURA.
1 Ingeniería del Software Curso German Rigau Ingeniería Técnica en Informática de Sistemas.
FUNDAMENTOS DE DESARROLLO DE SISTEMAS M.C. Miriam Zulma Sánchez Hernández.
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.
DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.
ORACLE OLAP CAECE Integrantes: *Aizaga, Martiniano *Gallegos, Marina *Kleinlein, Guillermo *Schiano di Cola, Emiliano.
KDD y Técnicas de Minería de Datos en Weka
Johandra Gastier David De Freitas
Sistemas de Información Administrativa Ttramestre MAY - AGO 2008 Catedrático: MC. Pedro Martínez Lucio MC. Pedro Martínez.
SISTEMAS DE BASES DE DATOS MASIVOS (U. N.) / GESTIÓN Y EL PROCESAMIENTO DE GRANDES VOLÚMENES DE DATOS (U. de A.) Francisco Moreno & Freddy Duitama 2015-II.
Ingeniería en Informática F UNDAMENTOS DE C OMPUTACIÓN B ACHILLERATO EN I NGENIERÍA I NFORMÁTICA L IC. C ARLOS H. G UTIÉRREZ L EÓN.
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.
INGENIERIA DE SOFTWARE
INTELIGENCIA DE NEGOCIOS Agosto Procesamiento de una gran masa de datos Analisis Avanzado Analisis de las decisiones coorporativas BUSINESS INTELLIGENCE.
Capas de ingeniería del Software. Rosendo Antonio Manuel Ingeniería en Sistemas Computacionales.
República Bolivariana de Venezuela Universidad Nacional Experimental Politécnica de la Fuerza Armada (UNEFA) Carrera: Ingeniería de Sistemas Cátedra: Análisis.
UNIDAD 1 INTRODUCCION Y PRIMERAS FASES DE INV DE MERCADOS INVESTIGACION DE MERCADOS Identificación, acopio, difusión y Aprovechamiento de información Clasificación.

CARACTERÍSTICAS ESPECIALES DE LA EXTRACCIÓN DE CONOCIMIENTO DE INFO. NO ESTRUCTURADA Objetivos ligeramente Especiales: Búsqueda de Información Relevante.
La Empresa La Problemática Estado Actual, Bases de datos relacionales Problemas con las consultas No muestra datos históricos Poca integridad en.
Autor: Carlos Eric Teliszewski Universidad de Palermo (UP)
Extracción de conocimiento a partir de Recursos Digitales para el Aprendizaje Mtro. Alfredo Zapata González Escuela Superior de Informática.
Copyright © 2007, SAS Institute Inc. All rights reserved. Encuentro Abierto Tesistas Analytics SAS en la Universidad Taller participativo Noviembre 2009.
SISTEMAS DE INFORMACION GEOGRAFICA (SIG) Néstor Acosta Rodríguez Código: 7137.
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
CI2355 – Almacenes de datos y OLAP
CI2355 – Almacenes de datos y OLAP
CC60K Temario semestre
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
Transcripción de la presentación:

Análisis y Extracción de Conocimiento en Sistemas de Información: Datawarehouse y Datamining Chihuahua, 9-11 de octubre de 2003 José Hernández Orallo jorallo@dsic.upv.es Departamento de Sistemas Informáticos y Computación Universidad Politécnica de Valencia

Objetivos Generales El objetivo fundamental de este curso es: conocer el potencial, la problemática y la tecnología (DW+DM) de análisis y extracción de conocimiento sobre sistemas de información Se instancia en dos subobjetivos principales: conocer las técnicas de almacenes de datos y OLAP para facilitar el procesamiento analítico de apoyo a la toma de decisiones estratégicas. DW saber aplicar las técnicas de minería de datos apropiadas para problemas concretos de extracción de conocimiento. DM

Objetivos Específicos (1/4) Reconocer el potencial y la problemática del análisis de sistemas de información para la toma de decisiones. Conocer las ventajas y casos donde es aconsejable recopilar información interna y externa en un Almacén de Datos. Conocer el modelo multidimensional de datos de los almacenes de datos y los operadores de refinamiento asociados: drill, roll, slice & dice, pivot. Conocer la arquitectura y diferentes implementaciones (ROLAP, MOLAP) de Almacenes de Datos. Reconocer pautas para el diseño y mantenimiento de ADs.

Objetivos Específicos (2/4) Reconocer los beneficios de su uso sistemático de técnicas de extracción de conocimiento para la obtención de modelos y patrones predictivos o descriptivos. Conocer las fases del Descubrimiento de Conocimiento de Bases de Datos y la importancia de las mismas en el éxito del proceso (en especial las de limpieza y selección de datos). Conocer las distintas técnicas de aprendizaje automático y estadísticas utilizadas en minería de datos, su potencial, su coste computacional y sus limitaciones de representación y de inteligibilidad.

Objetivos Específicos (3/4) Elegir, para un problema concreto, qué técnicas de minería de datos son más apropiadas. Generar los modelos y patrones elegidos utilizando una herramienta o paquete de minería de datos. Evaluar la calidad de un modelo, utilizando técnicas sencillas de evaluación (validación cruzada). Utilizar métodos de combinación de técnicas (p.ej. voting) y de reiteración (p.ej. boosting). Conocer la problemática especial de la minería sobre la web (documentos textuales e hipertextuales) y las técnicas más usuales.

Objetivos Específicos (4/4) Además, y especialmente dirigido a los asistentes del mundo académico: Conocer los problemas abiertos en la investigación de almacenes de datos y minería de datos. Conocer los congresos y foros más importantes, así como las redes, recursos, etc., relacionados con ambas disciplinas.

Temario (1 de 4) PARTE I: INTRODUCCIÓN (tiempo estimado: 1 hora) PARTE II: ALMACENES DE DATOS (tiempo estimado: 4 horas) PARTE III: MINERÍA DE DATOS (tiempo estimado: 7 horas) PRÁCTICAS SOBRE PARTE III: 8 horas.

Temario (2 de 4) 1.1. Finalidades y Evolución de los Sistemas de Información. 1.2. Herramientas para la Toma de Decisiones: diferencias e interrelación. 1.3. Almacenes de Datos, OLAP y Minería de Datos: definición e interrelación. Parte I: Introducción

Parte II: Almacenes de Datos Temario (3 de 4) 2.1. Introducción a los almacenes de datos: motivación definición y características. 2.2. Arquitectura de un sistema de almacén de datos. 2.3. Explotación de un almacén de datos: herramientas OLAP. 2.4. Sistemas ROLAP y MOLAP. 2.5. Carga y Mantenimiento de un Almacén de Datos. 2.6. Diseño de un almacén de datos. 2.7. Líneas de investigación abiertas. Parte II: Almacenes de Datos

Parte III: Minería de Datos Temario (4 de 4) 3.1. Introducción a la Minería de Datos (DM) 3.1.1. Motivación 3.1.2. Problemas tipo y aplicaciones 3.1.3. Relación de DM con otras disciplinas 3.2. El proceso de KDD 3.2.1. Las Fases del KDD 3.2.2. Tipología de Técnicas de Minería de Datos 3.2.3. Sistemas Comerciales 3.2.4. Visualización 3.3. Técnicas de Minería de Datos 3.3.1. El Problema de la Extracción Automática de Conocimiento. 3.3.2. Evaluación de Hipótesis 3.3.3. Técnicas no supervisadas y descriptivas. 3.3.4. Técnicas supervisadas y predictivas. 3.4. Web Mining 3.4.1. Los Problemas de la Información No Estructurada. 3.4.2. Extracción de Conocimiento a partir de Documentos HTML y texto. 3.4.3. Extracción de Información semi-estructurada (XML). 3.5. Líneas de Investigación Abiertas Parte III: Minería de Datos

Material y Organización Transparencias y boletines. Software: SPSS Clementine 6.0 Otra Documentación: http://www.dsic.upv.es/~jorallo/cursoDWDM Sesiones de 4 horas: 2 exposición 2 prácticas con Clementine

Bibliografía (1/3). Almacenes de Datos Inmon, W.H. "Building the Data Warehouse", John Wiley, 1992 Inmon, W.H. et al. "Managing the Data Warehouse", John Wiley, 1997 Inmon, W.H. et al. "Data Warehouse Performance", John Wiley, 1999 Kimball, R. "The Data Warehouse Toolkit", John Wiley, 1996 Kimball, R et al. "The Data Warehouse Lifecycle Toolkit", John Wiley, 1998 Giovinazzo, W. "Object-Oriented Data Warehouse Design", Prentice-Hall, 2000. Jarke, M. et al. "Fundamentals of Data Warehouses", Springer, 2000.

Bibliografía (2/3). Minería de Datos Berry M.J.A.; Linoff, G.S. “Mastering Data Mining” Wiley 2000. Berthold, M.; Hand, D.J. (ed) “Intelligent Data Analysis. An Introduction” Springer 1999. (Nueva edición a aparecer en 2002). Dunham, M.H. “Data Mining. Introductory and Advanced Topics” Prentice Hall, 2003. Dzeroski, S.; Lavrac, N. “Relational Data Mining” Springer 2001. Etzioni, O. “The World- Wide Web. Quagmire or Gold Mine” Communications of the ACM, November 1996, Vol. 39, nº 11, 1996. Fayyad, U.M.; Piatetskiy-Shapiro, G.; Smith, P.; Ramasasmy, U. “Advances in Knowledge Discovery and Data Mining”, AAAI Press / MIT Press, 1996. Fayyad, U.M.; Grinstein, G.; Wierse, A. “Information Visualization in Data Mining and Knowledge Discovery” Morgan Kaufmann, Harcourt Intl., 2001. Han, J.; Kamber, M. “Data Mining: Concepts and Techniques” Morgan Kaufmann, 2001.

Bibliografía (3/3). Minería de Datos Hand, D.J.; Mannila, H. and Smyth, P. “Principles of Data Mining”, The MIT Press, 2000. Hernández, J.; Ramírez, MJ.; Ferri, C. “Introducción a la Minería de Datos” Pearson Prentice Hall, a aparecer 2004. Kosala, R.; Blockeel, H. “Web Mining Research: A Survey” ACM SIGKDD Explorations, Newsletter of the ACM SIG on Knowledge Discovery and Data Mining, June 2000, Vol. 2, nº1, pp. 1-15. Mena, Jesus “Data Mining Your Website”, Digital Press, July 1999. Mitchell, T.M. “Machine Learning” McGraw-Hill 1997. Pyle, D. “Data Preparation for Data Mining” Morgan Kaufmann, Harcourt Intl., 1999. Thuraisingham, B. “Data Mining. Technologies, Techniques, Tools, and Trends”, CRC Press, 1999. Witten, I.H.; Frank, E. “Tools for Data Mining”, Morgan Kaufmann, 1999. Wong, P. C. “Visual Data Mining”, Special Issue of IEEE Computer Graphics and Applications, Sep/ Oct 1999, pp. 20- 46.