Proceso KDD MSc. Carlos Alberto Cobos Lozada

Slides:



Advertisements
Presentaciones similares
Data Mining Minería de Datos Universidad Tecnológica Metropolitana
Advertisements

Contenido Sistemas de Información Desarrollo de software
Caso de Éxito: Team System, CMMI, Metodologías Ágiles
Relaciones y diferencias entre minería de datos y estadística
Introducción a la minería de datos
Metodologías para Minería de Datos
ORACLE OLAP Integrantes: *Aizaga, Martiniano *Gallegos, Marina
DATA MINING MINERIA DE DATOS Gersom Costas.
DATA WAREHOUSE Presentador Por: Andrés Fabián Cortes Solano.
PROCESO Y MODELOS EN LA INGENIERIA DE SOFTWARE
ANÁLISIS DE REQUERIMIENTOS
CRISP-DM (
Enfoques de la investigación:
Introducción a la minería de datos
Data Mining Integrantes: Rojas Correa, Trinidad Romanskyy, Bohdan
K-NN: K vecinos más cercanos
TMiner Data Mining en Java
DATA MINING Bibliografía:
COMPONENTIZACIÓN DE ALGORITMOS GENETICOS Y SU IMPLEMENTACIÓN EN UNA PLATAFORMA ABIERTA PARA APRENDIZAJE COMPUTACIONAL.
2010 Enterprise Unified Process (EUP)
VIVIANA ACHURY S. ANGIE NATALIA GARCIA S.. En los últimos años, ha existido un gran crecimiento en nuestras capacidades de generar y colectar datos (Bajo.
Enfoque estadístico para estimación y predicción
Evaluación de Productos
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
INTELIGENCIA DE NEGOCIOS
Minería de Datos con Clementine
Weka.
Investigación bajo el Paradigma Cuantitativo
Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".
Business Intelligence y Data Mining
RESUMEN En este artículo se describe en forma breve una de las líneas de investigación que se están llevando a cabo en el Laboratorio de Tecnologías Emergentes.
Mt. Martín Moreyra Navarrete.
DEPARTAMENTO DE CIENCIAS E INGENIERÍA DE LA COMPUTACIÓN UNIVERSIDAD NACIONAL DEL SUR Año 1º 2º 3º 4º 5º Programación Matemática Software Sistemas de Hardware.
Contexto Proyecto consolidado dentro de la línea de investigación de Sistemas de Información en el Dpto. de Ingeniería en Sistemas de Información de la.
Data Mining aplicado a promociones en tarjetas de crédito/débito Diego Rafael Gómez Izquierdo Universidad de Palermo
3. Aplicación de Análisis en Redes Sociales La herramientas de visualización de red tradicionales, por ejemplo, diagramas de conexión de nodos, gráficos.
La Información en las Organizaciones. Datos Externos Datos Internos Datos Personales Data Mining Data Warehouse Data Marts Meta Data OLAP Queries DSS.
Antecedentes, estado actual del conocimiento y marco teórico
Conceptos de Gestión y Planificación de Proyectos Software
Práctica de Investigación
Universidad Central de Venezuela Facultad de Ciencias Postgrado en Ciencias de la Computación Sistemas Distribuidos Albany Márquez.
Minería de Dato(Datamining). Minería de Datos Datamining (Minería de datos)  El datamining (minería de datos), es el conjunto de técnicas y tecnologías.
1 TEMA 1: NECESIDAD DE LA INFORMACIÓN PARA LA TOMA DE DECISIONES EN LA EMPRESA Las bases de datos ocupan un lugar determinante en cualquier área. No sólo.
ERICK CISNEROS SAAVEDRA GABRIELA REGULES GUTIÉRREZ Datamining.
Inteligencia de Negocios (Presentación)
“Introducción a las Ciencias de la Informática”
Programa de Auditoría Interna
35 años de investigación, innovando con energía 1 Mayo, 2012 P LAN DE ASEGURAMIENTO DE LA CALIDAD DEL DESARROLLO DE SOFTWARE E STÁNDAR IEEE 730 Y G UÍA.
1 Prof:Paula Quitral INTRODUCCIÓN MINERIA DE DATOS Departamento de Informática Universidad de Rancagua.
IDENTIFICACIÓN PRIORIZADA DE PACIENTES CON ENFERMEDADES CRÓNICAS A TRAVÉS DEL ANÁLISIS DE HISTORIAS CLÍNICAS ELECTRÓNICAS Pontificia Universidad Javeriana.
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.
DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.
KDD y Técnicas de Minería de Datos en Weka
Introducción al proceso de verificación y validación.
Actividades en el Proceso de desarrollo de Software
Estructurar tus ideas para hacerlas realidad
UNIVERSIDAD MICHOACANA DE SAN NICOLAS DE HIDALGO
FACULTAD DE CIENCIAS COMPUTACIONALES Y TELECOMUNICACIONES ASIGNATURA:
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.
Qué es Minería de Datos La minería de datos es un proceso analítico diseñado para explorar grandes volúmenes de datos (generalmente datos de negocio y.
1 Descubrimiento de Patrones de Desempeño Académico en la Competencia de Lectura Crítica Contrato
República Bolivariana de Venezuela Universidad Nacional Experimental Politécnica de la Fuerza Armada (UNEFA) Carrera: Ingeniería de Sistemas Cátedra: Análisis.
DATA MINING. Extracción de información oculta y predecible de grandes bases de datos Poderosa tecnología que ayuda a concentrase en la información importante.

Modelado Orientado a Objetos Programación Orientada a Objetos Departamento de Sistemas Universidad del Cauca 2006.
Extracción de conocimiento a partir de Recursos Digitales para el Aprendizaje Mtro. Alfredo Zapata González Escuela Superior de Informática.
Gestión del Alcance del Proyecto
Rafael Zamora Garrido Julio Ejemplos de objetivos de Minería de Datos Reducir las bajas de clientes actuales en un 5%. Aumentar las contrataciones.
Una propuesta metodológica para el desarrollo de plataformas de educación a distancia que incorporen estilos de aprendizaje Pedro Salcedo L M. Angélica.
Transcripción de la presentación:

Proceso KDD MSc. Carlos Alberto Cobos Lozada ccobos@unicauca.edu.co http://www.unicauca.edu.co/~ccobos Grupo de I+D en Tecnologías de la Información Departamento de Sistemas Facultad de Ingeniería Electrónica y Telecomunicaciones Universidad del Cauca

Resumen Previo ¿Qué es minería de datos? ¿Por qué la minería de datos? ¿La minería de datos es totalmente automática? ¿Cómo se desarrolla un proyecto de minería de datos? Falacias de la minería de datos Tareas de la minería de datos Descripción Clasificación – Estimación – Predicción Agrupamiento por similitud (Clustering) Reglas de Asociación Aplicaciones

Proceso de Minería de Datos Los algoritmos son sólo una parte de un proceso llamado Descubrimiento de Conocimiento por los Científicos de la Computación, y Minería de Datos por los estadísticos El proceso comienza con el reconocimiento de un problema y termina con el control de una solución implementada Todo el proceso debe ser soportado por una metodología exitosa

Metodologías para la Minería de Datos Fayyad et al. (Ciencias de la Computación) WEKA SEMMA (SAS) (Estadísticos) SAS Enterprise Miner CRISP-DM (SPSS, OHRA, …) (Negocios) SPSS Clementine Abril de 2004 http://www.kdnuggets.com/polls/2004/data_mining_methodology.htm

Metodología de Fayyad Conocimiento Datos Transformados Patrones Interpretación y evaluación Datos Procesados Minería de datos Datos Objetivo Transformación y selección de características Pre procesamiento y limpieza Selección Datos

Metodología SEMMA Soportado por SAS Enterprise Mining SAMPLE EXPLORE Datos de entrada, Muestreo, Partición de datos EXPLORE Explorar distribuciones, Visualizar, Entender, Asociar, Selección de variables MODIFY Transformación de variables, Filtrar valores extremos (anómalos), Agrupación, SOM / Kohonen MODEL Regresiones, Árboles de Decisión, Redes Neuronales, Inducción de reglas ASSESS Evaluación, Puntuación, Reporte

Metodología CRISP-DM CRoss-Industry Standard Process for Data Mining Desarrollada por compañías de minería de datos (SPSS, NCR, OHRA, ChryslerDaimler) y fundada por la Comisión Europea Independiente de herramientas Independiente de la industria Modelo de proceso jerárquico

Metodología CRISP-DM Mapeo de modelos generales a especializados El Dominio de aplicación- área específica en la que se desarrolla el proyecto El Tipo de Problema de minería de datos Aspectos Técnicos de cada proyecto (valores faltantes, anómalos, otros) Las Herramientas y técnicas de minería de datos del proyecto Existen dos tipos de mapeos: Mapeando para el presente: Para un solo Proyecto, denominado sencillo Mapeando para el Futuro: Para un contexto predefinido teniendo como base experiencias pasadas. Sirve para orientar proyectos de contextos similares

Metodología CRISP-DM Determinar objetivos del negocio Background Criterios de éxito del negocio Evaluar la situación Inventario de recursos Requerimientos, supuestos y restricciones Riesgos y contingencias Terminología Costos y beneficio Determinar objetivos de la minería de datos Objetivos de la minería de datos Criterios de éxito de la minería de datos Construir plan del proyecto Plan del proyecto Evaluación inicial de herramientas y técnicas. Comprensión del negocio Análisis de los datos Preparación de los datos Modelamiento Evaluación Despliegue Datos

Metodología CRISP-DM Recolección inicial de datos Comprensión del negocio Análisis de los datos Preparación de los datos Modelamiento Evaluación Despliegue Datos Recolección inicial de datos Reporte de la recolección Inicial de datos. Descripción de datos Reporte de descripción de datos Exploración de datos Reporte de exploración de datos Verificar la calidad de los datos Reporte de calidad de los datos

Metodología CRISP-DM Selección de datos Razón para inclusión/exclusión Limpieza de datos Reporte de limpieza de datos Construcción de datos Atributos derivados Registros generados Integración de datos Formato de datos Reformateo de datos Comprensión del negocio Análisis de los datos Preparación de los datos Modelamiento Evaluación Despliegue Datos

Metodología CRISP-DM Seleccionar la técnica de modelado Supuestos del modelado Generar el diseño de test Diseño del test Construir el modelo Configuración de parámetros Modelo Descripción del modelo. Evaluación del modelo Revisión de la configuración de parámetros Comprensión del negocio Análisis de los datos Preparación de los datos Modelamiento Evaluación Despliegue Datos

Metodología CRISP-DM Evaluar los resultados Comprensión del negocio Análisis de los datos Preparación de los datos Modelamiento Evaluación Despliegue Datos Evaluar los resultados Evaluar los resultados de minería de datos Vs. los criterios de éxito del negocio. Aprobar modelos Revisar el proceso Revisión del proceso Determinar el siguiente paso Lista de posibles acciones Decisión

Metodología CRISP-DM Plan de despliegue Comprensión del negocio Análisis de los datos Preparación de los datos Modelamiento Evaluación Despliegue Datos Plan de despliegue Plan de monitoreo y mantenimiento Producir los reportes finales Reportes finales Presentación final Revisión del proyecto Documentación de experiencias

Breve Comparación de Metodologías Datos Datos Objetivo Datos Procesados Datos Transformados Patrones Conocimiento Selección Pre procesamiento y limpieza Transformación y selección de características Minería de datos Interpretación y evaluación Comprensión del negocio Análisis de los datos Preparación de los datos Modelamiento Evaluación Despliegue Datos SAMPLE Datos de entrada, Muestreo, Partición de datos EXPLORE Explorar distribuciones, Visualizar, Entender, Asociar, Selección de variables MODEL Regresiones, Árboles de Decisión, Redes Neuronales, Inducción de reglas MODIFY Transformación de variables, Filtrar valores extremos (anómalos), Agrupación, SOM / Kohonen ASSESS Evaluación, Puntuación, Reporte

Referencias Discovering knowledge in Data: An Introduction to Data Mining. Daniel T. Larose. John Wiley & Sons, Inc. 2005. ISBN 0-471-66657-2 Pete Chapman, Julian Clinton, Randy Kerber and other. CRISP-DM 1.0. Step-by-step data mining guide, 1999-2000. SPSS Inc. Análisis y Extracción de Conocimiento en Sistemas de Información: Datawarehouse y Datamining. Departamento de Sistemas Informáticos y Computación. Universidad Politécnica de Valencia. http://www.dsic.upv.es/~jorallo/cursoDWDM. Wang, John (Editor). Data Mining: Opportunities and Challenges. Hershey, PA, USA: Idea Group Inc., 2003.