Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".

Slides:



Advertisements
Presentaciones similares
Creación de Empresas.
Advertisements

Data Mining Minería de Datos Universidad Tecnológica Metropolitana
ANALISIS DE RIESGOS.
DATA MINING MINERIA DE DATOS Gersom Costas.
DATA WAREHOUSE Presentador Por: Andrés Fabián Cortes Solano.
Evaluaciones de Sistemas de Administración de la Seguridad SMSA
EL DIRECTIVO FRENTE A LOS PROBLEMAS
¿ CÓMO ACCEDER EXITOSAMENTE AL FINANCIAMIENTO ? Por: José Miguel Guzmán Consultor y Socio de Guzmán Riesco Ltda. CLASE MAGISTRAL:
CLIENTE / PROVEEDOR.
Requisitos para Validación del Sistema de Planificación y Control de Gestión PMG 2003 Dirección de Presupuestos Ministerio de Hacienda Patricia Montes.
Data Mining Integrantes: Rojas Correa, Trinidad Romanskyy, Bohdan
El proceso de extracción de conocimiento
SISTEMA DE NACIMIENTOS MANUAL DEL USUARIO. El objetivo del presente manual es servir de guía al usuario final para interactuar con el Sistema, permitiéndole.
VIVIANA ACHURY S. ANGIE NATALIA GARCIA S.. En los últimos años, ha existido un gran crecimiento en nuestras capacidades de generar y colectar datos (Bajo.
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
Conjunto de características personales que se relacionan directamente con el desempeño a nivel laboral y son derivadas de la suma de los conocimientos,
ANÁLISIS Y DISEÑO DESDE UNA PERSPECTIVA ORIENTADA A OBJETOS Alan Vargas.
UNIVERSIDAD CATÓLICA DEL MAULE FACULTAD DE CIENCIAS DE LA INGENIERÍA ESCUELA DE INGENIERÍA CIVIL INFORMÁTICA PROFESOR GUÍA: HUGO ARAYA CARRASCO. ALUMNO.
Maestría en Tecnologías de la Información
INTELIGENCIA DE NEGOCIOS
VII Reunión sobre casos prácticos de inspección y vigilancia de mercados y entidades. Santiago de Chile Marcelo García R Sonia Muñoz C. Santiago, 17 de.
Proceso investigativo
PROCESO DE DESARROLLO. Introducción Mediante esta presentación se pretende describir el proceso de desarrollo del TALLER I.
Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".
ETAPAS DE LA PLANEACIÓN
ANÁLISIS Y DISEÑO DE SISTEMAS
UNIDAD 1 NOMBRE DE LA UNIDAD DE TRABAJO
SISTEMAS EXPERTOS 3 créditos. General Entender que es la Inteligencia Artificial y que son los Sistemas Expertos y porque es necesaria esta ciencia y.
Business Intelligence y Data Mining
Pronósticos Los pronósticos y la planeación de la capacidad de mantenimiento son dos funciones importantes para el diseño de un sistema de mantenimiento.
DATA WAREHOUSE Equipo 9.
RESUMEN En este artículo se describe en forma breve una de las líneas de investigación que se están llevando a cabo en el Laboratorio de Tecnologías Emergentes.
AEA Investigación de Mercado Ingeniería Comercial.
AUDITORIAS DE SEGURIDAD
AUDITORIAS RESUMEN DE ASPECTOS RELEVANTE EN LA GESTION BASADO EN EL REFERENCIAL ISO 9001:2008.
La distribución Ing. Enrique Meneses.
TEORÍA DE LA DECISIÓN Claudia Stephanie Jiménez Zapata
METODOS CUANTITATIVOS PARA LA TOMA DE DECISIONES
La Información en las Organizaciones. Datos Externos Datos Internos Datos Personales Data Mining Data Warehouse Data Marts Meta Data OLAP Queries DSS.
Proceso KDD MSc. Carlos Alberto Cobos Lozada
Plan de Sistemas de Información (PSI)
Introducción a Pentaho BI Suite 3.5
1 TEMA 1: NECESIDAD DE LA INFORMACIÓN PARA LA TOMA DE DECISIONES EN LA EMPRESA Las bases de datos ocupan un lugar determinante en cualquier área. No sólo.
Software CRM.
ELEMENTOS DE CONTENIDO Y ALCANCE
1 Prof:Paula Quitral INTRODUCCIÓN MINERIA DE DATOS Departamento de Informática Universidad de Rancagua.
SEGMENTACION DE MERCADOS
DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.
Profesora: Kinian Ojito Ramos
KDD y Técnicas de Minería de Datos en Weka
Perfil del Puesto - Encontrar la persona de acuerdo al perfil: Llegar a seleccionar al candidato, cumpliendo la identidad “puesto-persona”, es lograr.
Regresión Lineal Simple
Administración Integral del Proyecto
Comité de compras.
Fundamentos de la Gerencia de Proyectos
MARKETING PERFORMANCE DRA. ICELA LOZANO. El Performance Marketing como su nombre lo indica está orientado a resultados, es decir, producir ROI (retorno.
Aplicar los conceptos y las herramientas para la administración de la calidad y gestión de riesgos del plan del proyecto. MTRA. VERÓNICA NOHEMI TAVERNIER.
Taller de Inteligencia de Negocios SQL Server Analysis Services Data Mining Semana 11.
TAREAS DEL CONTROL DE CALIDAD
DATA MINING. Extracción de información oculta y predecible de grandes bases de datos Poderosa tecnología que ayuda a concentrase en la información importante.
Identificación de entradas, salidas y herramientas de procesos de gestión del PMI Jairo A. Orozco L.

Procesos de Planeación
 La definición y componentes básicos de las competencias profesionales.  Los procedimientos empleados por las organizaciones para identificar sus competencias.
INDICADORES DE DESEMPEÑO DE LA CONTRATACIÓN PÚBLICA EN EL ECUADOR
Abastecimiento Dr. Ing. Aldo Cea Ramírez Gestión de Abastecimiento Es la acción de buscar mejoras permanentes al realizar compras utilizando los.
Rafael Zamora Garrido Julio Ejemplos de objetivos de Minería de Datos Reducir las bajas de clientes actuales en un 5%. Aumentar las contrataciones.
Naturaleza / concepciones Fin y funciones Papel del evaluador Criterios de evaluación QUÉ ES LA EVALUACIÓN.
Transcripción de la presentación:

Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 3 Proceso KDD José Antonio Lipari A.

Proceso KDD Knowledge Discovery in Databases Transformación Datos Datos se-leccionados Preprocesamiento Datos pre-procesados Datos transformados Data Mining Patrones Interpretación y Evaluación Selección “KDD es el proceso no-trivial de identificar patrones previamente desconocidos, válidos, nuevos, potencialmente útiles y comprensibles dentro de los datos“

Proceso KDD Knowledge Discovery in Databases Novedoso: que sea un aporte para el sistema o para el usuario Valido: que sea repetible a futuro con nuevos datos KDD Útil:que pueda traducirse en acciones concretas Comprensible: que se entienda es básico para cumplir las 3 características anteriores.

Proceso KDD Knowledge Discovery in Databases Selección: Acordar objetivo del proyecto KDD y acordar con usuario variables relevantes para cumplir con el objetivo Exploración de datos a fin de chequear bondad de la información (datos erróneos, faltantes, sin consolidar) Elección de bases de datos a utilizar y variables relevantes Evaluar creación de Data Mart o Flat table y acumulación de información histórica

Proceso KDD Knowledge Discovery in Databases Preprocesamiento: Identificar datos que se utilizarán y tienen problemas (erróneos, faltantes o fuera de rango) Decidir modo de enfrentar datos con problemas: Eliminar registros, imputar registros Desarrollo de modelos de imputación de registros con problemas

Proceso KDD Knowledge Discovery in Databases Transformación: Analizar correlación entre variables (en general variables muy correlacionadas no aportan información) Reuniones con los entendidos en el negocio, para discutir correlaciones encontradas Creación de nuevas variables e indicadores que podrían ser útiles para lograr el objetivo del proyecto KDD

Proceso KDD Knowledge Discovery in Databases Data Mining: Generación de muestreos aleatorios de ser necesario División de datos en Entrenamiento Validación y Testeo Desarrollo de modelos predictivos utilizando variadas técnicas y definiendo parámetros del algoritmo de acuerdo a los conocimientos del modelador

Proceso de KDD Knowledge Discovery in Databases Interpretación y evaluación: Se utiliza la base de testeo para verificar que el modelo es capaz de hacer una predicción Se evalúa el nivel de la predicción con una visión clara de gestión que se realizará Se interpretan los resultados en conjunto con expertos del negocio

Aplicación de proceso KDD. Caso Práctico. Predicción de Compra INICIO El primer paso, implícito necesario en el proceso KDD es definir el objetivo final El objetivo es identificar dentro de la base de Cuenta correntistas un conjunto de clientes interesados en adquirir una crédito de consumo Definir este objetivo es importante porque el proyecto debiera ser evaluado en función de este objetivo. Por ejemplo, aumentar las colocaciones del banco en 10% respecto a igual período del año pasado.

Aplicación de proceso KDD. Caso Práctico. Predicción de Compra SELECCIÓN ¿Preguntarse cuales de los datos disponibles por el banco podrían ser útiles para predecir la compra o adquisición de un crédito de consumo, y aún más importante, que datos relevantes no están disponibles y hay que solicitar? Responder a esto probablemente requiera de algo de visión de negocio y experiencia en construcción de otros modelos

Aplicación de proceso KDD. Caso Práctico. Predicción de Compra SELECCIÓN Campo Estado Edad OK Monto credito Uso Línea C Comuna donde Vive Solo hay un string con dirección Saldo Promedio CC Renta Está desactualizada alto% Endeudamiento en Sbif OK, considerar no están incluidas casas comerciales Fecha última solicitud de Crédito NO está disponible

Aplicación de proceso KDD. Caso Práctico. Predicción de Compra SELECCIÓN 0% Datos Missing

Aplicación de proceso KDD. Caso Práctico. Predicción de Compra SELECCIÓN 20% Datos Missing

Aplicación de proceso KDD. Caso Práctico. Predicción de Compra SELECCIÓN Campo Estado Acción Edad Problemas carga Solicitar corrección de datos a administrador Monto Crédito OK Nada Uso Línea C Indefinición Dar coherencia, agregar campo posesión de productos Comuna donde Vive Solo hay un string con dirección Solicitar extracción campo Comuna Saldo Promedio CC Renta Está desactualizada alto% Solicitar renta estimada Riesgo Endeudamiento en Sbif OK, considerar no están incluidas casas comerciales Solicitar Infor casas Comerciales Fecha última solicitud de Crédito NO está disponible Solicitar carga en sistemas de datos Adicionalmente, si se pretende utilizar esta información períodicamente se requerirá la construcción de Un flat table con las modificaciones solicitadas y que se cargue períodicamente a través de ETL (extraction tranformation, load) que acumule información con historia.

Aplicación de proceso KDD. Caso Práctico. Predicción de Compra SELECCIÓN MES 1 MES 2 MES 3 MES N Historia acumulada de N meses en formato y contenido apropiado para análisis Actualización periódica de el último tablón DW ETL

Aplicación de proceso KDD. Caso Práctico. Predicción de Compra PREPROCESAMIENTO Se analizan las respuestas frente a solicitudes de cambio de datos y se procede a modificar los datos deacuerdo a los objetivos planteados por el proyecto. Campo Respuesta de responsable de datos Acción Data Mining Edad Problema corregido Nada Monto Credito OK Uso Línea C No es posible corregir Se imputan missisng con “NA” Comuna donde Vive No es posible corregir en corto plazo Se programa identificador de comuna dentro de glosa Saldo Promedio CC Renta Se entrega estimación de Riesgo Endeudamiento en Sbif La información de casas comerciales no está disponible Nada, se renuncia a esa información Fecha última solicitud de Crédito Se cargará a partir del próximo mes Se considera se existecia para análisis futuros

Aplicación de proceso KDD. Caso Práctico. Predicción de Compra TRANSFORMACION Se analizan los Datos corregidos y se buscan relaciones “interesantes” que según experiencia de gente de negocios y data mining podrían mejorar las correlaciones. Por ejemplo: Construcción de variables derivadas RAZON_ ENDEUDAMIENTO = ENDEUDAMIENTO/ RENTA

Aplicación de proceso KDD. Caso Práctico. Predicción de Compra DATA MINING Se construye una base orientada a conseguir el objetivo definido, esto implica definir la variable objetivo, una vez definida ésta, se aplican técnicas como sobremuestreo , muestreo aletorio etc para optimizar el manejo de datos. En este caso, es un modelo supervisado de clasificación Eliminar Variable Objetivo Variables predictoras Identificador

Aplicación de proceso KDD. Caso Práctico. Predicción de Compra DATA MINING Se construye una base orientada a conseguir el objetivo definido, esto implica definir la Variable objetivo, una vez definida ésta, se aplican técnicas como sobremuestreo , muestreo aletorio etc para optimizar el manejo de datos. En este caso, es un modelo supervisado de clasificación Validación 5.000 10.000 Base Total Entrenamiento 5.000

Aplicación de proceso KDD. Caso Práctico. Predicción de Compra DATA MINING Se construye un modelo predictivo utilizando variadas técnicas de Data Mining, en la práctica el modelo buscará separar las bases en el perfil de los que compran vs el perfil de los que no compran utilizando las variables contenidas en la base de entrenamiento Validación Variadas técnicas: Árboles de decisión Redes neuronales Regresiones SVM Modelo Predictivo Entrenamiento

Aplicación de proceso KDD. Caso Práctico. Predicción de Compra Una interpretación de este modelo podría llevar a la conclusión de que el perfil del cliente que se endeuda es alguien con tendencia a endeudarse y mas bien joven. INTERPRETACION DE RESULTADOS Nota: Las tendencias aquí presentadas son únicamente referenciales, creadas a modo de ejemplo para la clase. Compra 50% No compra 50% Compra 30% No compra 70% Compra 75% No compra 25% Razon _endeudamiento >7 Hace sentido el resultado Compra 40% No compra 60% Compra 90% No compra 10% Edad <38 años

FIN