Rafael Zamora Garrido Julio 2009. 2 Ejemplos de objetivos de Minería de Datos Reducir las bajas de clientes actuales en un 5%. Aumentar las contrataciones.

Slides:



Advertisements
Presentaciones similares
¿ Que es una muestra?.
Advertisements

Segmentación, Definición de Público Objetivo y Posicionamiento
ANÁLISIS DE CONGLOMERADOS
Data Mining Minería de Datos Universidad Tecnológica Metropolitana
Introducción a la minería de datos
DATA MINING MINERIA DE DATOS Gersom Costas.
DATA WAREHOUSE Presentador Por: Andrés Fabián Cortes Solano.
PLANIFICACIÓN Y CONTROL DE LA PRODUCCIÓN
Master en Recursos Humanos
Inicio de la aplicación con acceso multiempresa y selector de usuarios, con la intención de personalizar el perfiles de la aplicación.
ESTRATEGIAS A NIVEL DE NEGOCIOS
• SQL Server Analysis Services Data Mining
Data Mining Integrantes: Rojas Correa, Trinidad Romanskyy, Bohdan
K-NN: K vecinos más cercanos
COMPONENTIZACIÓN DE ALGORITMOS GENETICOS Y SU IMPLEMENTACIÓN EN UNA PLATAFORMA ABIERTA PARA APRENDIZAJE COMPUTACIONAL.
K-Means Integrantes Natalia Merino (85828) Gastón Sabatelli (85523)
VIVIANA ACHURY S. ANGIE NATALIA GARCIA S.. En los últimos años, ha existido un gran crecimiento en nuestras capacidades de generar y colectar datos (Bajo.
Especialista en Business Intelligence Analysis Services SSAS (Sesión 14) Microsoft SQL Server 2008 R2 Suscribase a o escríbanos a
K-Means Integrantes Natalia Merino (85828) Gastón Sabatelli (85523)
Especialista en Business Intelligence Analysis Services SSAS (Sesión 14) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
RIESGOS FINANCIEROS FACULTAD DE CIENCIAS CARRERA: ING. EN CIENCIAS ECONÓMICAS Y FINANCIERAS PERIODO: Ing. Marcela Guachamín.
Expositor: Yibran Ortegón
INTELIGENCIA DE NEGOCIOS
Taller de Base de Datos Profesor: Claudio Gutiérrez Soto página: Fono: Minería.
FUNDAMENTOS DE DATA MINING Y SUS APLICACIONES N. QUEIPO, S. PINTOS COPYRIGHT 2000 CLASIFICACIÓN NO SUPERVISADA.
Minería de Datos con Clementine
RECONOCIMIETO DE PATRONES
Medición del Mercado.
Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".
Aprendizaje Automático en Bioinformática
Estadística aplicada al análisis financiero
Weka.
Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".
Business Intelligence y Data Mining
SERIES DE TIEMPO INTEGRANTES :.
RESUMEN En este artículo se describe en forma breve una de las líneas de investigación que se están llevando a cabo en el Laboratorio de Tecnologías Emergentes.
Mt. Martín Moreyra Navarrete.
• SQL Reporting Services
Proceso KDD MSc. Carlos Alberto Cobos Lozada
ERICK CISNEROS SAAVEDRA GABRIELA REGULES GUTIÉRREZ Datamining.
Software CRM.
COMPUTO III Ing. Jimmy Ojeda Arnica.
¿Por qué usar Data Mining?  Proporciona un punto de encuentro entre los investigadores y las personas de negocios.  Ahorra grandes cantidades de dinero.
1 Prof:Paula Quitral INTRODUCCIÓN MINERIA DE DATOS Departamento de Informática Universidad de Rancagua.
Análisis sectorial: objetivos, limitaciones
Sistemas Expertos Integrantes Javier Farfán Katherine Jara Héctor Gatica.
Alexander Aristizabal Ángelo flores herrera
Reconocimiento de caras usando Histogramas de Gradientes Orientados
SEGMENTACION DE MERCADOS
DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.
Métodos de Pronostico Suscribase a
KDD y Técnicas de Minería de Datos en Weka
U.D.5. EL SIM Y LA IM EL SIM Conjunto de personas, equipos y procedimiento capaces de recoger, clasificar, analizar, evaluar y distribuir la información.
G R U P O I B E R M Á T I C A Analítica Avanzada & Linked Data.
Toma de decisiones Plataforma.
CLASIFICACIÓN SUPERVISADA
RIESGO, RENDIMIENTO Y VALOR
Es la capacidad de recolectar datos del entorno, transformar esos datos en información y, a su vez, transformar esa información en conocimiento.
Taller de Inteligencia de Negocios SQL Server Analysis Services Data Mining Semana 11.
Minería de Datos MC BEATRIZ BELTRÁN MARTÍNEZ FACULTAD DE CIENCIAS DE LA COMPUTACIÓN. Primavera 2016.
DATA MINING. Extracción de información oculta y predecible de grandes bases de datos Poderosa tecnología que ayuda a concentrase en la información importante.

Selección y / o Diagnóstico Oliva Rosales Nancy Jácome Luis Zamora, Ragueb Chain, Juan Carlos Ortega.
Estadística descriptiva
Taller: El Uso de Analytics en la Vida de un Actuario (Un Océano de Oportunidades) 15 de Julio de 2010 Pablo FondevilaGustavo Grinblat Coordinador Socio.
Curso de programación Visual Chart 6 (1ªEd.)
REDES NEURONALES ARTIFICIALES (SOM - Kohonen)
Transcripción de la presentación:

Rafael Zamora Garrido Julio 2009

2 Ejemplos de objetivos de Minería de Datos Reducir las bajas de clientes actuales en un 5%. Aumentar las contrataciones de nuevos clientes en un 8%. Aumentar la facturación de venta cruzada de productos a clientes actuales en un 3%. Predecir los clientes más propensos a contratar un nuevo producto con un 75% de precisión. Predecir qué clientes nos abandonarán en los próximos 6 meses.

3 ¿Qué es Data Mining? proceso La minería de datos es un proceso de análisis de datos cuyo objetivo es la identificación y extracción de conocimiento a partir de los datos. La minería de datos analiza datos con herramientas sofisticadas, que permiten la búsqueda de relaciones complejas en los datos. SQL La minería de datos se caracteriza por el descubrimiento de nuevo conocimiento, la cual contrasta con el enfoque de SQL, por ejemplo, que se limita a procesar y presentar los datos ya existentes en la base de datos.

4 ¿Qué es Data Mining? Estadística clásica Algoritmos de aprendizaje para clasificación y predicción Exploración de datos usando herramientas para su visualización gráfica y manipulación (Weka) técnicas La minería de datos utiliza diversas técnicas para analizar y procesar los datos:

5 Técnicas de Minería de Datos Clustering clustering El objetivo del clustering es definir grupos (o clusters) dentro de los cuales los casos (o los clientes) sean lo más parecidos posible. Por otra parte, los diferentes clusters deben ser, entre sí, lo más distintos posible. Ejemplo: Podemos definir dos clusters: los clientes más rentables y los clientes menos rentables. Dentro del cluster de los clientes más rentables, todos los clientes deben tener una rentabilidad por encima de un determinado umbral. Segmentación La segmentación es la división (o partición) de la totalidad de los datos en segmentos, según determinados criterios. Ejemplo: Clientes de banca Como ejemplo de segmentación, podemos considerar una base de datos de clientes de banca. Una segmentación útil sería en términos de rentabilidad: podríamos identificar tres grupos, los más rentables, los de rentabilidad media y los menos rentables. Para cada grupo podríamos identificar una serie de características. Por ejemplo, en el grupo de los clientes más rentables, la media de edad del cliente es de 49 años, mientras que en el grupo de los clientes menos rentables, la media de edad es de 27 años.. clustering segmentación Nota: No hay que confundir clustering con segmentación. La segmentación se usa para identificar grupos que tienen características comunes.

6 Técnicas de Minería de Datos Clasificación Consiste en examinar las características de una entidad nueva y asignarle una clase predefinida. Por ejemplo: Clasificar a un nuevo cliente según su riesgo de crédito (alto, medio, bajo). Ejemplo: Un ejemplo de una técnica de clasificación es la inducción de reglas; otro ejemplo es la red neuronal. La inducción de reglas La inducción de reglas crea un modelo construido a partir de reglas tipo if-then-else (si-entonces-si no). En general funciona tanto para valores numéricos como para valores categóricos. Los modelos tienen una serie de variables de entrada y una o más variables de salida, pero en contraste con las redes neuronales, se puede ver cómo llegan al resultado o salida. Por ejemplo, un modelo muy sencillo tendría tres variables de entrada, edad, estado civil, cuenta de ahorro, y una de salida, contrata hipoteca. Las dos reglas de proceso (el modelo de datos) podrían ser: "Si edad es entre 18 y 40 años y estado civil es casado y cuenta de ahorro = si entonces contrata hipoteca ⇒ si (18450,78%)" o "Si edad es mayor de 40 años y estado civil es casado y tiene cuenta de ahorro = no entonces contrata hipoteca ⇒ no (17490,66%)".

7 Técnicas de Minería de Datos Predicción A partir de un conjunto de datos históricos con resultado conocido, se pretende modelizar estos datos para conocer resultados futuros. Ejemplo:  Los clientes más probables a comprar un nuevo producto,  el pronóstico de un paciente,  las agrupaciones de clientes más rentables, etc. Un modelo predictivo tiene unas variables de entrada, tiene una o más variables de salida, y tiene un proceso intermedio que actúa sobre las entradas para producir la salida. Variables de Entrada Proceso Variables de Salida Asociación  Las asociaciones se identifican basándose en frecuencias entre los casos.  Se pueden identificar manualmente, pero hay herramientas que pueden hacerlo de forma automática.  Es una técnica particularmente útil en el análisis tipo " cesta de la compra " de ventas en supermercados y tiendas en general, y permite identificar productos que se suelen comprar juntos.

8 Modelos CRM Propensión de Compra Prospección de clientes nuevos. Identificar a los clientes más propensos en comprar producto/servicio. Venta Cruzada Clientes actuales, potenciar sus compras, ofrecerles otros productos/servicios. Retención Identificar clientes con más riesgo de darse de baja y realizar acciones para retenerles. Otros Modelos Win-Back: Recuperar clientes inactivos Detección de fraude: Identificar patrones atípicos Estudios de casuística: Identificar perfiles que diferencian a los clientes (regalo, descuento)

9 Creación de Modelos de Datos Definición de un objetivo de negocio Definición de un conjunto de datos Selección de variables Análisis de los datos usando diferentes técnicas. Creación de modelos de datos Pasos para la creación de modelos de datos: Ahora deberíamos disponer de un conjunto de datos con las variables seleccionadas, que podríamos dar como entradas a las técnicas de modelización

10 Ejemplo creación de Modelos de Datos Las dos reglas de proceso (el modelo de datos) podrían ser: "Si edad es joven y estado civil es soltero y tiene vivienda propia = no entonces compra coche deportivo ⇒ si (1500,65%)" o "Si edad es mediana y estado civil es casado y tiene vivienda propia = si entonces compra coche monovolumen ⇒ si (2800,72%)" Ejemplo (Proceso de inducción de C4.5) variables descriptivas Suponemos que disponemos de un fichero de datos de clientes con una serie de variables descriptivas sobre ellos: edad; estado civil con posibles valores casado, soltero, divorciado, viudo y sin especificar; vivienda propia con posibles valores sí y no. variable de salida Para cada cliente, también disponemos de una variable de salida que indica el tipo de coche que ha comprado con posibles valores coche deportivo, monovolumen, etc. La idea es entrenar un modelo predictivo con estos datos para que sea capaz de predecir con una alta precisión el tipo de coche que una persona comprará, únicamente a partir de los datos de entrada. La inducción de reglas crea un modelo construido a partir de reglas tipo "if-then-else" (si-entonces-si no). En general funciona tanto con valores numéricos como para valores categóricos. Los modelos otra vez tienen una serie de variables de entrada y una o más variables de salida, pero se diferencian de las redes neuronales en que se puede ver cómo llegan al resultado o salida. Suponemos que hemos dado los datos de entrada a la técnica C4.5, y ha producido un modelo de datos predictivo a partir de ellos. Por ejemplo, un modelo muy sencillo tendría las tres variables de entrada, edad, estado civil, vivienda propia, y una de salida, compra coche tipo....

11