La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Business Intelligence y Data Mining

Presentaciones similares


Presentación del tema: "Business Intelligence y Data Mining"— Transcripción de la presentación:

1 Business Intelligence y Data Mining

2 Preguntas y respuestas
¿Cuál es el valor de los clientes? ¿Cuáles son los clientes que tienen mayor probabilidad de abandonar? ¿Cuáles son los productos que se venden en forma conjunta? Respuestas Están en los datos del usuario Como las encontramos????

3 Business Intelligence
“Es un paraguas bajo el que se incluye un conjunto de conceptos, metodologías y procesos cuya misión consiste en mejorar el proceso de toma de decisiones en los negocios basándose en hechos y sistemas que trabajan con hechos” Howard Dresner (Gartner Group), 1989

4 Business Intelligence Recursos y herramientas
Fuentes de datos: Base de Datos de Marketing, Data Warehouse de la compañia, Datamarts, etc. Herramientas de extracción y consulta. Herramientas de modelización o tecnicas de Data Mining

5 ¿Qué es Data Mining? (1997) Data Mining: es el proceso de exploración y análisis (de manera automática o semiautomática) de los datos para obtener patrones significativos y reglas de negocio. Michael Berry, Gordon Linoff Data Mining for marketing, sales and customer support. Wiley, USA, 1997

6 Qué NO es Data Mining No es un producto que se compra enlatado sino una disciplina que debe ser dominada. No es una solución instantánea a los problemas de negocio. No es un fin en sí mismo sino un proceso que ayuda a encontrar soluciones a problemas de negocio.

7 ¿Qué es la estadística? Es la disciplina que extrae información general a partir de datos específicos. Es el estudio de la estabilidad en la variación. Es el arte de examinar, sumarizar y extraer conclusiones a partir de los datos.

8 Data Mining y estadística
En la minería de datos, no se hacen supuestos a priori sobre la naturaleza de las variables y de las relaciones entre ellas (normalidad, linealidad, etc). Los algoritmos estadísticos se adaptan – para Minería de Datos – al procesamiento de grandes volúmenes de datos.

9 Descubrimiento de la información
Desarrollado por un Analista Asistido por un Analista Mayormente a través de Algoritmos Querys y reportes Analisis Multidimensional Data Mining

10 Pilares del proceso de Data Mining
Datos Algoritmos y Técnicas (Software) Prácticas De modelización

11 Un proyecto genérico Comprensión del Negocio Comprensión de los Datos
Preparación de los Datos Desarrollo del Modelo Testing del Modelo Implementación

12 El analista de datos Usuarios de negocio Tecnología informática
Es el vínculo entre las áreas de tecnología informática y las áreas de negocios. Traduce los requerimientos de información en preguntas apropiadas para su análisis con las herramientas de minería. Realimenta el Data Warehouse de la compañía con nuevos criterios de Data Cleaning y Data Validation. Usuarios de negocio Tecnología informática

13 Habilidades requeridas
Capacidad para manipular datos Conocimiento de lenguaje SQL (Lenguaje de consulta de datos) Conocimiento de herramientas para manipular datos Conocimiento de las técnicas de minería y análisis exploratorio Habilidad de comunicación (interpretación) de los problemas de negocio Creatividad Manejo de relaciones interpersonales con varias disciplinas (IT, Marketing, Finanzas, Comunicación, etc)

14 Tipos de fuentes de datos
Transaccionales Ej.: las operaciones realizadas con tarjeta de crédito. Relacionales Ej.: la estructura de los productos que ofrece el banco. Demográficos Ej.: características del grupo familiar.

15 Garbage in – Garbage Out
La calidad de los datos El Data Mining se relaciona directamente con la CALIDAD de los datos. Garbage in – Garbage Out Se debe identificar los datos faltantes “missings” o fuera de rango “outliers”.

16 Problemas con los datos
Demasiados datos: Datos corruptos o con ruido Datos redundantes (requieren factorización) Datos irrelevantes Excesiva cantidad de datos (muestreo) Pocos Datos Atributos perdidos (missings) Valores perdidos Poca cantidad de datos Datos facturados Datos incompatibles Múltiples fuentes de datos

17 Algoritmos de Data Mining

18 Algoritmos de Data Mining
Al hablar de Data Mining tenemos que hablar de los Algoritmos de Data Mining. Los algoritmos son técnicas y procedimientos (en muchos casos basados en la estadística) implementados para descubrir o inferir patrones de información

19 Algoritmos de Data Mining
Las funciones más comunes de estos algoritmos son las siguientes: Clasificación Estimación Predicción (Caso Disco) Agrupamiento a partir de reglas de asociación (Caso Disco) Construcción de Grupos Descripción y visualización

20 Problemas usuales Canasta de consumo de tarjetas de crédito y prevención de fraudes. Caracterización de perfiles de clientes para definir acciones de Up Selling y Cross Selling Tracking de campañas y predicción de respuesta / no respuesta. Modelos de predicción de abandono Programas de millaje y Fidelización. Consolidación de Bases de Datos propias con fuentes externas. Web Mining y análisis de tráfico y uso de recursos de e-business.

21 Un caso de segmentación: ¿Quiénes son mis clientes?

22 ¿Qué es “clustering? Es la partición del conjunto de individuos en subconjuntos lo más homogéneos posibles. El objetivo es maximizar la similitud de los individuos del cluster y maximizar las diferencias entre clusters.

23 Aplicaciones de la técnica
Segmentación de la base de datos Detección de fraudes Detección de defectos

24 ¿Con qué criterio se agrupan esta caras?
Casos Un Criterio

25 Distancias y similaridades
La distancia entre dos objetos es la medida del intervalo que los separa. Las distancias no siempre se miden con “un metro”. La similaridad entre dos objetos es la medida de su cercanía. Disimilaridad es el término opuesto y se relaciona con distancia.

26 Preguntas


Descargar ppt "Business Intelligence y Data Mining"

Presentaciones similares


Anuncios Google