La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Ana Drozdowskyj Analytical Solutions Product Manager SAS Spain Copyright © 2000, SAS Institute Inc. All rights reserved. Data Mining:Un proceso para llegar.

Presentaciones similares


Presentación del tema: "Ana Drozdowskyj Analytical Solutions Product Manager SAS Spain Copyright © 2000, SAS Institute Inc. All rights reserved. Data Mining:Un proceso para llegar."— Transcripción de la presentación:

1 Ana Drozdowskyj Analytical Solutions Product Manager SAS Spain Copyright © 2000, SAS Institute Inc. All rights reserved. Data Mining:Un proceso para llegar al conocimiento a partir de los datos

2 Agenda Ø Introducción Ø Data Mining en la obtención de conocimiento Ø ¿Qué nos aporta SAS ? Ø Casos prácticos Ø Conclusiones

3 Data Mining Introducción

4

5 Los datos y Data Mining El objetivo: Knowledge is the only competitive Advantage Jack Welch, CEO, General Electric Knowledge is the only competitive Advantage Jack Welch, CEO, General Electric

6 Los datos y Data Mining La situación actual: Computers promised us a Fountain of Wisdom, but delivered us a Flood of Data Gregory Piatetsky-Shapiro, 1991 Computers promised us a Fountain of Wisdom, but delivered us a Flood of Data Gregory Piatetsky-Shapiro, 1991

7 ¿Necesitan lo mismo todos mis clientes ?

8 ¿Hay realmente diferencias?

9 Data Warehousing Tecnologías involucradas Análisis multidimensional y distribución via aplicaciones web Data Mining

10 Data Mining es el proceso de selección, exploración y modelización de grandes volúmenes de datos para descubrir patrones ocultos k que aporten un beneficio para la empresa DATA MINING, Una definición conocida...

11 Data Mining en la obtención de conocimiento Transformar Datos en información Actuar según la información Pregunta de negocio Data Warehouse DBMS Proceso de Data Mining EIS, Business Reporting, OLAP Identificar el problema Medir resultados

12 Entornos de aplicación de Data Mining CRM- Gestión de las relaciones con los clientes Buscar Recuperar Adquirir Fidelizar Rentabiliza r Retener Finanzas: Rentabilidad, Retención, Fraude Investigación : Medicina, Medioambiental

13 ¿Cómo hacer Data Mining ?

14 Dos caminos al interior de los datos DescriptivoPredictivo

15 Análisis descriptivo

16 Análisis predictivo Buscamos características críticas desconocidas è ¿Qué perfil tienen mis mejores clientes ? è ¿Quién contestará a una promoción? è ¿Qué genes diferencian dos tipos de cancer? Usando técnicas específicas: è Regresión, árboles de decisión, redes neuronales, cluster, asociaciones y secuencias, l Que puedan Generalizarse è Aplicar el conocimiento adquirido è Evaluar los resultados

17 Ejemplo: Análisis de campañas y marketing dirigido è Optimizar el mailing de catálogos üincrementar la tasa de respuesta, estudiar catálogos personalizados è Análisis del comportamiento del cliente üUsar asociaciones para deducir patrones de compra, usar secuencias para predecir posibles compras futuras

18 ¿Qué nos aporta SAS Institute para Data Mining?

19 El ranking de las 100 mejores empresas de Business Intelligence -incluyendo Customer Relationship Management (CRM) y Data Warehousing- se ha basado en los resultados de una encuesta realizada entre los lectores de la revista y la investigación ha sido llevada a cabo por la empresa Market Perspective vía web. SAS, desde año en que se concedieron por primera vez estos premios -, ha sido la única compañía en posicionarse siempre entre las tres primeras del ranking. Según Ron Powell, director editorial de DM Review, "Aparecer en DM Review 100 demuestra el compromiso que la compañía ha adquirido con sus clientes y significa que conoce perfectamente sus necesidades y que está dispuesta a darles respuesta. SAS ha sido seleccionada por nuestros lectores como la empresa líder en soluciones e- Intelligence". Haga click en la imagen para acceder a la página de DMReview

20 Enterprise Miner Release 4.0 con SAS Release 8e Cliente: Windows 95/98/2000/NT Client Servidor: üWin NT Server; Win 2000 üMVS OS/390 üUnix: AIX, HP-UX, Sun/Solaris, Compaq Tru64 Unix, Intel ABI (incl. MP-RAS) üCompaq Tru64 Unix 4.0E

21 Acceso a los datos : DW/DBMS Decisión (BI) Metodología SEMMA

22 ¿Muestreo?ExploraciónVisual ReducciónDatos Agrupaciones,Subconjuntos Transformaciones Redes Neuronales NeuronalesArbolesDecisiónTécnicasEstadísticasAsociacionesSecuencias Comparación Modelos, Nuevas Preguntas Sample Explore Manipulate Model Assess

23 Sample (Muestreo) Partición de los datos. Training. Validación. Test

24 èTendencias principales èRango de las variables clave èFrecuencia de los valores èCorrelación entre variables èGrupos Explore (Exploración) Conocer los datos

25 Nodo Distribution Explorer Al ejecutar el nodo se pueden generar Tablas, incluyendo tablas cruzadas para variables de clasificación y estadísticas descriptivas de las variables contínuas.

26 Nodo Multiplot Genera automáticamente gráficos de distribución de cada variable. También genera gráficos que ilustran la relación de cada variable con la variable target.

27 Experiencia de negocio Transformar variables para la modelización óptima Modify (Modificación) ¿Con qué información trabajar?

28 Modelos Estadísticos RNs Arboles de decisiónSeries temporales Model (Modelización) ®Construir el modelo que responde a la pregunta planteada

29 Tree View- basado en MSF

30 Assess (Validación) Cuál es la mejor técnica?

31 Interfaz

32 Diagramas de flujo del Proceso

33 Nodo Reporter Genera automáticamente un informe con detalles y resultados del PFD. Los informes son em formato HTML Se pueden leer utilizando cualquier web browser.

34 Un ejemplo.... SAS Enterprise Miner trabajando para identificar el grupo obejtivo de una campaña de marketing....

35 Proceso completo para Data Mining SEMMA

36 Subdividir los datos del cliente para entrenar los modelos y validar los resultados

37 Explorar los datos para validar las técnicas de muestreo y descubrir nuevos patrones de compra

38 ¿La muestra es representativa de la población?

39 Segmento Gasto alto

40 Co-linelidad... Co-linealidad...

41 Modificar datos del cliente para mejorar la capacidad predictiva del modelo

42

43 Modelo de clientes para anticipar su próxima acción

44 Resultados del árbol de decisión... Hoja Pura

45 Perfil del cliente ideal

46 Validar qué modelo predice mejor el comportamiento del cliente frente a la compra Puntuar clientes

47 Grupos de clientes Respuesta capturada del Warehouse de clientes

48

49 Clasificación de Leucemia agua, usando Perfil de expresión genética La leucemia linfoblástica aguda y la leucemia mieloide aguda, presentan síntomatología similar La distinción de los dos cánceres es crítica para un tratamiento eficaz Se uitliza Data Mining para identificar los genes que difrencian claramente los dos cánceres -- asegurando un tratamiento adecuado de los pacientes

50 Datos para la investigación Fichero de Training : 38 pacientes: 11 AML (Leucemia Mieloide Aguda) 27 ALL (Leucemia Linfoblástica Aguda) - 19 Células B-, 8 Células T Fichero de Test : 34 pacientes: 14 AML 20 ALL - 19 células B, 1 células T Número total de genes en las matrices : 7129

51 Resultados Note: Golub voting method can only classify two-types disease. * indicates ignoring Golubs PS values.

52 Explore Análisis del comportamiento Sample Modify Model Asses

53 Dell Online CRM Analítico è Análisis del camino para mejorar el contenido y la navegación del site è Segmentación de clientes è Mejora en la gestión de campañas

54 R&D sigue trabajando... Fuzzy Pattern Matching Text Mining Genomics

55 Enterprise Miner 4.1 Memory Based Reasoning è Idea básica : buscar en una base de datos y permitir coincidencia inexacta (k vecinos más próximos) è Requiere una definición de similitud para cada variable y una regla de combinación para calcular la distancia è MBR = fuzzy pattern matching, usado para categorización

56 Enterprise Miner 4.1 Memory Based Reasoning Aplicaciones: è Cualquier B2C, e-business on-line è Venta por catálogo è Programación de vuelos

57 Enterprise Miner para texto üText Mining: Descubrir y utilizar el conocimiento que existe en una colección de documentos üPermite la entrada de texto, el proceso, la clasificación & generación de clusters üPuede gestionar gran número de documentos Conocimiento

58 Proceso de Text Mining

59 Investigación del Genoma è Entender el genoma humano supondrá una revolución en la forma en que se desarrollan los medicamentos è Grande volúmenes de datos - requieren un proceso complejo è Colaboración iBiomatics/SAS para proporcionar un Genomic warehouse è Enterprise Miner para Genomics como un add-on al EM resolviendo la parte analítica

60 Enterprise Miner para Genomics

61 Data Mining y otras iniciativas Data Mining y CRM è Adquisición, retención y rentabilidad de clientes, venta cruzada, nueva venta, fraude. Data Mining y cálculo sobre Web è Scoring On-line de clientes Data Mining y e è Perfil de clientes, personalización, adaptar entorno al comportamiento del cliente, identificar potencial, incrementar la fidelidad al sitio web Data Mining y Sector Farmacéutico è Hallar estructuras químicas, decubrir nuevos medicamentos, investigación de efectos, ventas y marketing Data Mining y Sistemas è Capacity planning, detección de intrusos

62 Conclusiones : ¿Qué nos aporta el Data Mining ? Data Mining Conocimiento

63 Enterprise Miner Conclusiones: SAS Enterprise Miner Metodología de implantación GUI para el proceso de DM Todas las técnicas data mining Resultados orientados al experto de negocio Entorno Cliente/Servidor Posibilidad de ampliación de funcionalidad (flexible) Integrado con las tecnologías data warehouse, Web y OLAP


Descargar ppt "Ana Drozdowskyj Analytical Solutions Product Manager SAS Spain Copyright © 2000, SAS Institute Inc. All rights reserved. Data Mining:Un proceso para llegar."

Presentaciones similares


Anuncios Google