Ana Drozdowskyj Analytical Solutions Product Manager SAS Spain

Slides:



Advertisements
Presentaciones similares
CLIMA LABORAL.
Advertisements

Clientes de las IMF. Qué sabemos de ellos?.
Director de División CRM de
Filminas Undécima Semana CI-1322 Autómatas y Compiladores Elaborado por: Sergio Pastrana Espinoza A33888.
Katherine Núñez Jose Fabio Araya
Introducción a la minería de datos
Cognos Data Integration
ORACLE OLAP Integrantes: *Aizaga, Martiniano *Gallegos, Marina
Customer Relationship Management Gestión de Relaciones con el Cliente
MERCADOS ELECTRÓNICOS
Presentación de la Plataforma de Gestión de la Excelencia
Gestión de las Relaciones con el Cliente
Explora y conquista tu mercado
Business Intelligence (BI) Software (Software de Inteligencia Impresario)
• SQL Server Analysis Services Data Mining
Data Mining Integrantes: Rojas Correa, Trinidad Romanskyy, Bohdan
ADMINISTRACIÓN DE TECNOLOGIAS DE INFORMACIÓN Y COMUNICACIÓN
DATA MINING Bibliografía:
El desafío de organizar la información
Especialista en Business Intelligence Analysis Services SSAS (Sesión 14) Microsoft SQL Server 2008 R2 Suscribase a o escríbanos a
Va más allá de facilitar la comunicación pues permite la interacción entre los usuarios, compradores y vendedores en un entorno que no es fijo, ni es.
On Line Analytical Processing
Prof.: J. Carlos GUEVARA Jiménez
DATA WAREHOUSE Joseba Gil Noelia Suaña. ÍNDICE 1. Introducción. 2. ¿Qué es Data Warehouse? 3. Arquitectura. 4. Ventajas/Inconvenientes.
INTELIGENCIA DE NEGOCIOS
Minería de Datos con Clementine
Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".
Bases de Datos II OLAP Online Analytical Processing
Paola Saavedra -
Business Intelligence y Data Mining
DATA WAREHOUSE Equipo 9.
RESUMEN En este artículo se describe en forma breve una de las líneas de investigación que se están llevando a cabo en el Laboratorio de Tecnologías Emergentes.
EVOLUCION DE SISTEMAS DE SOPORTE DE DECISIÓN. La evolución  1960: creación de aplicaciones individuales- Fortran, COBOL – Tarjetas perforadas.  Cintas.
PARTE I: INTRODUCCIÓN José Hernández Orallo
Integrantes: Roberto Jacobini Ricardo Fuertes Julio Alan Roger Baldeón.
La Información en las Organizaciones. Datos Externos Datos Internos Datos Personales Data Mining Data Warehouse Data Marts Meta Data OLAP Queries DSS.
Proceso KDD MSc. Carlos Alberto Cobos Lozada
Algo peor que no tener información disponible es tener mucha información y no saber qué hacer con ella. La Inteligencia de Negocios o Business Intelligence.
PROELZA Valladolid, Rumbo, Responsabilidad y Respeto.
Especialista en Business Intelligence Conceptos fundamentales Microsoft SQL Server 2008 R2 Suscribase a o escríbanos a
Introducción a Pentaho BI Suite 3.5
ISCE. Nava Gutiérrez Carolina
1 TEMA 1: NECESIDAD DE LA INFORMACIÓN PARA LA TOMA DE DECISIONES EN LA EMPRESA Las bases de datos ocupan un lugar determinante en cualquier área. No sólo.
Software CRM.
CRM Customer Relationship Management Gerente de Relaciones con los Clientes.
Comercio Electrónico Parte 3
Diseño de un data warehouse
DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.
ORACLE OLAP CAECE Integrantes: *Aizaga, Martiniano *Gallegos, Marina *Kleinlein, Guillermo *Schiano di Cola, Emiliano.
Business Intelligence. ¿Por qué Business Intelligence? La capacidad para tomar decisiones de negocio precisas y de forma rápida se ha convertido en una.
G R U P O I B E R M Á T I C A Analítica Avanzada & Linked Data.
business intelligence
¿COMO PLANIFICAR UNA CAMPAÑA DE EMARKETING RENTABLE? SEO, SEM, AFILIADOS Y MARKETING.
Métodos de investigación en la psicología clínica
Taller de Business Intelligence Conceptos Introductorios a BI
Taller de Business Intelligence
Business Intelligence. Análisis de DiagnósticoAnálisis PredictivosAnálisis PrescriptivosAnálisis Descriptivos Análisis enfocados al diseño de tendencias.
Taller de Inteligencia de Negocios SQL Server Analysis Services Data Mining Semana 11.
SOLUCIONES EMPRESARIALES
BUSINESS T&G Think & Grow Uniclass Business Intelligence La solución Business Objects que analiza los procesos de su negocio.
Business Intelligence 2013 (Conceptos Generales) Microsoft SQL Server 2008 R2 Suscribase a o escríbanos a
DATA MINING. Extracción de información oculta y predecible de grandes bases de datos Poderosa tecnología que ayuda a concentrase en la información importante.

Es el proceso mediante el cual quienes toman decisiones en una organización obtienen, procesan y analizan información pertinente, interna y externa,
Taller: El Uso de Analytics en la Vida de un Actuario (Un Océano de Oportunidades) 15 de Julio de 2010 Pablo FondevilaGustavo Grinblat Coordinador Socio.
Copyright © 2010 SAS Institute Inc. All rights reserved. Douglas Montalvao Gerente de Soluciones Hotel Hilton Buenos Aires 17 de Noviembre 2011 The Premier.
Copyright © 2010 SAS Institute Inc. All rights reserved. ¿Cómo optimizar la efectividad de las acciones de marketing mediante una plataforma integrada.
Rafael Zamora Garrido Julio Ejemplos de objetivos de Minería de Datos Reducir las bajas de clientes actuales en un 5%. Aumentar las contrataciones.
Construir un sistema de información en Internet e-conecta + zahén.
Transcripción de la presentación:

Ana Drozdowskyj Analytical Solutions Product Manager SAS Spain Data Mining:Un proceso para llegar al conocimiento a partir de los datos Ana Drozdowskyj Analytical Solutions Product Manager SAS Spain Copyright © 2000 , SAS Institute Inc. All rights reserved.

Agenda Data Mining en la obtención de conocimiento Introducción Data Mining en la obtención de conocimiento ¿Qué nos aporta SAS ? Casos prácticos Conclusiones

Introducción Data Mining

Introducción

Los datos y “Data Mining” El objetivo: “Knowledge is the only competitive Advantage” Jack Welch, CEO, General Electric

Los datos y “Data Mining” La situación actual: “Computers promised us a Fountain of Wisdom, but delivered us a Flood of Data” Gregory Piatetsky-Shapiro, 1991

¿Necesitan lo mismo todos mis clientes ?

¿Hay realmente diferencias?

Tecnologías involucradas Recordar Tecnologías involucradas Data Warehousing Data Mining Aprender Análisis multidimensional y distribución via aplicaciones web Actuar

Una definición conocida... DATA MINING, Una definición conocida... Data Mining es el proceso de selección, exploración y modelización de grandes volúmenes de datos para descubrir patrones ocultos que aporten un beneficio para la empresa Data Mining turns the member information into Knowledge. SAS has a definition for data mining which is..READ As a process, data mining enables continuous learning and this learning is not in and of itself a goal, it is done to meet defined business objectives.

Data Mining en la obtención de conocimiento Transformar Datos en información Actuar según la información Pregunta de negocio Data Warehouse DBMS Proceso de Data Mining EIS, Business Reporting, OLAP Identificar el problema Medir resultados

Entornos de aplicación de Data Mining Buscar Recuperar Adquirir Fidelizar Rentabilizar Retener CRM- Gestión de las relaciones con los clientes Finanzas: Rentabilidad, Retención, Fraude Investigación : Medicina, Medioambiental

¿Cómo hacer Data Mining ?

Dos caminos al interior de los datos Descriptivo Predictivo

Análisis descriptivo

Análisis predictivo Buscamos características críticas desconocidas ¿Qué perfil tienen mis mejores clientes ? ¿Quién contestará a una promoción? ¿Qué genes diferencian dos tipos de cancer? Usando técnicas específicas: Regresión, árboles de decisión, redes neuronales, cluster , asociaciones y secuencias, Que puedan Generalizarse Aplicar el conocimiento adquirido Evaluar los resultados

Ejemplo: Análisis de campañas y marketing dirigido Optimizar el mailing de catálogos incrementar la tasa de respuesta, estudiar catálogos personalizados Análisis del comportamiento del cliente Usar asociaciones para deducir patrones de compra , usar secuencias para predecir posibles compras futuras

¿Qué nos aporta SAS Institute para Data Mining?

                                                                              Haga click en la imagen para acceder a la página de DMReview El ranking de las 100 mejores empresas de Business Intelligence -incluyendo Customer Relationship Management (CRM) y Data Warehousing- se ha basado en los resultados de una encuesta realizada entre los lectores de la revista y la investigación ha sido llevada a cabo por la empresa Market Perspective vía web. SAS, desde 1997 - año en que se concedieron por primera vez estos premios -, ha sido la única compañía en posicionarse siempre entre las tres primeras del ranking. Según Ron Powell, director editorial de DM Review, "Aparecer en DM Review 100 demuestra el compromiso que la compañía ha adquirido con sus clientes y significa que conoce perfectamente sus necesidades y que está dispuesta a darles respuesta. SAS ha sido seleccionada por nuestros lectores como la empresa líder en soluciones e-Intelligence".

Enterprise Miner Release 4.0 con SAS Release 8e Cliente: Windows 95/98/2000/NT Client Servidor: Win NT Server; Win 2000 MVS OS/390 Unix: AIX, HP-UX, Sun/Solaris, Compaq Tru64 Unix, Intel ABI (incl. MP-RAS) Compaq Tru64 Unix 4.0E Specify the delivery date and that we will be shipping under SAS V8.1. Hold off on discussing V8 advantages until next slide. Indicate that we will be shipping EM on different platforms in waves and that platforms highlighted in yellow are new.

Decisión (BI) Acceso a los datos : DW/DBMS Sample Explore Modify Model Assess Metodología SEMMA Decisión (BI)

Sample Explore Manipulate Model Assess ¿Muestreo? Exploración Visual Reducción Datos Agrupaciones, Subconjuntos Transformaciones Redes Neuronales Arboles Decisión Técnicas Estadísticas Asociaciones Secuencias Comparación Modelos, Nuevas Preguntas 22

Sample ....... ...... ..... ................... Sample (Muestreo) Partición de los datos Training Validación Test

Explore (Exploración) Conocer los datos Tendencias principales Rango de las variables clave Frecuencia de los valores Correlación entre variables Grupos

Nodo Distribution Explorer Al ejecutar el nodo se pueden generar Tablas, incluyendo tablas cruzadas para variables de clasificación y estadísticas descriptivas de las variables contínuas.

Nodo Multiplot Genera automáticamente gráficos de distribución de cada variable. También genera gráficos que ilustran la relación de cada variable con la variable target.

Modify (Modificación) ¿Con qué información trabajar? Experiencia de negocio Transformar variables para la modelización óptima

Construir el modelo que responde a la pregunta planteada Model (Modelización) Construir el modelo que responde a la pregunta planteada Modelos Estadísticos RNs Arboles de decisión Series temporales

Tree View- basado en MSF If you don’t understand the MFC browser, use this slide instead, otherwise skip this slide.

Assess (Validación) Cuál es la mejor técnica? ......... .......... ......... .......... Assessment Assess (Validación) Cuál es la mejor técnica?

Interfaz

Diagramas de flujo del Proceso

Nodo Reporter Genera automáticamente un informe con detalles y resultados del PFD. Los informes son em formato HTML Se pueden leer utilizando cualquier web browser.

Un ejemplo .... SAS Enterprise Miner trabajando para identificar el grupo obejtivo de una campaña de marketing....

¿Qué servicios son relevantes? Cuál es su valor "LTV" Proceso completo para Data Mining SEMMA ¿Qué comprarán? ¿Qué servicios son relevantes? Cuál es su valor "LTV" ¿Quiénes son mis clientes?

Subdividir los datos del cliente para entrenar los modelos y validar los resultados

Explorar los datos para validar las técnicas de muestreo y descubrir nuevos patrones de compra

¿La muestra es representativa de la población?

Segmento “Gasto” alto

Co-linealidad... Co-linelidad...

Modificar datos del cliente para mejorar la capacidad predictiva del modelo

Modelo de clientes para anticipar su próxima acción ¿Qué quieren mis clientes? ¿Qué nuevos clientes debería adquirir? ¿Qué productos y servicios comprarán? Modelo de clientes para anticipar su próxima acción

Resultados del árbol de decisión... Hoja “Pura”

Perfil del cliente ideal

Validar qué modelo predice mejor el comportamiento del cliente frente a la compra Puntuar clientes

Respuesta capturada del Warehouse de clientes Comportamiento del modelo... Respuesta capturada del Warehouse de clientes “Grupos” de clientes

Puntuar Warehouse de clientes

Clasificación de Leucemia agua, usando “Perfil de expresión genética” La leucemia linfoblástica aguda y la leucemia mieloide aguda , presentan síntomatología similar La distinción de los dos cánceres es crítica para un tratamiento eficaz Se uitliza Data Mining para identificar los genes que difrencian claramente los dos cánceres -- asegurando un tratamiento adecuado de los pacientes

Datos para la investigación Fichero de Training : 38 pacientes: 11 AML (Leucemia Mieloide Aguda) 27 ALL (Leucemia Linfoblástica Aguda) - 19 Células B-, 8 Células T Fichero de Test : 34 pacientes: 14 AML 20 ALL - 19 células B, 1 células T Número total de genes en las matrices : 7129

Resultados Note: Golub voting method can only classify two-types disease. * indicates ignoring Golub’s PS values.

Análisis del comportamiento Sample Explore Model Asses Modify

Dell Online CRM Analítico Análisis del camino para mejorar el contenido y la navegación del site Segmentación de clientes Mejora en la gestión de campañas Similarly, we are doing some interesting work with Dell Online, who also has warehoused a great deal of web data. Achieving greater customer understanding and evolving the site based on customer needs are motivating some interesting applications.

R&D sigue trabajando... “Fuzzy Pattern Matching” Text Mining Genomics

Enterprise Miner 4.1 Memory Based Reasoning Idea básica : buscar en una base de datos y permitir “coincidencia inexacta” (k vecinos más próximos) Requiere una definición de similitud para cada variable y una regla de combinación para calcular la distancia MBR = “fuzzy” pattern matching , usado para categorización

Enterprise Miner 4.1 Memory Based Reasoning Aplicaciones: Cualquier B2C, e-business on-line Venta por catálogo Programación de vuelos

Enterprise Miner para texto Text Mining: Descubrir y utilizar el conocimiento que existe en una colección de documentos Permite la entrada de texto, el proceso, la clasificación & generación de clusters Puede gestionar gran número de documentos Conocimiento

Proceso de Text Mining

Investigación del Genoma Entender el genoma humano supondrá una revolución en la forma en que se desarrollan los medicamentos Grande volúmenes de datos - requieren un proceso complejo Colaboración iBiomatics/SAS para proporcionar un “Genomic warehouse” Enterprise Miner para Genomics como un add-on al EM resolviendo la parte analítica

Enterprise Miner para Genomics

Data Mining y otras iniciativas Data Mining y CRM Adquisición, retención y rentabilidad de clientes, venta cruzada, nueva venta, fraude. Data Mining y cálculo sobre Web Scoring On-line de clientes Data Mining y “e” Perfil de clientes, personalización, adaptar entorno al comportamiento del cliente, identificar potencial, incrementar la fidelidad al sitio web Data Mining y Sector Farmacéutico Hallar estructuras químicas, decubrir nuevos medicamentos, investigación de efectos, ventas y marketing Data Mining y Sistemas Capacity planning, detección de intrusos

Conclusiones : ¿Qué nos aporta el Data Mining ? Conocimiento

Conclusiones: SAS Enterprise Miner™ Metodología de implantación GUI para el proceso de DM Todas las técnicas data mining Resultados orientados al experto de negocio Entorno Cliente/Servidor Posibilidad de ampliación de funcionalidad (flexible) Integrado con las tecnologías data warehouse, Web y OLAP