• SQL Server Analysis Services Data Mining

Slides:



Advertisements
Presentaciones similares
Data Mining Minería de Datos Universidad Tecnológica Metropolitana
Advertisements

Montevideo 14 de Diciembre
Introducción a la minería de datos
DATA MINING MINERIA DE DATOS Gersom Costas.
DATA WAREHOUSE Presentador Por: Andrés Fabián Cortes Solano.
Business Intelligence (BI) Software (Software de Inteligencia Impresario)
• SQL Server Integration Services SSIS
Topicos Avanzados de Ingeniería
Especialista en Business Intelligence Reporting Services SSRS (Sesión 16) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
Especialista en Business Intelligence Analysis Services SSAS (Sesión 13) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
Especialista en Business Intelligence Analysis Services SSAS (Sesión 11) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
• SQL Server Analysis Services
Especialista en Business Intelligence Integration Services SSIS (Sesión 5) Microsoft SQL Server 2008 R2 (Nov.2013) Suscribase a o.
• SQL Reporting Services
SQL Server Integration Services SSIS
SQL Server Integration Services SSIS
SQL Server Integration Services SSIS
Especialista en Business Intelligence Analysis Services SSAS (Sesión 13) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
• SQL Server Analysis Services
Especialista en Business Intelligence Analysis Services SSAS (Sesión 13) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
• SQL Server Integration Services SSIS
MÉTODOS DE ANÁLISIS FINANCIEROS
Especialista en Business Intelligence Analysis Services SSAS (Sesión 10) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
• SQL Server Integration Services SSIS
• SQL Server Integration Services SSIS
Especialista en Business Intelligence Analysis Services SSAS (Sesión 14) Microsoft SQL Server 2008 R2 Suscribase a o escríbanos a
Especialista en Business Intelligence Integration Services SSIS (Sesión 6) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
Especialista en Business Intelligence Analysis Services SSAS (Sesión 14) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
Regresión y correlación
INTELIGENCIA DE NEGOCIOS
Como empezar en Access 2000 Abrir Access 2000 Pulsamos INICIO
Sesión 2: Métodos Probabilísticos Básicos
Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".
SQL Server 2008 Integration Services
Mt. Martín Moreyra Navarrete.
• SQL Reporting Services
GRÁFICOS ESTADÍSTICOS
GUTIÉRREZ GRANADOS HÉCTOR DANIEL
Nuevos Productos Macro Pro ofrece varias soluciones complementarias para cumplir con los objetivos de control y análisis de información de nuestros clientes.
¿Por qué usar Data Mining?  Proporciona un punto de encuentro entre los investigadores y las personas de negocios.  Ahorra grandes cantidades de dinero.
Especialista en Business Intelligence Integration Services SSIS Transformaciones (Parte 4) Microsoft SQL Server 2008 R2.
Especialista en Business Intelligence Integration Services SSIS Transformaciones (Parte 3) Microsoft SQL Server 2008 R2 Suscribase a
Especialista en Business Intelligence (Sesión 1) Microsoft SQL Server 2008 R2 (Nov.2013) Suscribase a o escríbanos a
• SQL Server Integration Services SSIS
Taller de Inteligencia de Negocios SQL Server Analysis Services Semana 9.
DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.
Instructor: Christian Montoya
Especialista en Business Intelligence Integration Services SSIS Transformaciones (Parte 1) Microsoft SQL Server 2008 R2 Suscribase a
Aplicaciones Estadísticas a las Finanzas Clase 1
SQL Server Analysis Services SSAS
Colegio de Bachilleres Plantel 13 Xochimilco - Tepepan
Aplicación JAVA implementando Arboles de Decisión
SQL Server Integration Services SSIS
Taller de Inteligencia de Negocios SQL Server Analysis Services Semana 9.
Especialista en Business Intelligence Analysis Services SSAS (Sesión 8) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
Taller de Inteligencia de Negocios SQL Server Integration Services SSIS Semana 2.
• SQL Server Integration Services SSIS
• SQL Server Integration Services SSIS
Taller de Business Intelligence Conceptos Introductorios a BI
Especialista en Business Intelligence Analysis Services SSAS (Sesión 13) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
Taller de Business Intelligence
Taller de Inteligencia de Negocios SQL Server Analysis Services Semana 8.
Taller de Inteligencia de Negocios SQL Server Integration Services SSIS Sesión 3.
Taller de Inteligencia de Negocios SQL Server Analysis Services Data Mining Semana 11.
Business Intelligence 2013 (Conceptos Generales) Microsoft SQL Server 2008 R2 Suscribase a o escríbanos a

Rafael Zamora Garrido Julio Ejemplos de objetivos de Minería de Datos Reducir las bajas de clientes actuales en un 5%. Aumentar las contrataciones.
Taller de Inteligencia de Negocios SQL Server Integration Services SSIS Sesión 2.
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
Taller de Inteligencia de Negocios Taller de Business Intelligence Semana 1.
Transcripción de la presentación:

• SQL Server Analysis Services Data Mining Semana 11

End-to-End BI Offering SharePoint Server SEARCH DELIVERY Reports Dashboards Excel Workbooks Analytic Views Scorecards Plans CONTENT MANAGEMENT COLLABORATION END USER TOOLS AND PERFORMANCE MANAGEMENT APPS Excel PerformancePoint Server BI PLATFORM SQL Server Reporting Services Analysis Services SQL Server DBMS SQL Server Integration Services Heterogeneous data sources © 2008 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION.

Minería de Datos Ayudan a identificar patrones en los datos, que le permiten determinar las razones por las que suceden las cosas, y a crear reglas y recomendaciones, con las que puede predecir lo que ocurrirá en el futuro. No es necesario crear un almacén de datos para realizar la minería de datos; puede usar datos tabulares de proveedores externos, hojas de cálculo e incluso archivos de texto. También puede minar con facilidad cubos OLAP creados en Analysis Services.

Minería de Datos Utiliza el análisis matemático para deducir los patrones y tendencias que existen en los datos. Normalmente, estos patrones no se pueden detectar mediante la exploración tradicional de los datos porque las relaciones son demasiado complejas o porque hay demasiados datos. Los modelos de minería de datos se pueden aplicar a situaciones empresariales como las siguientes: Predecir ventas Dirigir correo a clientes específicos Determinar los productos que se pueden vender juntos Buscar secuencias en el orden en que los clientes agregan productos a una cesta de compra

Minería de Datos Cada proyecto de minería de datos contiene los cuatro tipos siguientes de objetos: orígenes de datos; vistas del origen de datos, que se basan en los orígenes de datos; estructuras de minería de datos, que definen cómo se utilizan los datos en el modelo; y modelos de minería de datos, que crean y almacenan los patrones.

Algoritmos de Minería de Datos Es un conjunto de cálculos y reglas heurísticas que permite crear un modelo de minería de datos a partir de los datos. Para crear un modelo, el algoritmo analiza primero los datos proporcionados, en busca de tipos específicos de patrones o tendencias. El algoritmo usa los resultados de este análisis para definir los parámetros óptimos para la creación del modelo de minería de datos. A continuación, estos parámetros se aplican en todo el conjunto de datos para extraer patrones procesables y estadísticas detalladas.

Algoritmos de Minería de Datos Analysis Services incluye los siguientes tipos de algoritmos: Algoritmos de clasificación, que predicen una o más variables discretas, basándose en otros atributos del conjunto de datos. Algoritmos de regresión, que predicen una o más variables continuas, como las pérdidas o los beneficios, basándose en otros atributos del conjunto de datos. Algoritmos de segmentación, que dividen los datos en grupos, o clústeres, de elementos que tienen propiedades similares. Algoritmos de asociación, que buscan correlaciones entre diferentes atributos de un conjunto de datos. La aplicación más común de esta clase de algoritmo es la creación de reglas de asociación, que pueden usarse en un análisis de la cesta de compra.

Algoritmos de Minería de Datos Analysis Services incluye los siguientes tipos (continuación): Algoritmos de análisis de secuencias, que resumen secuencias o episodios frecuentes en los datos, como un flujo de rutas web. La minería de datos le permite generar varios modelos en una única estructura de minería de datos, por lo que en una solución de minería de datos puede usar un algoritmo de clústeres, un modelo de árboles de decisión y un modelo de Bayes naïve para obtener distintas vistas de los datos. También puede usar varios algoritmos dentro de una única solución para realizar tareas independientes: por ejemplo, podría usar la regresión para obtener predicciones financieras, y un algoritmo de red neuronal para realizar un análisis de los factores que influyen en las ventas.

Elección de Algoritmo por tarea La tabla siguiente proporciona sugerencias para los tipos de tareas para las que se usa normalmente cada algoritmo.

Ver Videos sobre el tema: Analysis Services Ver Videos sobre el tema:

Modelos de Minería de Datos Analysis Services Anexo Modelos de Minería de Datos

Árboles de decisión de Microsoft Es un algoritmo de clasificación y regresión proporcionado por SSAS para el modelado de predicción de atributos discretos y continuos. Para los atributos discretos, el algoritmo hace predicciones basándose en las relaciones entre las columnas de entrada de un conjunto de datos. Específicamente, el algoritmo identifica las columnas de entrada que se correlacionan con la columna de predicción.  Por ejemplo, en un escenario para predecir qué clientes van a adquirir probablemente una bicicleta, si nueve de diez clientes jóvenes compran una bicicleta, pero solo lo hacen dos de diez clientes de edad mayor, el algoritmo infiere que la edad es un buen elemento de predicción en la compra de bicicletas. 

Árboles de decisión de Microsoft Para los atributos continuos, el algoritmo usa la regresión lineal para determinar dónde se divide un árbol de decisión. Si se define más de una columna como elemento de predicción, el algoritmo genera un árbol de decisión independiente para cada columna de predicción.  Ejemplo Marketing desea identificar las características de los clientes antiguos que indicarian si es probable que realicen alguna compra futura. El DB almacena información demográfica. Mediante los árboles de decisiones que analizan esta información, Marketing puede generar un modelo que predice si un cliente va a comprar productos, basándose en el estado de las columnas conocidas sobre ese cliente, como la demografía o los patrones de compra anteriores.

Árboles de decisión de Microsoft El algoritmo genera un modelo mediante la creación de una serie de divisiones en el árbol. El algoritmo agrega un nodo al modelo cada vez que una columna de entrada tiene una correlación significativa con la columna de predicción. La forma en que el algoritmo determina una división varía en función de si predice una columna continua o una columna discreta. El algoritmo utiliza la selección de características para guiar la selección de los atributos más útiles.   Entre los métodos que se usan para determinar si hay que dividir el árbol figuran métricas estándar del sector para la entropía y las redes Bayesianas.

Árboles de decisión de Microsoft Discreta Continua

Algoritmo de clústeres Es un algoritmo de segmentación que utiliza técnicas iterativas para agrupar los casos de un conjunto de datos dentro de clústeres que contienen características similares. Estas agrupaciones son útiles para la exploración de datos, la identificación de anomalías en los datos y la creación de predicciones. Identifican las relaciones en un conjunto de datos que no se podrían derivar lógicamente a través de la observación casual. 

Algoritmo de clústeres Por ejemplo, puede discernir lógicamente que las personas que se desplazan a sus trabajos en bicicleta no viven, por lo general, a gran distancia de sus centros de trabajo. Sin embargo, el algoritmo puede encontrar otras características que no son evidentes acerca de los trabajadores que se desplazan en bicicleta.

Algoritmo de clústeres Se diferencia de otros algoritmos de minería de datos, como el algoritmo de árboles de decisión, en que no se tiene que designar una columna de predicción para generar un modelo de agrupación en clústeres. El algoritmo de clústeres entrena el modelo de forma estricta a partir de las relaciones que existen en los datos y de los clústeres que identifica el algoritmo.  Ejemplo Considere un grupo de personas que comparten información demográfica similar y que adquieren productos similares de la empresa. Este grupo de personas representa un clúster de datos. En una base de datos pueden existir varios clústeres como éstos. Mediante la observación de las columnas que forman un clúster, puede ver con mayor claridad la forma en que los registros de un conjunto de datos se relacionan entre sí. .

Algoritmo de clústeres

Algoritmo de regresión lineal Es una variación del algoritmo de árboles de decisión que ayuda a calcular una relación lineal entre una variable independiente y otra dependiente y, a continuación, utilizar esa relación para la predicción.

Algoritmo de regresión lineal La relación toma la forma de una ecuación para la línea que mejor represente una serie de datos.  Cada punto de datos tiene un error asociado con su distancia con respecto a la línea de regresión. Los coeficientes a y b de la ecuación de regresión (y=a+bx) ajustan el ángulo y la ubicación de la recta de regresión. Hay otros tipos de regresión que utilizan varias variables y también hay métodos no lineales de regresión. Sin embargo, la regresión lineal es un método útil y conocido para modelar una respuesta a un cambio de algún factor subyacente. .

Ejercicios de Minería de Datos 1. Crear una conexión a AdventureWorksDW2008R2

Ejercicios de Minería de Datos 2. Crear una vista al DataSource creado previamente que incluya la tabla: ProspectiveBuyer(dbo). Posteriormente puede explorar el contenido de los datos de la tabla.

Ejercicios de Minería de Datos 3. Construir un modelo de Minería de Datos usando la técnica: Microsoft Decision Trees.

Ejercicios de Minería de Datos 4. Seleccionar la vista al origen de datos definida en el paso 2. Especifique la tabla y el tipo (“Escenario”) que será usada para el análisis. Especifique los campos: De entrada: Gender, Maritalstatus, Numberchildrenathome, Stateprovincecode, occupation, A predecir: NumbercarsOwned Clave: ProspectAlternateKey

Ejercicios de Minería de Datos Datos para el modelo “Decision trees”

Ejercicios de Minería de Datos 5. Determinar el contenido y el tipo de datos seleccionados en el paso anterior:

Ejercicios de Minería de Datos 6. Se debe especificar la cantidad o porcentaje de datos de prueba para correr el modelo (default 30%). Puede elegir también el número de casos para la prueba.

Ejercicios de Minería de Datos 7. Se ingresan detalles finales del modelo de minería de datos.

Ejercicios de Minería de Datos 8. Implementamos el modelo de minería de datos.

Ejercicios de Minería de Datos 8. Observe las probabilidades de ocurrencia para la variable a predecir (Number cars owned).