Modelo Multidimensional

Slides:



Advertisements
Presentaciones similares
MOVIMIENTO JOVENES DE LA CALLE CIUDAD DE GUATEMALA chi siamo quienes-somos qui sommes-nous who we are attività actividades activités activities scuola.
Advertisements

SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR
el 1, el 4 y el 9 tres cuadrados perfectos autosuficientes
Procesamiento y Análisis en Línea OLAP
Revisión Nº:Descripción:Fecha: 00Elaboración de la documentación30/06/11 Copia Controlada :Nº: F /REV. 00 ACCESO A LA WEB DEL CPR DE TARAZONA Cód.:
IBD Clase 14.
OLAP - Herramienta para el A.D.
Reportes Mg. Samuel Oporto Díaz.
Preguntas.
1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN LAS EMPRESAS GALLEGAS ( Resumen PYMES ) Noviembre de 2004.
1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN LAS EMPRESAS GALLEGAS (MICROEMPRESAS, resultados provisionales) 29 de julio de 2004.
TEMA 2 MÚLTIPLOS Y DIVISORES
02- PLAN DOCENTE Febrero 2009 SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR.
Programación entera En muchos problemas reales las variables sólo pueden tomar valores enteros Ejemplos: decisiones sobre inversiones, compras, arranques,
Programación entera En muchos problemas reales las variables sólo pueden tomar valores enteros Ejemplos: decisiones sobre inversiones, compras, arranques,
Respuestas Buscando a Nemo.
ABECEDARIO FIGURAS GEOMÉTRICAS NÚMERO
Área Razón Social 0 0 Telefónica Servicios Audiovisuales S.A. / Telefónica España S.A. Título de la ponencia / Otros datos de interés / Kit.
Ejemplo A continuación aparecen las tasas de retorno de dos fondos de inversión durante los últimos 10 años. 1. ¿Cuál es más riesgoso? 2. ¿En cuál invertiría.
… Y así nos distraemos Vocabulario.
5 pt 5 pt 5 pt 5 pt 5 pt 10 pt 10 pt 10 pt 10 pt 10 pt 15 pt 15 pt
1 XML Extensible Markup Language HTML HyperText Markup Language normas06_01.xml.
MOVIMIENTO JOVENES DE LA CALLE CIUDAD DE GUATEMALA chi siamo quienes-somos qui sommes-nous who we are attività actividades activités activities alimentazione.
UPC Tema: ESPACIO VECTORIAL Rn
Funciones Excel. Parte 1. Introducción 2 Una función Excel es una fórmula o un procedimiento que se realiza en el ambiente de Visual Basic, fuera de.
Autodesk Civil 3D 2007 Essentials
Phone2Wave-Server Manual de Operación.
Gerencia de Programas Federales de Agua Potable y Alcantarillado Evolución del Sistema Informático de Contraloría Social (SICS) Veracruz, Ver. 2 de octubre.
Parte 3. Descripción del código de una función 1.
INFORME USDA NOVIEMBRE TRIGO 2 MERCADO INTERNACIONAL (Millones de Toneladas) 3.
O3 Drill Through. 2 El O3 Drill Through El O3 Drill Through permite : Ver información detallada de aquella resumida en cubos de O3. Asociar con cubos.
Por: Ronald Toscano Pretelt
BASES DE DATOS MULTIDIMENSIONALES
EL OSO APRENDIZ Y SUS AMIGOS
• SQL Server Analysis Services
Mejoras a la Cláusula GROUP BY
50 principios 1. Los clientes asumen el mando.
RETIRO DE COMALCALCO DIC. 2012
Proyecto para Centros que trabajan una vez por semana.
DESARROLLO DE CUBOS OLAP
Aplicación de la Derivada
Aplicación de la Derivada
Estadística Computacional I
Tema 6 La demanda del mercado.
La minimización de los costes
Informe caso de estudio Implementación de un Datawarehouse
MEDIDAS DE DISPERSIÓN.
Comité Nacional de Información Bogotá, Julio 27 de 2011 Consejo Nacional de Operación de Gas Natural 1 ESTADISTICAS NACIONALES DE OFERTA Y DEMANDA DE GAS.
Características Objeto Relacionales en Oracle
Especialista en Business Intelligence Analysis Services SSAS (Sesión 10) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
JORNADA 1 DEL 24 DE MARZO AL 30 DE MARZO EQUIPO 01 VS EQUIPO 02 EQUIPO 03 VS EQUIPO 06 EQUIPO 05 VS EQUIPO 10 EQUIPO 07 DESCANSA EQUIPO 08 VS EQUIPO 13.
CULENDARIO 2007 Para los Patanes.
Lenguaje Estructurado de Consultas (Structured Query Language – SQL)
E.1 Obtener los detalles completos de todos los proyectos.
BEATRIZ LAFONT VILLODRE
ESTADOS FINANCIEROS A DICIEMBRE DE 2013.
* Fuente: Sondeo del Consumidor de la Comisión de la UE, GfK. Expectativas sobre la situación.
1 ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL PRESENTACIÓN DE LA TESIS Presentada por: Guayaquil, Noviembre 2007 ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL.
Slide 7-1 Copyright © 2003 Pearson Education, Inc. Figure: Estructuras de datos.
Características Objeto Relacionales en Oracle Francisco Moreno Universidad Nacional.
Manual de Procedimientos Procedimiento de ejecución del programa de
Estadística Administrativa I
Las Bodegas de Datos (Data warehouses)
Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos aggregados –Analizar resultados –Visualizar resultados El conjunto.

Bases de Datos II OLAP Online Analytical Processing
Implementación de Datawarehouse
Consulta Típica en OLAP
Taller de Inteligencia de Negocios SQL Server Analysis Services Semana 8.
Transcripción de la presentación:

Modelo Multidimensional Operaciones OLAP

El Modelo de Datos Multidimensional Vista multidimensional del data warehouse => influencia el diseño de la base de datos, las herramientas front-end, y los motores OLAP. Modelo multidimensional de datos: un conjunto de medidas numéricas son los objetos de análisis. – Ej: ventas, beneficios, duración de llamadas, etc. Adicionalmente existen, asociadas a las medidas, las dimensiones de análisis, que proveen el contexto a las medidas, y se describen mediante atributos. El modelo define una medida como un valor en un espacio multidimensional. Estas medidas pueden también representar datos agregados. Las dimensiones se pueden organizar en jerarquías de agregación.

Tiempo Establecimiento Producto Ventas día semana nro_establec mes id_fecha id_producto id_establec importe unidades nro_clientes Ventas nro_establec nombre dirección distrito ciudad país tlfno fax superficie tipo_almacén ... nro_producto descripción marca subcategoría categoría departamento peso unidades_peso tipo_envase dietético Establecimiento Producto día semana mes año día_semana día_mes trimestre festivo .... Tiempo

Modelo de Datos Multidimensional Ventas de Productos podrían ser representados en una dimensión (como una fact relation) o en dos dimensiones, e.j. : clients and products Fact Relation Cubo de dos dimensiones 2D_ Cube

Modelo de Datos Multidimensional Fact relation 3-dimensional cube day 2 day 1

Crear Esquema e Insertar valores CREATE DATABASE VENTAS_DM, USE VENTAS_DM; CREATE TABLE SALE (product char(2), client char(2), date char(1), amt int); INSERT INTO SALE VALUES ( 'p1', 'c1', '1', 12), ( 'p2', 'c1', '1', 11), ( 'p1', 'c3', '1', 50), ( 'p2', 'c2', '1', 8), ( 'p1', 'c1', ‘2', 44), ( 'p1', 'c2', ‘2', 4);

Modelo de Datos Multidimensional y Funciones de Agregación Sumar las cantidades (Amt) del día 1 (Date) En SQL: SELECT sum(Amt) FROM SALE WHERE Date = 1 result 81

Modelo de Datos Multidimensional y Funciones de Agregación Sumar las cantidades por día En SQL: SELECT Date, sum(Amt) FROM SALE GROUP BY Date result

Modelo de Datos Multidimensional y Funciones de Agregación Sumar cantidades por client, product En SQL: SELECT product, client, sum(amt) FROM SALE GROUP BY product, client

11.11.2. GROUP BY Modifiers Ver archivo del Manual de Referencia MySQL MySql_groupBy_rollUp.docx

Modelo de Datos Multidimensional y Funciones de Agregación En el Modelo de Datos Multidimensional junto con valores de medición se almacena información sumarizada (agregados)

Funciones de Agregación Operadores: sum, count, max, min, average Claúsula “Having” Usando Jerarquías de dimensión Promedio por región (tienda -- store) Máximo por mes (fecha -- date)

Cube Aggregation (Agregación del Cubo) Ejemplo: calculando sumas day 2 . . . day 1 129

Cube Operators Operadores del Cubo day 2 . . . day 1 sale(c1,*,*) 129 sale(c2,p2,*) sale(*,*,*)

Cube * day 2 sale(*,p2,*) day 1

Agregación Usando Jerarquías day 2 day 1 customer region country (customer c1 en Region A; customers c2, c3 en Region B)

Agregación Usando Jerarquías client city New Orleans 10 3 21 c1 c2 12 5 9 region 11 7 7 Poznań c3 Date of sale 12 11 15 c4 Video CD Camera agregación con respecto a city

Ejemplo de Data Cube All, All, All Date Product C o u n t r y camera 1Q 2Q 3Q 4Q sum camera C o u n t r y Product video USA CD sum Canada Mexico sum All, All, All

Ejercicio (1) Suponga que AAA Automobile Co. construye una data warehouse para analizar las ventas de sus autos. La medida measure - price de un auto Se necesita responder las siguientes consultas típicas: encontrar las ventas totales por día, semana, mes y año encontrar las ventas totales semana, mes y año, ... para cada agencia encontrar las ventas totales semana, mes y año, ... Para cada modelo de carro encontrar las ventas totales por mes para todos las agencias en una ciudad, región y estado dados.

Ejercicio (2) Dimensiones: time (day, week, month, quarter, year) dealer (name, city, state, region, phone) cars (serialno, model, color, category , …) Diseñe el esquema conceptual de la datawarehouse

Datawarehouse de AAA Automobile Co. Name City State Region Phone Dealer Day Week Month Quarter Year Date Price Fact Table Date Dealer Car SerialNo Model Color Category Car unit_prices descount total Measurements

AAA Co. DataWarehouse date dateid day week month year price unitprice car date dealer name serialNo name city state region phone serialNo model color category desc. total date day week month year dateid

Esquema de la DataWarehouse AAA (tarea) car serialno model color category A1000 Lupo plata compacto B2000 Jetta azul sport C3000 Passat negro lujo date dateId day week month quarter year 01-01-06 01 1 2006 01-03-06 03 01-05-06 05 2 price unitprice date name serialno desc total 110000 01-01-06 Dorada A1000 10 99000 160000 01-03-06 Angelópolis B2000 15 136000 280000 01-05-06 Centro C3000 25 210000 dealer name city state region phone Dorada Puebla SW 7557705 Angelópolis 7566311 Centro 7557777

Consultas a AAA Datawarehouse encontrar las ventas totales por día, semana, mes y año SELECT day, sum(total) FROM PRICE, DATE WHERE date= dateid GROUP BY day AÑADIR ROLLUP

Consultas a AAA Datawarehouse encontrar las ventas totales por día, semana, mes y año encontrar las ventas totales semana, mes y año, ... para cada agencia encontrar las ventas totales semana, mes y año, ... Para cada modelo de carro encontrar las ventas totales por mes para todos las agencias en una ciudad, región y estado dados.

OLAP Servers Relacional OLAP (ROLAP): Multidimensional OLAP (MOLAP): DBMS relacional extendido que mapea operaciones en datos multidimensionales a operaciones relacionales estandar Almacen toda la información incluyendo fact tables como relaciones Multidimensional OLAP (MOLAP): Servidor de propósito especial que directamente implementa operaciones y datos multidimensionales Almacena conjuntos de datos multidimensionales como arreglos

OLAP Servers OLAP Híbrido (HOLAP): Da a los usuarios y administradores del sistema la libertad para seleccionar particiones.

OLAP Queries (Consultas) Roll up: resume datos dentro de una jerarquía de dimensión Si sabemos el volumen total de ventas por ciudad es posible agregar sobre la ubicaión (location) para obtener ventas por estado

OLAP Queries client city region roll up 10 3 21 New Orleans c1 c2 12 5 9 region 11 7 c3 7 Date of sale Poznań 12 11 15 c4 video CD Camera roll up

OLAP Queries Roll down, drill down: ir desde alto nivel de resumen hasta bajo nivel de resumen o datos detallados Para una categoría de producto particular, encontrar el detalle de ventas para cada vendedor por fecha Dado el total de ventas por estado, se pueden pedir las ventas por ciudad; o solo las ventas por ciudad para un estado seleccionado

OLAP Queries day 2 day 1 129 drill-down rollup

OLAP Queries Slice and dice: select and project Ventas de video en USA en los últimos 6 meses Slicing and dicing reducen el número de dimensiones Pivot: reorientar el cubo El resultado del pivoteo es llamado cross-tabulation Si se pivotea el cubo Sales en las dimensiones Client y Product, se obtiene una tabla para cada client para cada valor de product

OLAP Queries Pivoteo puede ser combinado con aggregation day 2 day 1

OLAP Queries Ranking: selección de los primeros n elementos (e.j. select los 5 mejores productos comprados en Julio) Otros: stored procedures, etc. Time functions e.j., time average