Consulta Típica en OLAP

Slides:



Advertisements
Presentaciones similares
Procesamiento y Análisis en Línea OLAP
Advertisements

Cubos de Información Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se.
OLAP - Herramienta para el A.D.
OLAP Mg. Samuel Oporto Díaz.
Gestar Analyzer (Business Intelligence)
Front-end y Back-end Definición en diseño de software.
Cognos Data Integration
ORACLE OLAP Integrantes: *Aizaga, Martiniano *Gallegos, Marina
DATA WAREHOUSE Presentador Por: Andrés Fabián Cortes Solano.
Optimización de Consultas Distribuidas
BASES DE DATOS MULTIDIMENSIONALES
• SQL Server Analysis Services
• SQL Server Analysis Services
DESARROLLO DE CUBOS OLAP
Informe caso de estudio Implementación de un Datawarehouse
Jesús Angel Ovando División de Estudios de Posgrado Instituto Tecnológico de Orizaba.
Modelo Multidimensional
SIMULACION DE UN COMPUTADOR CUANTICO
On Line Analytical Processing
MOTORES DE BASE DE DATOS
Diseño de Bases de Datos Distribuidas (1era Parte)
REDES BAYESIANAS Y DECISIÓN ESTADÍSTICA
PROGRAMACIÓN PARALELA EN ALGORITMOS SOBRE GRAFOS
Las Bodegas de Datos (Data warehouses)
PROCESO DE DESARROLLO. Introducción Mediante esta presentación se pretende describir el proceso de desarrollo del TALLER I.
Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos aggregados –Analizar resultados –Visualizar resultados El conjunto.

 LOPEZ MENDOZA CORINA AMALINALLI  GRUPO 304.  Una base de datos o banco de datos (en ocasiones abreviada BB.DD.) es un conjunto de datos pertenecientes.
Ing. Fabián Ruano.  Definición  Diferencias con BD Centralizadas.
ESTRUCTURAS DE DATOS I Conocer, comprender y analizar algunos de los principales tipos de estructuras de datos.
Bases de Datos II OLAP Online Analytical Processing
DATA MART Los data warehouses están hechos para proporcionar una fuente de datos única para todas las actividades de apoyo para la toma de decisiones.
Algoritmos.
Implementación de Datawarehouse

Paola Saavedra -
BASE DE DATOS BY: Julián Villar Vázquez.
Mt. Martín Moreyra Navarrete.
(Organización y Manejo de Archivos)
Qué son las Bases de Datos Conceptos Básicos. Definición de Bases de Datos  Una base de datos o banco de datos es un conjunto de datos que pertenecen.
OLAP vs OLTP.
DOMAIN NAME SYSTEM, SISTEMA DE RESOLUCIÓN DE NOMBRES). DNS.
Simular: Representar una cosa, fingiendo o imitando lo que no es.
Taller de Base de Datos Reglas de Asociación a Múltiples Niveles “Mining Generalized Association Rules”. Srikant, Agrawal VLDV En muchas aplicaciones.
Elaborado por: GCRM Institución Gabriel García Márquez.
Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los.
Parte I. Estructuras de Datos.
O3 Conceptos & Definiciones. 2 La creación de Modelos Multidimensionales es una disciplina específica, cuyo objetivo es presentar la información en un.
Utilización de memoria del O3 Server Caché de cubos.
Parte I. Estructuras de Datos.
Taller de Base de Datos Procesamiento Analítico en Línea ¿Qué es OLAP? Imaginemos el siguiente escenario: Una cadena de supermercados posee una (o varias)
Inteligencia de Negocios (Presentación)
Data Compatibility 100% OLE DB architecture (including ODBC) 100% OLE DB architecture (including ODBC) Relational and non-relational sources Relational.
Diseño de Sistemas.
ISAE UNIVERSIDAD FACULTAD DE CIENCIAS TECNOLOGICAS TECNICO EN INFORMATICA CURSO TECNOLOGIA DE LA INFORMACIÒN Y COMUNICACIÒN PARTICIPANTES: DEXSI DELGADO.
Ingeniería de Requisitos
ORACLE OLAP CAECE Integrantes: *Aizaga, Martiniano *Gallegos, Marina *Kleinlein, Guillermo *Schiano di Cola, Emiliano.
Introducción a la Optimización de Consultas. Francisco Moreno.
Introducción al Data Warehouse
SQL Server Analysis Services SSAS
Taller de Inteligencia de Negocios SQL Server Analysis Services Semana 8.
FUNDAMENTOS INFORMÁTICOS
Datawarehousing. Business Intelligence software que le posibilita a los usuarios la obtención de informaciones corporativas mas fácilmente. El software.
María Trinidad Serna Encinas
Ing. Ernesto Sierraalta Fundamentos de Desarrollo de Proyectos de Inteligencia de Negocios ( Decision Support Systems & Data Warehousing.
Almacén de Datos MC BEATRIZ BELTRÁN MARTÍNEZ. Primavera 2016 MC BEATRIZ BELTRÁN MARTÍNEZ 33 Definición Colección de datos orientada a un dominio, integrado,
Fundamentos de Ingeniería de Software
Administración de Base de Datos Procesamiento y Optimización de Consultas Prof Mercy Ospina Torres Prof Renny A. Hernandez
BASES DE DATOS DISTRIBUIDAS M.C.C. María Guadalupe Villanueva Carrasco INGENIERIA EN SISTEMAS COMPUTACIONALES.
1 Conferencia 5 OLAP. 2 Contenido Definición OLAP. Reglas de Codd. Gestores que dan soporte OLAP y los diferentes modos de Almacenamiento.
Transcripción de la presentación:

Consulta Típica en OLAP Taller de Base de Datos Consulta Típica en OLAP Encontrar el total y número de unidades vendidas para marca en el primer semestre de 1997

Formulación de consultas en OLAP Taller de Base de Datos Formulación de consultas en OLAP Inspeccionar las dimensiones Imponer una condición sobre las dimensiones (ej. Semestre=1S97) Seleccionar atributos y categorías (granularidad). Seleccionar medidas y agregaciones(ej. Sum(f.pesos)) Observar el resultado, e investigar por qué, lo que implica una nueva consulta.

Operadores OLAP Taller de Base de Datos Roll-up: Cambiar una categoría en la granularidad por una categoría menos fina. Drill-down: inverso de Roll-Up. Navegación: secuencia de roll-up y drill-downs Drill-across: cruzar más de una tabla de hechos Slice: imponer condiciones sobre las dimensiones Pivot: elegir atributos para la tabla de salida y cambiar la disposición de los atributos. Etc.

Taller de Base de Datos Cubo de Datos

Grafo de Dependencia de un Cubo de Datos Taller de Base de Datos Grafo de Dependencia de un Cubo de Datos

Almacenamiento de un Cubo de Datos en un Sistema OLAP Relacional Taller de Base de Datos Almacenamiento de un Cubo de Datos en un Sistema OLAP Relacional

Taller de Base de Datos Un cubo de datos puede tener hasta: E1xE2x…xEn hechos, donde Ei es el número de elementos de la dimensión i. Tamaño del cubo es cercano a la tabla de hechos base si los datos son densos y la jerarquía se condensa fuertemente a medida que nos acercamos a All. En general puede ser MUCHO MÁS grande (data cube explosión) Ejemplo: benchmark TCP/Dpart customer supplier, la tabla de hechos base tiene 6 millones de tuplas, el cubo tiene 19 millones.

Algoritmo Básico para calcular un cubo de datos Taller de Base de Datos Algoritmo Básico para calcular un cubo de datos Algoritmo 2N para cubos simples (dimensiones tiene una categoría a parte de All). Procedimiento Iter(&handle,v) agrega el valor v a una dirección asociada a la tupla (punto) handle. Leemos la tabla de hechos y por acada tupla t=<x1,…,xn,v> llamamos 2n veces Iter(handle,v). Para cada tupla handle se despliega final(&handle) Iter se puede implementar usando una tabla de hash. Número de llamadas a Iter=2nxT,donde n es el número de dimensiones y T es la cardinalidad de la tabla de hechos base.

Computación Eficiente de Cubos de Datos Distributivos Taller de Base de Datos Computación Eficiente de Cubos de Datos Distributivos Cubos de datos distributivos: funciones de agregación distributivas. Ejemplos: SUM, MAX, MIN. Recordemos que cada granularidad define una vista cúbica. <codProducto, codSuper, fecha> define un cuboide de 3 dimensiones. <codProducto, codSuper, All> define un cuboide de 2 dimensiones. Todo cuboide de dimensión K puede ser computado usando algún cuboide de dimensión K-1 Ejemplo: Para todo punto <All, p1, All>, V(All,p1,All)=G({V(All, p1,fi) | fi є Mi}).

Algoritmo PipeSort y PipeHash Taller de Base de Datos Algoritmo PipeSort y PipeHash

Taller de Base de Datos Algoritmo PipeHash Idea general algoritmo PipeHash (S. Agrwal et al, VLDB 96): Para cada vista cúbica definido por una granularidad G elegir un cuboide G’. Es decir, tenemos que elegir un árbol del grafo de dependencia que cubra todos los nodos y cuya raíz sea el cuboide inferior (minimun Spannig Tree) Hay muchos árboles posibles, si computamos el cubo usando tablas de hash, elegimos los antecesores más pequeños. Particionar el árbol en subarboles, cada subarbol se computa por separado con una sóla lectura del cuboide de su raíz.

Procesamiento de Consultas en OLAP Taller de Base de Datos Procesamiento de Consultas en OLAP Almacenar sólo tabla de hechos base, computar los cuboides en tiempo de consulta. Problema: computar un cuboide sobre dimensiones simples toma tiempo proporcional al tamaño de la tabla de hechos base. Materializar completamente el cubo (no siempre es posible) Problema explosión del cubo Costos de actualización Materializar sólo algunos cuboides y usar navegación de agregados (Harinaraya et al 1996).

Navegación en Agregados Taller de Base de Datos Navegación en Agregados Supongamos que queremos computar <All, proveedor, All> en TPC-D Benchmark Navegación en agregados: proceso en que se reformula un cuboide requerido por el usuario como una consulta que se refiere a otro(s) cuboide pre- computado.

Navegador en Agrados (cont) Taller de Base de Datos Navegador en Agrados (cont)

Navegación en Agrados (cont) Taller de Base de Datos Navegación en Agrados (cont) Cuboide C: <codProducto, semestre> Consulta Q: ¿Cuánto jabón se ha vendido cada año? SELECT from C WHERE codProd=‘Jabón’: Roll-Up de semestre a año En general si: C y Q son sobre el mismo conjunto de dimensiones, Las condiciones de Q implican las de C y La granularidad de C es más fina que la granularidad de Q, Entonces C se puede usar para responder Q.

Herramientas para WareHouses OLAP Taller de Base de Datos Herramientas para WareHouses OLAP Back- End: extracción de datos, integración, limpieza, carga, mantención incremental Servidor: procesamiento de consulta Front-end: clientes OLAP, herramientas de consulta y visualización, reportes Otras: monitoreo, administración, meta-datos

Actualidad y Futuro de OLAP Taller de Base de Datos Actualidad y Futuro de OLAP Extensiones del modelo multidimensional (ej., dimensiones heterogéneas), datos semiestruturados (XML), teoría de Diseño en este contexto. Minería de datos organizados en modelos OLAP. Sistemas MOLAP escalables: Sistema T3 de Microsoft, EMC, Knosys, Unisys. Cubo de datos de 1.2 Terabyte de datos base, 7.6 billones de hechos (tuplas), 50 usuarios concurrentes, respuestas a consolidaciones toman 0.02-0.08 seg.