La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo.

Presentaciones similares


Presentación del tema: "Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo."— Transcripción de la presentación:

1 Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo a factores de negocio seleccionados, proveyendo el mecanismo para la rápida y uniforme tiempo de respuesta de las complejas consultas. Estos datos organizados en Cubos, son la materia prima que el DataWare House almacena.

2

3 Es sin duda, la más sencilla y común, consiste en realizar una sumarización o resumen de todas las transacciones comprendidas en el período de tiempo seleccionado y transportar el resultado como una única transacción hacia el DW.

4 El proceso de Rolling por su parte, se aplica en los casos en que se opta por mantener varios niveles de granularidad. Para ello se almacena información resumida a distintos niveles, correspondientes a distintas agrupaciones de la unidad de tiempo. Con lo que se consigue una carga de datos en etapas que están entrelazadas por los datos en tiempo y pueden depender una de otras.

5 COLECCIÓN DE DATOS Dimensiones Variables

6 Las dimensiones de un cubo son atributos relativos a las variables, son las perspectivas de análisis de las variables (forman parte de la tabla de dimensiones). Son catálogos de información complementaria necesaria para la presentación de los datos a los usuarios, como por ejemplo: descripciones, nombres, zonas, rangos de tiempo, etc. Es decir, la información general complementaria a cada uno de los registros de la tabla de hechos.

7 También llamadas indicadores de gestión, son los datos que están siendo analizados. Forman parte de la tabla de hechos. Más formalmente, las variables representan algún aspecto cuantificable o medible de los objetos o eventos a analizar. Normalmente, las variables son representadas por valores detallados y numéricos para cada instancia del objeto o evento medido. En forma contraria, las dimensiones son atributos relativos a la variables, y son utilizadas para indexar, ordenar, agrupar o abreviar los valores de las mismas. Las dimensiones poseen una granularidad menor, tomando como valores un conjunto de elementos menor que el de las variables; ejemplos de dimensiones podrían ser: productos, localidades (o zonas), el tiempo (medido en días, horas, semanas, etc.),...

8 construir un cubo de información sobre el indice de ventas (variable a estudiar) en función del producto vendido, la provincia, el mes del año y si el cliente está casado o soltero (dimensiones). Tendríamos un cubo de 4 dimensiones.

9 Beneficios Gastos Ventas producto (diferentes tipos o denominaciones de productos) localidades (o provincia, o regiones, o zonas geográficas) tiempo (medido de diferentes maneras, por horas, por días, por meses, pr años,...) tipo de cliente (casado/soltero, joven/adulto/anciano,...)

10 #. Son elementos claves en OLAP (Online Analytic Processing), una tecnología que provee rápido acceso a datos en un almacén de datos (DWH). #. Proveen un mecanismo para buscar datos con rapidez y tiempo de respuesta uniforme independientemente de la cantidad de datos en el cubo o la complejidad del procedimiento de búsqueda. #. Para definir un Cubo, se selecciona una o varias clases objetivo y se seleccionan las medidas (Campos de interés a los usuarios del cubo) dentro de esta clase. #.. Las dimensiones están compuestas de uno o mas campos de otra clase. Las dimensiones proveen la descripción categórica por el cual las medidas son separadas para su análisis por los usuarios del cubo.#. Las dimensiones son categorías descriptivas por los cuales los datos numéricos (Dimensiones) en un cubo, son separados para su análisis.#. Las medidas, son datos numéricos de interés primario para los usuarios del cubo.


Descargar ppt "Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo."

Presentaciones similares


Anuncios Google