Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porVeronica San Segundo Navarrete Modificado hace 6 años
1
Tema 6: Inteligencia de Negocios: Modelo Dimensional
Sistemas de Información Gerencial Tema 6: Inteligencia de Negocios: Modelo Dimensional Ing. Francisco Rodríguez Novoa
2
INDICE OLT y OLAP Modelo estrella y copa de nieve Modelo Dimensional
3
Mapa de Inteligencia de Negocios
Metodología Kimball Planeamiento del Proyecto Modelo del Negocio Modelado Dimensional Modelado Físico ETL Reportes Minería de Datos
4
MODELOS RELACIONALES Y DIMENSIONALES
5
Dos técnicas Modelo E-R Modelo dimensional Entidades Atributos
Relaciones Modelo dimensional Hechos Dimensiones Medidas
6
OLTP (On Line Transactional Process)
Son sistemas de información operacionales que tienen transacciones en línea y de esa manera se van añadiendo datos. Gran detalle de cada operación.
7
Lógica El Diseño Transaccional es:
Orientado a aplicaciones con movimientos constantes. Datos normalizados. Se busca ahorrar espacio de almacenamiento. Datos volátiles No existe sumarización de datos. Grandes niveles de detalle.
8
OLAP (Online Analytical Process)
Tecnología que permite la explotación de datos en diferentes niveles organizacionales y periodos de tiempo
9
Lógica El Data Warehouse esta: Orientado a áreas de la organización
Integrado Los datos no son volátiles Diversos niveles de detalle con sumarizaciónes. Se disminuye la cantidad de ligas con modelos tipo estrella o copo de nieve.
10
Conceptos Generales Fundamentos. Analizar y Evaluar (OLAP)
Registrar y Controlar (OLTP) Transacciones Ventas Inventarios Contabilidad Recursos Humanos Etc- Velocidad de Transacción Integridad de Información Evitar Redundancias “3ª Forma Normal” On-Line Transaction Processing Velocidad de Consultas Apoyo Toma de Decisiones “Desnormalizado” On-Line Analytical Processing
11
Como operan las B.D. Relacionales
Los datos se almacenan en tablas Cantidad 25000 15000 5000 27000 20000 6000 2700 8000 19000 54700 23000 6100 1800 7600 1200 2000 Variable Sales Expenses Cost of goods Meses January February March Qtr1 April May Productos Large Medium
12
de esta estructura a esta se necesita …
Lógica Amount 25000 15000 5000 27000 20000 6000 2700 8000 19000 54700 23000 6100 1800 7600 1200 2000 Variable Sales Expenses Cost of goods Months January February March Qtr1 April May Product Large Medium de esta estructura a esta se necesita … Variable January February March April May June Sales Expenses Cost of goods
13
OLAP Vista Multidimensional Poder observar los datos desde distintas perspectivas. Jan Feb Mar Apr TV VCR East West Total South Actual Budget Sales Margin position only Cogs Total Exp Profit Qtr 1 Variance Forecast SF LA Denver Camera Audio February March Accounts by Product Regions by Scenario Products by Region Products by Time
14
Conceptos Generales Características de un DataWarehouse
Orientado a Temas Los datos se organizan y estructuran de acuerdo a las áreas temáticas que son de interés para los directivos de la empresa y no en función de procesos operacionales específicos. Todos los datos relativos a una misma “entidad” quedarán en una tabla. Integrado Debido a que la información procede desde distintos sistemas, es tarea del DW integrar las diversas fuentes y normalizar los datos. Variantes en el Tiempo Un DW se organiza como una sucesión de “fotografías” de la organización o empresa, cada una asociada a un periodo o punto específico del tiempo, lo que permite realizar análisis en función del tiempo, con la finalidad de realizar pronósticos y análisis de tendencias. No Volátil No se realizan actualización o eliminaciones de los datos, los datos se insertan como nuevos registros y por tanto no sobrescriben los existentes.
15
Conceptos Generales Componentes del Cubo Tabla de Hechos
Almacena los indicadores del negocio (datos numéricos), tanto básicos como elementos calculados. Tabla de Dimensiones Almacena los datos descriptivos, por lo general son tablas con un porcentaje muy bajo de filas en relación a las tablas de Hechos, pero pueden contener muchas más columnas. Una correcta y completa definición de campos en la tabla de dimensiones puede ayudar a realizar análisis robusto sobre los datos.
16
Conceptos Generales Topología
Las dimensiones se relacionan directamente con la tabla de hechos. Por lo general esta estrategia es utilizada cuando hay grandes volúmenes de información y/o cuando existe un proceso robusto de administración de Información (por ejemplo EIAD). Estrella Las dimensiones se pueden relacionar con las tablas de hechos, o con otras dimensiones. Esta estrategia es mejor para la administración directa en el modelo de DW. Copo de Nieve
17
Modelo Estrella Eficiencia Soportado por múltiples RDBMS
Análisis de datos de menor complejidad, debido a la de-normalización
18
Modelo Copo de Nieve Mayor normalización, es decir, los niveles de las jerarquías se normalizan. Mayor flexibilidad Mayor dificultad de mantenimiento Joins más costosos Menos registros en las dimensiones.
19
Modelado Dimensional Es una adaptación del modelo relacional.
Consiste de tablas de hechos que se caracterizan usando dimensiones y medidas. La información sobre un hecho (actividad) se representa mediante indicadores (medidas o atributos de hecho). La información de cada dimensión se representa por un conjunto de atributos (atributos de dimensión). Una dimensión es el contexto de un hecho, tienden a ser discretas y jerárquicas. Un indicador es una cantidad que describe el hecho, debe ser agregables.
20
Conceptos básicos Hecho. Evento, actividad, item transacción del negocio. Medida. Atributo o medida de hechos, métricas del negocio Dimensión. Característica de un hecho. Jerarquía. Relaciones padre-hijo dentro de una dimensión Tabla de hechos: Almacena eventos y las métricas. Tabla de dimensión. Almacenan las dimensiones.
21
Hechos Representan un evento o actividad específica, tiene dimensiones y medidas. Representan un item de negocio, una transacción o un evento que tiene significancia para el negocio. Corresponden a una colección de items de datos y datos de contexto. Son aquellos datos que residen en una tabla de hechos y que son utilizados para crear indicadores, a través de sumarizaciones preestablecidas. Un hecho debe estar relacionado al menos con una dimensión: “El tiempo”.
22
Medidas – Métricas - Hechos
Es un atributo numérico de un hecho que representa la performance o comportamiento del negocio relativo a la dimensión Ejemplos: Ventas en $$ Cantidad de productos Total de transacciones Cantidad de pacientes admitidos Llamadas efectuadas. ImporteTotal = precioProducto * cantidadVendida Rentabilidad = utilidad / PN CantidadVentas = cantidad PromedioGeneral = AVG(notasFinales)
23
Hechos o medidas Representan los valores que son analizados.
Características de las medidas: Deben ser numéricas. Porque estos valores son las bases de las cuales el usuario puede realizar cálculos. Cruzan todas las dimensiones en todos los niveles. Si la medida es no numérica debemos codificarla a un valor numérico y cuando tengamos que exponerla decodificarla para mostrarla con el valor original.
24
Hechos o medidas Las medidas pueden clasificarse en: Naturales.
Son aquellas que se obtiene por agregación de los datos originales. Suma: suma los valores de las columnas Cuenta: conteo de los valores Mínima: valor mínimo Máxima: valor máximo Cuenta de Distintos: valores diferentes Calculadas Si se derivan de una medida natural. Cálculos Matemáticos Expresiones condicionales Alertas
25
Dimensiones Es una característica de un hecho que permite su análisis posterior, en el proceso de toma de decisiones. Determina el contexto del hecho (quién participó, cuándo y donde pasó y su tipo). Es una entidad de negocios respecto de la cual se deben calcular las métricas (clientes, productos, tiempo) Tienden a ser discretas y jerárquicas <país, región, departamento, provincia, distrito>. Es una colección de miembros o unidades o individuos del mismo tipo que permite categorizar un hecho.
26
Dimensiones Se utilizan como parámetros para los análisis OLAP
3 Se utilizan como parámetros para los análisis OLAP Las dimensiones habituales son: Dimensión Miembro Tiempo Meses, Trimestre, Años Geografía País, Región, Ciudad Cliente Id Cliente Vendedor Id Vendedor
27
Ejemplo
28
Ejemplo
29
How and where should it be stored?
The Time Dimension Time is critical to the data warehouse. A consistent representation of time is required for extensibility. Sales fact Time dimension How and where should it be stored? The Time Dimension Because online transaction data, typically the source data for the warehouse, does not have a time element, you apply an element of time in the extraction, transformation and transportation process. For example, you might assign a week identifier to all the airline tickets that sold within that week. The transaction may not have a time of date stamp on it, but you know what date the sale has occurred by the generation of the transaction file. The dimension of time is most critical to the data warehouse. A consistent representation of time is required for extensibility. Storing the Time Dimension Typically there is a time dimension table in the data warehouse although time elements may be stored on the fact table. Before deciding where to store time, you must consider the following: Almost every data warehouse has a time dimension. Organizations use a variety of time periods for data analysis. A row whose key is an SQL date, may be populated. with additional time qualifiers needed to perform business analysis, such as: workday, fiscal period, and special events. Time key on the fact table (usually in SQL DATE format) could be enough if queries limit themselves to day, month, or year-type analyses.
30
Granularidad Por ejemplo:
La granularidad es el nivel de detalle en que se almacena la información. Por ejemplo: Datos de ventas o compras de una empresa, pueden registrarse día a día Datos pertinentes a pagos de sueldos o cuotas de socios, podrán almacenarse a nivel de mes. A mayor nivel de detalle, mayor posibilidad analítica, ya que los mismos podrán ser resumidos o sumarizados. Los datos con granularidad fina (nivel de detalle) podrán ser resumidos hasta obtener una granularidad media o gruesa. No sucede lo mismo en sentido contrario.
31
Tablas de Hechos Dimensiones Las tablas de hechos contienen las dimensiones y las medidas de los hechos. Los hechos o medidas son los valores de datos que se analizan (son numéricos). La tabla de hechos tiene una compuesta por las claves primarias de las tablas de dimensiones relacionadas a este. Clave primaria Medidas o hechos
32
Tabla de dimensiones Definen la organización lógica de los datos.
6 Definen la organización lógica de los datos. Tiene una PK (única) y columnas de referencia: Clave principal (PK) o identificador único. Clave foráneas. Datos de referencia primarios (identifican la dimensión) Datos de referencia secundarios (complementan la descripción). No siempre la PK del OLTP, corresponde con la PK de la tabla de dimensión relacionada.
33
Ejercicio Etapas en la construcción de un modelo dimensional: 2 3 4 1
Requerimientos del usuario Construcción de las Dimensiones Armado de la Tabla de Hechos Definición de las Medidas 2 3 4 Decidir la granularidad 1
34
Requerimientos del usuario
Dimensiones Medidas Tiempo Sucursal Vendedor Cliente Producto Ventas_Importe X Ventas_Costo Ventas_Unidades Ventas_ImporteTotal Ventas_Ganancia Ventas_Promedio
35
Decidir la granularidad
Es el nivel de detalle al que se desea almacenar información sobre la actividad a modelar. Define el nivel atómico de datos en el almacén de datos. Determina el significado de las tuplas de la tabla de hechos. Determina las dimensiones básicas del esquema. Por ejemplo en la dimensión Sucursal:
36
Decidir la granularidad
Ejemplo de la dimensión fecha. Se desea los datos por: Información anual Información semestral Información trimestral Información mensual. .... Información semanal Información diaria Transacción en el OLTP + granularidad + detalle
37
Construcción de las dimensiones
Identificar las dimensiones que caracterizan el proceso al nivel de detalle (gránulo) que se ha elegido. De cada dimensión se debe decidir los atributos (propiedades) relevantes para el análisis de la actividad. Entre los atributos de una dimensión existen jerarquías naturales que deben ser identificadas (día-mes-año) Tiempo. Cuándo se produce la actividad Sucursal. Donde está ubicado el almacén Vendedor. Quién ha vendido Cliente. Quién es el destinatario de la actividad Producto. Cuál es el objeto de la actividad
38
Dimensiones Medidas Tiempo Sucursal Vendedor Cliente Producto Ventas_Importe X Ventas_Costo Ventas_Unidades Ventas_ImporteTotal Ventas_Ganancia Ventas_Promedio
39
Dimensiones Medidas Tiempo Sucursal Vendedor Cliente Producto Ventas_Importe X Ventas_Costo Ventas_Unidades Ventas_ImporteTotal Ventas_Ganancia Ventas_Promedio
40
Tabla de Hechos 3 Dimensiones Medidas Tiempo Sucursal Vendedor Cliente
Producto Ventas_Importe X Ventas_Costo Ventas_Unidades Ventas_ImporteTotal Ventas_Ganancia Ventas_Promedio
41
Definición de las medidas
42
FIN
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.