Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porEsperanza de la Fuente Carmona Modificado hace 9 años
1
Modelado de datos
2
La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los requerimientos de los usuarios?
3
¿Por qué es importante? Visualización del universo del negocio Modelo de abstracción de las “preguntas” que los usuarios necesitan responder Diseño del plan de implantación del Data Warehouse
4
Dos técnicas Modelo E-R –Entidades –Atributos –Relaciones Modelo dimensional –Hechos –Dimensiones –Medidas
5
Modelo E-R
6
Modelo dimensional: HECHOS Hechos : colección de items de datos y datos de contexto. Cada hecho representa un item de negocio, una transacción o un evento Los hechos se registran en las tablas CENTRALES del DW
7
Modelo dimensional: DIMENSION Una dimensión es una colección de miembros o unidades o individuos del mismo tipo Cada punto de entrada de la tabla de HECHOS está conectado a una DIMENSION Determinan el contexto de los HECHOS
8
Modelo dimensional: DIMENSIONES Se utilizan como parámetros para los análisis OLAP Dimensiones habituales son: –Tiempo –Geografía –Cliente –Vendedor
9
Modelo dimensional: DIMENSIONES - Miembros
10
Modelo dimensional DIMENSIONES - Jerarquía
11
Modelo dimensional DIMENSIONES : Medidas Medida : es un atributo numérico de un hecho que representa la performance o comportamiento del negocio relativo a la dimensión Ejemplos: –Ventas en $$ –Cantidad de productos –Total de transacciones, etc.
12
Visualización de un modelo dimensional
13
DW - OLAP El modelo dimensional es ideal para soportar las 4 operaciones básicas de la tecnología OLAP: –Relacionadas con la granularidad: ROLL UP - DRILL DOWN –Navegación por las dimensiones : SLICE - DICE
14
Drill Down - Roll Up
15
Slice and Dice
16
Modelos básicos dimensionales STARSNOWFLAKE
17
Star
18
SnowFlake
19
E-R - Modelo dimensional El modelo dimensional puede verse como un caso particular del modelo de ER Foreing keys Dimension Hecho Entidad
20
Datawarehousing process
21
Manage the Project Es un proceso cíclico e iterativo Refiere al manejo del PROYECTO, no al manejo del Warehouse (ONGOING)
22
Define the project ¿Qué se necesita analizar y por qué?¿Cuál es el alcance del proyecto? El contexto de definición y los alcances del proyecto DEBEN permitir FLEXIBILIDAD. NO deben ser demasiado específicos.
23
Requirements gathering Quién (personas, grupos, usuarios, etc) Qué (se quiere analizar) Por qué Cuándo (factores de oportunidad en el tiempo) Dónde (factores geográficos) Cómo definir las medidas
24
Source driven Los requerimientos se definen utilizando las fuentes de datos operacionales. La mayor ventaja es que de antemano se conoce que todos los datos podrán ser provistos ya que se sabe qué está disponible
25
Source driven Se minimiza el tiempo de interacción con los usuarios en las primeras etapas (se gana velocidad). El riesgo es producir un conjunto incorrecto de requerimientos por la poca participación del usuario El usuario recibe “lo que tenemos”
26
User driven Los requerimientos se definen a partir de las necesidades del usuario. Conduce a proyectos más acotados pero probablemente más útiles Tiene como desventaja que al no limitarse el pedido del usuario pueden solicitarse objetivos imposibles
27
Relevamiento: Source driven vs User driven
28
Source driven - User driven Data Mart : User driven Global Data Warehouse : Source driven para partir el proyecto en áreas temáticas. Luego para cada área se utiliza un enfoque User driven
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.