Descargar la presentación
La descarga está en progreso. Por favor, espere
1
María Trinidad Serna Encinas
1er. Taller de Investigación Red TIC’s Bases de Datos Multidimensionales María Trinidad Serna Encinas
2
Plan de la exposición Introducción Almacenes de datos Modelos de datos
Arquitectura de un Almacén de Datos Procesos de un Almacén Modelos de datos ROLAP MOLAP Operaciones OLAP Servidores OLAP Trabajos y proyecto de investigación
3
Introducción Base de datos: Conjunto de datos interrelacionados con una estructura lógica. Modelo Relacional Relaciones Catálogos Transacciones o eventos Atributos Simples o compuestos Monovalorados o multivalorados Calculados
4
SMBD Asegurar las características ACID Atomicity – Atomicidad
Consistency – Consistencia Isolation – Independencia Durability - Persistencia
5
Introducción (cont.) Grandes cantidades de información en los sistemas operacionales. Necesidad de analizar el conjunto de información. Inicio de los 90’s surgen los almacenes de datos como un soporte a la toma de decisión.
6
Almacén de Datos Bill Inmon define un almacén de datos como: “Una colección de datos orientado por tema, integrados, no volátiles que se emplea como apoyo a la toma de decisiones estratégicas“ Tablas de hechos (Tablas de transacciones o eventos) Claves foráneas Medidas Dimensiones (Tablas de catálogos) Clave primaria Atributos descriptivos Jerarquías (Dimensiones con atributos de nivel) Atributos de nivel
7
Arquitectura genérica de un Almacén de Datos
8
Procesos de un Almacén Extracción-Integración:
Analizar las fuentes de datos Extracción de la información Transformación de la información Limpieza Estandarización Agregación Carga
9
Procesos de un almacén (cont.)
Organización: Nivel de granularidad Ligeramente agregados Fuertemente agregados Vistas materializadas Cuántas y cuáles Algoritmos de selección ⇨ Optimizar la ejecución de consultas Actualización Incremental Total
10
Procesos de un Almacén (cont.)
Interrogación Visualización bidimensional Imbricación de las dimensiones No importa el número, pero su interpretación puede volverse compleja Visualización tridimensional Cubos de datos Cardinalidad de las dimensiones Hasta 3 dimensiones, en caso de seleccionar 4 dimensiones, una debe fijarse Datos esparcidos
11
Modelos de datos Modelo Relacional (ROLAP) Esquema en estrella
12
Esquema en copos de nieve
13
Esquema en constelación
14
Modelo ROLAP Ventaja Desventajas Almacenamiento eficiente
Implementación sencilla Desventajas Visualización bidimensional Imbricación de las dimensiones
15
Modelo de datos Modelo multidimensional (MOLAP)
16
Modelo MOLAP Ventajas Desventajas Visualización tridimensional
Eficiencia en la ejecución de consultas Desventajas Almacenamiento costoso Materialización total
17
Operaciones OLAP Operadores clásicos: Este tipo de operadores permiten obtener un subconjunto de datos proporcionando condiciones de filtrado de datos. Ejemplos de este tipo de operadores son: Selección, Proyección, Reunión, Unión, Intersección, entre otros. A las operaciones de selección y de proyección se les llama Slice & Dice.
18
Operador: Slice & Dice
19
Operaciones OLAP Operadores que afectan la estructura: Permiten dar un aspecto interactivo de la manipulación OLAP. Algunos ejemplos de operadores de este tipo son: Rotate, Switch, Split, entre otros. Por ejemplo el operador Rotate permite girar el cubo para ver otra perspectiva de análisis.
20
Operador Rotate
21
Operaciones OLAP Operadores que afectan la granularidad: Estos operadores, permiten subir o bajar un nivel de detalle de los datos de una jerarquía. Existen dos tipos de operadores los cuales son: Roll-Up y Drill-Down.
22
Operador Roll-Up y Drill-Down
23
Servidores OLAP ROLAP MOLAP HOLAP
24
Diferencias entre SMBD y los AD
Objetivos diferentes SMBD: Registro diario de las transacciones AD: Análisis de los datos Tipos de consultas: SMBD: Consultas simples, existe concurrencia AD: Consultas complejas y agregadas (sumarización de grandes cantidades de datos), no existe concurrencia Datos SMBD: Datos de detalle, actuales AD: Datos agregados, actuales e históricos Usuarios SMBD: Usuarios finales (operadores) AD: Directivos y ejecutivos (toman decisiones)
25
Trabajos Algoritmo de selección de vistas materializadas para la arquitectura ROLAP Cuántas y cuáles? Modelo de costos (costo de almacenamiento) Frecuencia de uso Costo de cálculo Probabilidad de cambio Sistema de versiones de esquema Cambios en la estructura lógica del SMBD Operadores para la creación y manipulación de versiones de esquema Falta proponer un lenguaje de consulta ad-hoc
26
Proyectos en curso Sistema de integración y visualización de datos multidimensionales ( ) Tesis de maestría: Sistema de integración de datos multidimensionales Tesis de maestría: Visualización tridimensional de datos multidimensionales
27
Gracias
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.