La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

María Trinidad Serna Encinas

Presentaciones similares


Presentación del tema: "María Trinidad Serna Encinas"— Transcripción de la presentación:

1 María Trinidad Serna Encinas
1er. Taller de Investigación Red TIC’s Bases de Datos Multidimensionales María Trinidad Serna Encinas

2 Plan de la exposición Introducción Almacenes de datos Modelos de datos
Arquitectura de un Almacén de Datos Procesos de un Almacén Modelos de datos ROLAP MOLAP Operaciones OLAP Servidores OLAP Trabajos y proyecto de investigación

3 Introducción Base de datos: Conjunto de datos interrelacionados con una estructura lógica. Modelo Relacional Relaciones Catálogos Transacciones o eventos Atributos Simples o compuestos Monovalorados o multivalorados Calculados

4 SMBD Asegurar las características ACID Atomicity – Atomicidad
Consistency – Consistencia Isolation – Independencia Durability - Persistencia

5 Introducción (cont.) Grandes cantidades de información en los sistemas operacionales. Necesidad de analizar el conjunto de información. Inicio de los 90’s surgen los almacenes de datos como un soporte a la toma de decisión.

6 Almacén de Datos Bill Inmon define un almacén de datos como: “Una colección de datos orientado por tema, integrados, no volátiles que se emplea como apoyo a la toma de decisiones estratégicas“ Tablas de hechos (Tablas de transacciones o eventos) Claves foráneas Medidas Dimensiones (Tablas de catálogos) Clave primaria Atributos descriptivos Jerarquías (Dimensiones con atributos de nivel) Atributos de nivel

7 Arquitectura genérica de un Almacén de Datos

8 Procesos de un Almacén Extracción-Integración:
Analizar las fuentes de datos Extracción de la información Transformación de la información Limpieza Estandarización Agregación Carga

9 Procesos de un almacén (cont.)
Organización: Nivel de granularidad Ligeramente agregados Fuertemente agregados Vistas materializadas Cuántas y cuáles Algoritmos de selección ⇨ Optimizar la ejecución de consultas Actualización Incremental Total

10 Procesos de un Almacén (cont.)
Interrogación Visualización bidimensional Imbricación de las dimensiones No importa el número, pero su interpretación puede volverse compleja Visualización tridimensional Cubos de datos Cardinalidad de las dimensiones Hasta 3 dimensiones, en caso de seleccionar 4 dimensiones, una debe fijarse Datos esparcidos

11 Modelos de datos Modelo Relacional (ROLAP) Esquema en estrella

12 Esquema en copos de nieve

13 Esquema en constelación

14 Modelo ROLAP Ventaja Desventajas Almacenamiento eficiente
Implementación sencilla Desventajas Visualización bidimensional Imbricación de las dimensiones

15 Modelo de datos Modelo multidimensional (MOLAP)

16 Modelo MOLAP Ventajas Desventajas Visualización tridimensional
Eficiencia en la ejecución de consultas Desventajas Almacenamiento costoso Materialización total

17 Operaciones OLAP Operadores clásicos: Este tipo de operadores permiten obtener un subconjunto de datos proporcionando condiciones de filtrado de datos. Ejemplos de este tipo de operadores son: Selección, Proyección, Reunión, Unión, Intersección, entre otros. A las operaciones de selección y de proyección se les llama Slice & Dice.

18 Operador: Slice & Dice

19 Operaciones OLAP Operadores que afectan la estructura: Permiten dar un aspecto interactivo de la manipulación OLAP. Algunos ejemplos de operadores de este tipo son: Rotate, Switch, Split, entre otros. Por ejemplo el operador Rotate permite girar el cubo para ver otra perspectiva de análisis.

20 Operador Rotate

21 Operaciones OLAP Operadores que afectan la granularidad: Estos operadores, permiten subir o bajar un nivel de detalle de los datos de una jerarquía. Existen dos tipos de operadores los cuales son: Roll-Up y Drill-Down.

22 Operador Roll-Up y Drill-Down

23 Servidores OLAP ROLAP MOLAP HOLAP

24 Diferencias entre SMBD y los AD
Objetivos diferentes SMBD: Registro diario de las transacciones AD: Análisis de los datos Tipos de consultas: SMBD: Consultas simples, existe concurrencia AD: Consultas complejas y agregadas (sumarización de grandes cantidades de datos), no existe concurrencia Datos SMBD: Datos de detalle, actuales AD: Datos agregados, actuales e históricos Usuarios SMBD: Usuarios finales (operadores) AD: Directivos y ejecutivos (toman decisiones)

25 Trabajos Algoritmo de selección de vistas materializadas para la arquitectura ROLAP Cuántas y cuáles? Modelo de costos (costo de almacenamiento) Frecuencia de uso Costo de cálculo Probabilidad de cambio Sistema de versiones de esquema Cambios en la estructura lógica del SMBD Operadores para la creación y manipulación de versiones de esquema Falta proponer un lenguaje de consulta ad-hoc

26 Proyectos en curso Sistema de integración y visualización de datos multidimensionales ( ) Tesis de maestría: Sistema de integración de datos multidimensionales Tesis de maestría: Visualización tridimensional de datos multidimensionales

27 Gracias


Descargar ppt "María Trinidad Serna Encinas"

Presentaciones similares


Anuncios Google