La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Taller de Base de Datos Procesamiento Analítico en Línea ¿Qué es OLAP? Imaginemos el siguiente escenario: Una cadena de supermercados posee una (o varias)

Presentaciones similares


Presentación del tema: "Taller de Base de Datos Procesamiento Analítico en Línea ¿Qué es OLAP? Imaginemos el siguiente escenario: Una cadena de supermercados posee una (o varias)"— Transcripción de la presentación:

1 Taller de Base de Datos Procesamiento Analítico en Línea ¿Qué es OLAP? Imaginemos el siguiente escenario: Una cadena de supermercados posee una (o varias) bases de datos operacional que registra información sobre: Supermercados( y sus descripciones) Productos (y sus descripciones) Precios de productos y promociones Proveedores y partes entregados por ellos Inventarios en bodegas y supermercados Ordenes de compra a proveedores, transacciones y facturas Transacciones de venta en cada supermercado Programa clientes frecuentes, recursos humanos, etc.

2 Taller de Base de Datos Procesamiento Analítico en Línea Parte II Esta base de datos está optimizada para realizar procesamiento transaccional en línea (OLTP), es decir esta base de datos se encuentra totalmente optimizada. Complejidad de la base de datos Debido a que la base de datos está normalizada, esta tiene 500 tablas ( no es extraño encontrar base de datos con cientos de tablas). Por ejemplo, solo para describir a los supermercados podrías tener:

3 Taller de Base de Datos Supermercado(SupId,Area,DireccionId,AdministradorId,…) Direccion(DireccionId,Calle,Numero,ComunaId,…) Comuna(ComunaId,AreaDeVentaId,RegionId,NumHabitantes,…) RegionId(RegionId,NumHabitantesPaisId,…) Administrador(AdministradorId,Nombre,Suledo,ContradoId,…) Contrato(ContratoId,Tipo,Texto,…) Etc.

4 Puede ser difícil visualizar una Base de Datos de esta naturaleza Taller de Base de Datos

5 Consultas Analíticas (Reportes) Un analista de la cadena de supermercados necesita investigar las ventas totales. Se contacta con el administrador de la base de datos y le solicita la siguiente información Ventas totales por semana, supermercado y tipo de producto Productos más vendidos en los últimos dos meses Etc. El administrador calcula estos datos vía consultas SQL de la siguiente forma: Taller de Base de Datos

6 Consultas Analíticas (Reportes) Taller de Base de Datos

7 Proceso Tradicional para calcular Consultas analíticas Después de leer el reporte, el analista observa que las ventas de la semana 10 del año 2002 son especialmente altas: necesita saber por qué. Solicita al administrador las ventas por día en la semana 10 del 2002. Otra futuras indagaciones generan una serie de solicitudes/entregas de reportes entre el analista y el administrador de la base de datos Taller de Base de Datos

8 Data Warehouse OLAP Idea: construyamos un sistema para el ANALISTA con las siguientes características: Guarde datos sobre un único tema o proceso –Ejemplo, proceso de venta obtenido de la base de datos operacional. No es necesario que los datos estén totalmente actualizados. Fácil de visualizar, por ejemplo, datos organizados de acuerdo a conceptos que sean fáciles de entender para los analistas: Modelo Multidimensional. Fácil formulación de consultas, consultas a distintas granularidades: Operadores. Respuestas en el orden de los pocos segundos. Esto es un data warehouse OLAP Taller de Base de Datos

9 Arquitectura de un Data Warehouse OLAP Taller de Base de Datos

10 OLTP vs OLAP Taller de Base de Datos

11 Historia de OLAP Pre-Historia –80’s Bases de datos estadisticas (ej. Statistical Object Representation Model (STORM) Rafanelli y Shoshani) –Operadores de Agregación enBase de datos Relacionales (SELECT-FROM-WHERE-GROUP BY) Despegue –1993. Codd et al. Providing OLAP to user-analysts: an IT mandate, Arbonsoft. –1995. Gray et al. Data Cube: A relational Operator Generalizing Group-By, cross-tab and sub total –1996. Benchmark para OALP Taller de Base de Datos

12 Modelo de Datos Multidimencional El proceso a analizar se representa como: Un conjunto de Dimensiones: –Perspectivas que usamos para visualizar el proceso. –Estructuradas como jerarquías –Generalmente pequeñas. Un conjunto de hechos (facts): –Asignaciones de mediciones a puntos en espacios formados por dimensiones. –Agrupados en tablas de hechos –Esta tabla cambia frecuentemente. –Grande (GB’s o TB’s) Taller de Base de Datos

13 Ejemplo: Cadena de Supermercados Hecho: n unidades de un producto p fueron vendidas en una fecha d por x pesos en una tienda Dimensiones: –Producto: código, descripción, marca, categoría, etc. –Lugar: código, nombre, dirección, tipo, etc. –Tiempo: fecha, día, semana, mes, semestre, año, etc. Medidas: –Número de unidades. –Precio de venta. –Costo Taller de Base de Datos

14 Ejemplo: Información Climática Hecho: en la latitud x, longitud y, altitud a y fecha d fue medida una temperatura t y presión p Dimensiones: –Latitud. –Longitud. –Altitud. –Fecha Medidas: –Temperatura. –Presión. Taller de Base de Datos

15 Ejemplo: Modelo Multidimensional de un Buscador Taller de Base de Datos

16 Esquema Estrella (Star Scheme) Taller de Base de Datos

17 Esquema Copo de Nieve (Snowflake Scheme) Taller de Base de Datos

18 Tamaño de las Tablas Dimensión Tiempo: 2 años x 365 días=730 Dimensión Lugar : 100 supermercados. Dimensión Producto:30000 productos, 10% vendidos cada día en cada supermercado. Tabla de hechos: 730 x 100 x 3000= 219 millones Tamaño tabla de hechos: 219 millones x 4 ytes x 6 = 5.2 Giga- bytes Taller de Base de Datos


Descargar ppt "Taller de Base de Datos Procesamiento Analítico en Línea ¿Qué es OLAP? Imaginemos el siguiente escenario: Una cadena de supermercados posee una (o varias)"

Presentaciones similares


Anuncios Google