La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Presentaciones similares


Presentación del tema: ""— Transcripción de la presentación:

51 Almacenes de Datos (Data Warehouse)
MC Beatriz Beltrán Martínez Primavera 2015

52 Definición Un Almacén de Datos (o Data Warehouse) es una gran colección de datos que recoge información de múltiples sistemas, y cuya actividad se centra en la Toma de Decisiones en vez de en su captura. Una vez reunidos los datos de los sistemas fuentes se guardan durante mucho tiempo, lo que permite el acceso a datos históricos; así los almacenes de datos proporcionan al usuario una interfaz consolidada única para los datos, lo que hace más fácil escribir las consultas para la toma de decisiones. FCC - BUAP Primavera 2015 MC Beatriz Beltrán Martínez

53 Base de Datos Operacional
Diferencias FCC - BUAP Primavera 2015 Base de Datos Operacional Almacén de Datos Datos operacionales Datos del negocio para Información Orientado a aplicación Orientado al sujeto Actual Actual + Histórico Detallada Detallada + Resumida MC Beatriz Beltrán Martínez

54 Funcionalidades Integración de bases de datos heterogéneas (relacionales, documentales, geográficas, archivos, etc.) Ejecución de consultas complejas no predefinidas visualizando el resultado en forma gráfica y en diferentes niveles de agrupamiento y totalización de datos. Agrupamiento y desagrupamiento de datos en forma interactiva. Análisis del problema en términos de dimensiones. Control de calidad de datos. FCC - BUAP Primavera 2015 MC Beatriz Beltrán Martínez

55 Características Organizado en torno a temas. La información se clasifica en base a los aspectos que son de interés para la empresa. Integrado. Es el aspecto más importante. La integración de datos consiste en convenciones de nombres, codificaciones consistentes, medida uniforme de variables, etc. Dependiente del tiempo. Esta dependencia aparece de tres formas: La información representa los datos sobre un horizonte largo de tiempo. FCC - BUAP Primavera 2015 MC Beatriz Beltrán Martínez

56 Características Cada estructura clave contiene (implícita o explícitamente) un elemento de tiempo (día, semana, mes, etc.). La información, una vez registrada correctamente, no puede ser actualizada. No volátil. El Almacén de Datos sólo permite cargar nuevos datos y acceder a los ya almacenados, pero no permite ni borrar ni modificar los datos. FCC - BUAP Primavera 2015 MC Beatriz Beltrán Martínez

57 Arquitectura Salvado de datos limpios Almacén de Datos Limpieza
Datos Metadatos Limpieza Reformateo Almacén de Datos OLAP DSSI/EIS Minería de Datos Otras entradas De datos Actualizaciones Nuevos datos Salvado de datos limpios FCC - BUAP Primavera 2015 MC Beatriz Beltrán Martínez DSS sistemas de soporte de decisión

58 Arquitectura Datos operacionales. Origen de datos para el componente de almacenamiento físico del Almacén de Datos. Extracción de datos. Selección sistemática de datos operacionales usados para formar parte del Almacén de Datos. Transformación de datos. Procesos para sumarizar y realizar cambios en los datos operacionales. Carga de datos. Inserción de datos en el Almacén. Almacén. Almacenamiento físico de datos de al arquitectura Data Warehouse. Herramienta de acceso. Para proveer acceso a los datos. FCC - BUAP Primavera 2015 MC Beatriz Beltrán Martínez

59 Modelado de Datos Una hoja de cálculo constituye una matriz. Valores
FCC - BUAP Primavera 2015 Región Región 1 Región 2 Región 3 P120 P121 P122 P124 Producto Valores MC Beatriz Beltrán Martínez

60 Modelado de Datos Añadiendo una dimensión se tendría una matriz tridimensional. FCC - BUAP Primavera 2015 Región P120 Región 1 Región 2 Región 3 P121 P122 P123 MC Beatriz Beltrán Martínez Trimestre Producto Valores Trim 3 Trim 2 Trim 1

61 Modelado de Datos Las herramientas de explotación OLAP de los almacenes de datos han adoptado un modelo multidimensional de datos. FCC - BUAP Primavera 2015 Almacén Cliente MC Beatriz Beltrán Martínez Tiempo Ventas Producto

62 Modelado de Datos Tres son los esquemas multidimensionales comunes:
Esquema en estrella: formado por una tabla de hechos con una única tabla para cada dimensión. FCC - BUAP Primavera 2015 Tablas de Dimensiones Dim1 Id_Dim1 Hecho Id_Dim1 Id_Dim2 Id_Dim3 Id_Dim4 Valor1 valor2 Dim3 Id_Dim3 MC Beatriz Beltrán Martínez Dim2 Id_Dim2 Dim40 Id_Dim4 Tabla de Hechos

63 Modelado de Datos Esquema en copos: es una variante del esquema de estrella en el que las tablas dimensionales de este último se organizan jerárquicamente mediante su normalización. FCC - BUAP Primavera 2015 T1 Id_t1 Dim1 Id_Dim1 Id_t1 Id_t2 Hecho Id_Dim1 Id_Dim2 Id_Dim3 Id_Dim4 Valor1 valor2 Dim3 Id_Dim3 id_t3 T3 Id_t3 MC Beatriz Beltrán Martínez T2 Id_t2 Dim4 Id_Dim4 Id_t4 T4 Id_t4 Dim2 Id_Dim2 Tabla de Hechos

64 Modelado de Datos Constelación de hechos: es un conjunto de tablas de hechos que comparten algunas tablas de dimensiones. FCC - BUAP Primavera 2015 Hecho 1 Id_Dim1 Id_Dim2 Id_Dim3 Valor1 valor2 Dim2 Id_Dim2 id_t3 T3 Id_t3 T1 Id_t1 Dim1 Id_Dim1 Id_t1 Id_t2 MC Beatriz Beltrán Martínez T2 Id_t2 Dim4 Id_Dim4 Id_t4 T4 Id_t4 Dim3 Id_Dim3 Hecho 2 Id_t2 Id_t4 Id_Dim3 Id_Dim4 Valor3

65 Ejemplo Tablas de Dimensiones Tabla de Hechos Tiempo Id_fecha Día
Semana Mes Año Día_semana Trimestre Festivo Producto Id_producto Num_producto Descripción Marca subcategoría Categoría Departamento Peso Tipo_envase FCC - BUAP Primavera 2015 Almacén Id_almacén Num_almacén Nombre Dirección Ciudad País Teléfono Superficie Tipo_almacén MC Beatriz Beltrán Martínez Ventas Id_fecha Id_almacén Id_producto Importe Unidades Num_cliente Tabla de Hechos

66 Tarea Realizar un ejemplo que explique como sería la construcción de un almacén de datos, donde señale, como: Extraer los datos. Limpiar los datos. Transformar de los datos. Consolidar los datos. Cargar los datos. Actualizar los datos. FCC - BUAP Primavera 2015 MC Beatriz Beltrán Martínez


Descargar ppt ""

Presentaciones similares


Anuncios Google