Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porDaniel Gamarra Modificado hace 5 años
1
Almacenes de datos Data warehouse y OLAP
2
Gestión de los datos y del conocimiento
3
Datos Formato (Estructura de datos) Estructurado y no estructurado Del 80 al 85%, o más, es no estructurada Contenido (tipos de datos)Procedencia de origen (de dónde vienen)
4
Gestión de datos Precisos, Completos, Consistentes, Accesibles, Relevantes, Concisos y Oportunos. Datos de alta calidad
5
El objetivo de la gestión “El objetivo de la gestión de datos es proporcionar la infraestructura y herramientas para transformar los datos en bruto (rawdata) en información corporativa usable (utilizable) de la más alta calidad” (Laudon, 2014). Al igual que se gestionan los activos financieros, se deben gestionar los datos, ya que son activos informacionales de la organización.
6
Proceso de la gestión de datos Comprensión de los datos (perfiles). Calidad de los datos y su mejora continua. Integración de los datos, combinando datos similares procedentes de fuentes diferentes. Aumento de los datos con la mejora continua de su valor.
7
Ciclo de vida de los datos
8
Las dificultades de la gestión de los datos La cantidad de datos aumenta exponencialmente con el tiempo Los datos están dispersos Los datos se obtienen de múltiples y diferentes fuentes Los datos se degradan con el tiempo Los datos sociales dependen en gran medida de los soportes en que se almacenan La seguridad, la calidad y la integridad de los datos son críticos y pueden ser fácilmente atacados Los datos en una organización son redundantes y con frecuencia están desactualizados
9
Atributos de los datos para garantizar su uso competente El dato debe ser único.El dato debe ser correcto y exacto.El dato debe ser oportuno (estar a tiempo).El dato debe ser consistente.El dato debe ser completo. El dato debe estar protegido (confidencialidad, acceso, respaldo, etcétera).
10
Gobierno de los datos Una estrategia para la implementación del gobierno de datos es la gestión de datos maestros (Master Data Management) Almacenar, mantener, intercambiar y sincronizar los datos maestros, de modo que sean consistentes, precisos (correctos) y oportunos. Los datos maestros son diferentes a los datos transaccionales.
11
Calidad de los datos Categorías de calidad de datos Estandarización (consistencia), correspondencia (matching), verificación (frente a las fuentes) y mejora (añadido de datos para incrementar su utilidad) Los problemas típicos Datos incorrectos, datos redundantes, datos robados, datos irrelevantes o pérdidas de datos Las causas más comunes proceden de malas entradas de datos, diseño de bases de datos pobre, seguridad pobre, datos recogidos incorrectos o la inexistencia de los datos requeridos por el negocio.
12
Integridad de datos Los datos deben ser precisos, correctos y válidos.
13
Bases de datos
14
Bases de datos centralizadas
15
Bases de datos distribuidas
16
Data warehouse (1) Data Warehouses (almacenes de datos) y Data Marts (almacenes de datos departamentales). Son el soporte fundamental de las aplicaciones de Inteligencia de Negocios (Business Intelligence). “Una colección de datos orientado a temas, integrado, variable con el tiempo y no volátil para ayudar al proceso de gestión en toma de decisiones en una organización" (Bill Inmon). “Un Data Warehouse es una copia de los datos transaccionales específicamente estructurados para consultas y análisis” (Ralph Kimball)
17
Data warehouse (2) Un Data Warehouse es un gran almacén o depósito de datos, donde se integran datos procedentes de varias fuentes: internas (procedentes de los sistemas transaccionales de los diferentes departamentos de la empresa, tales como recursos humanos, marketing, ingenierías, etcétera), externas y personales. El costo de implementación de un Data Warehouse es alto en su desarrollo y mantenimiento
18
Características de un datawarehouse Orientado a temas (entidades). Integrado. Variable con el tiempo. No volátil. Multidimensional. Basados en la Web Cliente/servidor. Tiempo real. Metadatos. Consolidados.
19
Data Mart Almacén de datos departamental o funcional Contiene un subconjunto de los datos almacenados del Data Warehouse de la compañía
20
Data Mart: Independientes
21
Data Mart: Dependientes
22
Marco de trabajo de un sistema de Data Warehouse (Turban)
23
Herramientas ETL
24
Extracción Los datos se extraen de las fuentes internas y externas disponibles. Bases de datos OLTP, hojas de cálculo, bases de datos personales (Oracle, Microsoft, Access, etcétera) o archivos externos y archivos planos. Extracción inicial Datos disponibles relativos a períodos anteriores se introducen en los Data Warehouse vacíos Extracciones increméntales posteriores Actualizan el Data Warehouse utilizando nuevos datos disponibles a lo largo del tiempo.
25
Transformación Conversión de los datos extraídos al formato que se requiere. Transformación y limpieza de datos. Mejorar la calidad de los datos extraídos de las diferentes fuentes, mediante las correcciones de inconsistencias, duplicación de datos, imprecisiones, pérdida de valores y existencia de valores admisibles.
26
Carga Luego del ETL se carga al data warehouse
27
Fases de un sistema ETL
28
Enfoques de desarrollo (modelos) de un sistema de data warehouse
29
Modelo Inmon: modelo Data Warehouse para la empresa o corporativo (EDW)
30
Modelo Kimball: el enfoque de Data Mart
31
OLAP (procesamiento analítico en línea) Conocida también como análisis multidimensional. Soporta análisis de datos multidimensional y facilita a los usuarios su visión en diferentes formas, utilizando múltiples dimensiones. Cada aspecto o indicador de una información (producto, precio, coste, región, período) representa una dimensión diferente.
32
Vista multidimensional (1) Ventas 2018
33
Vista multidimensional (2)
34
Vista multidimensional (3)
35
Cubos OLAP básicos de tres dimensiones (1)
36
Cubos OLAP básicos de tres dimensiones (2)
37
Categorías de OLAP
38
Proveedores de OLAP OLAP MICROSOFT Business Object QlikView de Qliktech Microstrategy OLAP Cognos OLAP IBM OLAP Information builders Oracle Sas institute IBM SPSS
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.