¿Porqué construir una base de datos? La habilidad de acceder a los Datos de la toda la Empresa La habilidad de tener consistencia en los datos La habilidad de realizar un análisis
Historia de análisis de los datos corporativos Reportes en Papel Análisis en Planilla de Cálculo Sistemas de información ejecutiva Herramientas estándar Data Warehouse
Sistemas OLAP Sistemas OLTP OLAP vs. OLTP
Consistencia y Consolidación Información Significativa Histórica Solo lectura Granularidad
¿Qué es un Data Warehouse? Herramientas para los Usuarios Colección de Datos para asistir el soporte de decisión Datos y Herramientas
¿Qué es un Data Mart? El Data Warehouse es para los Datos de toda la empresa Un Data Mart es específico a un departamento en particular ¿Por que construir Data Marts?
Data Marts vs. Data Warehouse Ventajas de Data Marts sobre Data Warehouse Desventajas en la construcción de Data Marts
Construyendo un Data Warehouse o Data Mart Construir de Warehouse por integración de Data Marts a través de la Empresa Construcción de Data Marts a partir del Data Warehouse
Servicio al Cliente Mart De Data Warehouse a Data Mart Fuente 1 Datos Warehouse Fuente 2 Fuente 3 Servicio al Cliente Mart Ventas Mart Finanzas Mart
Servicio al Cliente Mart De Data Mart a Data Warehouse Ventas Mart Fuente 1 Data Warehouse Fuente 2 Finanzas Mart Fuente 3 Servicio al Cliente Mart
Integración de Data Marts Fuente 1 Fuente 2 Fuente 3 Producto Ventas Clientes Localización Tiempo Finanzas GL Organización
El ciclo de vida de los Datos Warehousing
Entorno Tecnológico
Servidor SQL Herramientas de Data Warehouse Servicio de Transformación de Datos Servicios OLAP de Servidores SQL Requerimientos de Consulta en Inglés Servicio de Tabla de Pivot Soporte avanzado de base de datos
Escenarios de Negocios Búsqueda de Ventas Partes Buscadas
Búsqueda de Venta Dimensiones Metas
Terminología de Data Warehousing Cubo Data Mart Data Warehouse Meta Datos OLAP OLTP Sistema Fuente de Datos Transformaciones
Comparación de Arquitecturas de Sistemas Sistemas Operacionales Sistemas Analíticos
¿Dónde, Qué, Cómo es ahora? Información Estatus Solicitud
¿Mejoré la decisión que tomé? Información Vista Interna Análisis
Comparación de los Sistemas Operacional Respondiendo y Solicitando eventos individuales Analíticos Estudiando (Midiendo) múltiples eventos y respuestas a través de las áreas y tiempo funcionales
Procesos de Análisis de Datos Warehouse Conductores de Negocios Objetivos de Negocios Necesidad de Análisis de Informaciones más altas Procedimientos y roles Conductores de Negocios Llaves indicadoras de Performance Eventos y Dimensiones Transformaciones y Fuentes
Entrada de nuevos Competidores Servicio a nuevos Clientes Negocios de Clientes Desarrollo de nuevos productos o servicios Decreto de Gobierno
Objetivos de los Negocios Mejora las ventas a través de una mejor Identificación de los segmentos de mercado. Baja los costos identificando los servicios devaluados Mejora la satisfacción y la retención del cliente Provee métricas para mejorar la productividad del valor de la cadena
Oportunidad de Actividad Evaluatoria Mantener una sección de definición de negocio Revisar el ambiente de tecnología informática Coleccionar y revisar las documentaciones de la Empresa Analizar y acceder a la información Desarrollar un plan de definición de pedidos y las fases del análisis de la arquitectura.
Analizando y priorizando técnicas de análisis Low Medium High Ventas Clientes Competidores Movimiento del Prod. Guardado, Depart. Categorización y mezcla de prod. Promociones Fuente Laboral Margen (Gross Profit)
Primer manejo del Punto de Chequeo (CheckPoint) Incluye Sponsors de Negocios, Gerenciamiento de proyectos cliente y las llaves Skateholders Revisión y Aprobación de la fase entrega Identificando y discutiendo puntos abiertos Revisión y Aprobación del plan Proyecto para la próxima fase
Procedimientos y Roles Conductores de Negocios Objetivos de Negocios Necesidad de Análisis de Informaciones muy importantes Procedimientos y roles Indicadores de mejoras en Llaves Eventos y Dimensiones Eventos y Dimensiones Fuentes y Transformaciones
Ventas Identificación de Roles de los Participantes en el Análisis Analista de Marketing Analista Financiero Ventas Analista de Ventas Analista del Producto
Analizando los procedimientos identificando los roles * Venta del producto diario * Análisis del movimiento del producto * Respuesta de la estrategia de la oferta del producto Análisis del Producto
Entendiendo los Roles de pedidos de información Venta de los Productos Diarios Análisis de los movimientos de los productos Respuesta en la estrategia de oferta del producto “¿Cuántos errores tienen nuestros productos, por tamaño, por gusto, fueron vendidos cada mes este año, en la división Eastern, por depósito, medido por tamaño, comparado con el mismo mes del año pasado?
Identificando los indicadores en la mejora de la “Key” Numero de unidades vendidas Venta $ Ventas Revenue Producto Bruto profit Descuento Promoción Objetos y eventos adicionales expuestos
Identificación de la información de Objetos y Eventos Tiempo Venta de productos diarios Análisis de Movimiento del Producto Producto Respuesta de la oferta del producto (Estrategia) Organización Stock Venta Grabado
Identificación de Factores Elegir medidas y Factores Ordenar cantidad Valor del Dólar Contabilización del Inventario
Dimensiones y Eventos Conductores de Negocios Objetivos del Negocio Necesidad de Análisis de la información más importante Procedimientos y Roles Indicadores de llaves de mejora Eventos y Dimensiones Fuentes y Transformaciones
Buscando los eventos comunes Procedimiento de Marketing Datos de Venta Desarrollo de Campaña Gerente de Marketing Datos de Cliente Información del Producto Analista de Marketing Analista de Campaña Campaña Informativa Analista de Venta
Identificación de Dimensiones Clientes Tiempo Producto Estatus
Segundo Checkpoint de Manejo Finalize los requerimientos obteniendo procesos Solicitar un proyecto de decisiones de ir o no ir
Fuentes y Transformaciones Conductores de Negocios Objetivos del Negocio Necesidad de Análisis de la información más importante Procedimientos y Roles Indicadores de llaves de mejora Eventos y Dimensiones Fuentes y Transformaciones
Vida cíclica de Datos Warehouse Transformaciones Sistemas de Fuente OLTP Data Marts Cubo Datos Warehouse Cliente Fuentes Metadata
KPIs Transformación de Documentación Entregables Procesos de Captura del Sistema Requerimientos de Fuente de Transformaciones Entregables Datos de Fuente en diagramas de contexto Documentación de la vida de los ciclos, incluyendo periódicamente, volúmenes esperados, fuentes de datos (especificaciones Metadata) Especificaciones de selección de datos y reportes Estrategias de Implementaciones y entregas de soluciones arquitectónicas.
Requerimientos Técnicos Identificados Infraestructura (Hardware y Software) Adquisición de datos de Población Respaldo y Recuperación Seguridad
Terminología de datos Warehouse Dimensión Factores Medida
Diseñando Sistemas OLTP Diagramas de Relaciones de Entidades Normalización de la Tabla de Base de Datos Puntos de diseño de Sistemas OLTP
Diagramas de Relaciones de Entidades
Normalización de la Tabla de Base de Datos Un grupo de implementaciones relacionales, secuenciales diseñado en base de datos con reglas Primer formulario normal Segundo formulario Normal Tercer formulario Normal Cuarto y Quinto Formulario Normal
Ejemplo de Normalización
OLTP puntos de diseños de Sistema Ventajas Previene anomalías de Actualización Asegura la consistencia de los datos a través de las transacciones. Optimiza la eficiencia en los procesos de la aplicación Reduce esfuerzo en modificación de aplicaciones Desventajas Dificultad para diseñar reportes analíticos Indíces que reduce la mejora
Como ve la información el negocio
Modelado Dimensional - Esquema "La estrella"(Participar)
Soda, Cerveza y Botellas de Agua Hierarchies Dimensionales Departamento Grocery Entrega de Bebidas Carnes, Papel El departamento “Grocery” puede tener muchas categorías La Categoría Bebidas puede tener muchas subcategorías La Subcategoría de Soda puede tener muchos productos Categoría Bebidas Soda, Cerveza y Botellas de Agua Subcategoría Soda Cola, Naranja, Grapa
Hierarchies Consolidaciones Dimensionales
Snowflaked Hierarchies
Hierarchies Snowflaked vs. Consolidated Consolidados Snowflaked Overall Row Count Higher Lower Modelo Understandability Easier More Difficult Number of Tables Less More Query Complexity Simpler More Complex Dimensional Searching Quicker Slower Bitmapped Indexing Supports Inhibits
Información de tablas de dimensión de objeto
Pasos de Diseños de Esquemas Dimensionales Definiendo un Data Mart OLAP Eligiendo los factores Estableciendo Dimensiones Diseñando Modificaciones (Agregaciones)
Definiendo un Data Mart OLAP Estableciendo los procesos de requerimientos ganados Direccionar un simple proceso de negocios discreto Primer iteración debe ser basada de un sistema simple Estableciendo el requerimiento de la duración
Características Dimensionales Atributos altamente correlacionados Información Verbal Textual altamente calificada Elementos y direcciones de nombres Parsed Surrogate Key Dimensiones Degeneradas Dimensiones Junk Dimensiones Conformados
Tabla de Características Dimensionales Contiene una llave primaria Tiene uno de tantas relaciones en los factores de la tabla Contiene al menos una columna de descripción Contiene otras columnas de atributos que son útiles para niveles de agregaciones. Contiene un set de celdas limitada que crecen lentamente a través del tiempo.
Sobreescribiendo una grabación dimensional
Sobrescribiendo otra grabación dimensional
Grabados de los valores en la dimensión
Características Agregadas El resumen de Esquemas son usados para unir las mejoras de petición Se puede acelerar los requerimientos por tres órdenes de Magnitud
Ejemplo Modificaciones
Tamaño del Sistema estimado OLAP * El factor de la Tabla será 97 a 99.9 porciento de OLAP El tamaño del sistema * Tamaño sobre todos Dimensionales (Grain Drives) Estima el numero de items en cada dimensión en la granualidad de los datos * Numero de celdas en si es la tabla del producto * Bytes estimados por celda 4 bytes por llaves de identificación estranjeras Medida del tamaño * Ejemplo de ventas guardadas.
Componentes de Microsoft
Área de Trabajo de Datos Warehouse
Servicios de datos de Transformación * Transformación de la naturaleza de los datos * El golpe Data (Data Pump) * Pasar a través de SQL * Paquetes DTS * Creación de paquetes DTS * Áreas de guardado DTS
Servicios OLAP
Tipos de Servicios * Servidores Remotos * Servidores con hipervínculos Select emp.EmployeeID, ord. OrderID,ord.Discount FROM SQLServer1.Northwind.dbo.Employees AS emp, OracleSvr.Catalog1.SchemaX.Orders AS ord WHERE ord.EmployeeID = emp.EmployeeID AND ord.Discount > 0