Ciclo de Vida Hugo M. Castro
Implementación de un Data Warehouse Un proyecto de Data Warehouse debe basarse en satisfacer necesidades del negocio Los datos se deben presentar de acuerdo con las variables del negocio Un Data Warehouse está en permanente evolución Cada proyecto de Data Warehouse debe tener un principio y un fin
Administración del Proyecto Ciclo de vida Diseño Arquitectónico Productos Requerimientos del Negocio Modelo Dimensional Diseño Físico Planificación Data Staging Implementación Mantenimiento Crecimiento Especificación Aplicaciones Desarrollo Aplicaciones Administración del Proyecto
Administración del Proyecto Planificación Diseño Arquitectónico Productos Requerimientos del Negocio Modelo Dimensional Diseño Físico Planificación Data Staging Implementación Mantenimiento Crecimiento Especificación Aplicaciones Desarrollo Aplicaciones Administración del Proyecto
Planificación Predisposición de la organización Alcance Justificación de negocio Aspectos humanos Plan del proyecto Puntos clave
Predisposición de la organización Apoyo de la Gerencia (Sponsor) Motivación del negocio Participación de gente del negocio y Sistemas Cultura actual de análisis de información Factibilidad
Apoyo de la Gerencia (Sponsor) Perteneciente al área de negocios de la empresa Con visión del impacto del Datawarehouse Con convicción personal y alto compromiso con el proyecto
Apoyo de la Gerencia (Sponsor) Con influencia en la empresa, respetado y con buenas conexiones Con conocimiento de la cultura, las personas, las políticas y los procesos de la empresa Con visión realista para comprender los conceptos del datawarehouse y el ciclo de desarrollo iterativo Con capacidad para tomar decisiones
Motivación imperiosa del negocio Tener en cuenta que El datawarehouse es un facilitador del acceso a los datos Va a armarse para resolver requerimientos críticos específicos del negocio Debe alinearse con las motivaciones del negocio de tipo estratégico de la empresa Ejemplo Oportunidad para ganar lugar en el mercado Mejorar la competitividad
Participación entre Sistemas y Negocio Un datawarehouse exitoso parte del trabajo conjunto de gente de sistemas y gente del negocio NO se puede encarar prescindiendo de la otra área
Cultura actual en el análisis de información Un datawarehouse se construye para brindar mejor acceso a mejor información para dar soporte a la toma de decisiones
Cultura actual en el análisis de información si no hay uso actual de información, probablemente la empresa no necesite un Datawarehouse (o hay que invertir un esfuerzo considerable en cambiar la cultura)
Factibilidad Se refiere a los datos que van a alimentar al Datawarehouse Los datos del datawarehouse son secundarios, es decir, todos provienen de otras fuentes que los reunieron. Son importantes Los sistemas transaccionales en funcionamiento que tiene la empresa La calidad de los datos
Predisposición de la organización ESCENARIOS POSIBLES 1 Empresa con algún área de gran visibilidad Con necesidades claras de acceso a información Con un ejecutivo del negocio que impulsa el proyecto (sponsor) Es la situación más favorable Se da en el 50% de los casos
Predisposición de la organización ESCENARIOS POSIBLES 2 Empresa con múltiples áreas que requieren información Es una situación más complicada Requiere establecer prioridades en los requerimientos
Predisposición de la organización ESCENARIOS POSIBLES 3 Empresa sin una necesidad clara de acceso a información sino difusa Es la situación más complicada Puede verse beneficiada por tener acceso a información pero hace falta identificar primero en forma clara Los beneficios de una solución BI y Las necesidades reales de acceso a información.
Predisposición de la organización Controlar la disposición de la empresa hacia una solución BI Antes de comenzar un proyecto de Datawarehouse o Data Mart Entender si hay demanda de uso de información Identificar de dónde proviene la demanda Hay que Buscar un sponsor de negocios fuerte Identificar usuarios de negocios ávidos de información
Predisposición de la organización Si no POSPONER EL PROYECTO...
Preguntas clave Evalúan si la organización está en condiciones de implementar una solución de BI Evalúan si vale la pena ofrecer una solución de BI Preguntas cruzadas Aspectos de la implementación
Factores críticos de éxito Compromiso de la Gerencia Requerimientos del negocio Madurez de la empresa Calidad de información Características del Data Warehouse Grupo de desarrollo
Alcance del proyecto Consenso Sistemas y Negocios Valor para la organización Manejable Comienzo en pequeño Un proceso de negocios Prioridades Plazos Riesgos
Justificación para el negocio Estimación de beneficios y costos Costos de hardware y software Crecimiento Ampliación de requerimientos Mayores ingresos Mejores oportunidades
Aspectos humanos Funciones provenientes del negocio Funciones técnicas Sistemas – Negocios Funciones de administración Sistemas – Consultores externos Transferencia de conocimiento
Personajes 1 DEL LADO DEL NEGOCIO Propietario Patrocinante Conductor Líder de negocios Profesionales de negocios
Personajes 2 ASPECTOS TÉCNICOS Analista de sistemas de negocios Referente temático Desarrollador de aplicaciones Instructor
Personajes 3 ADMINISTRACIÓN Y SOPORTE Director del proyecto Arquitecto Especialista de soporte técnico Modelador de datos Administrador de base de datos Diseñador de ETL Soporte del Data Warehouse
Plan del proyecto Identificación de las tareas necesarias Participación de personas clave Identificación de puntos de aceptación por los usuarios Etapas – Entregables Plan de comunicaciones
Plan de comunicaciones Interlocutor Frecuencia Mensaje Patrocinante Bi-mensual Resolución de problemas Manejo de expectativas Usuarios de negocios Mensual Involucración Fechas críticas Grupo del proyecto Semanal Avance del proyecto Identificación y resolución de problemas Sistemas Necesidad de recursos
Puntos clave Busque un patrocinante bien ubicado Haga un balance entre valor para el negocio y manejabilidad Desarrolle cuidadosamente el plan del proyecto Sea un director de proyecto con capacidad de motivar, administrar y comunicar a todos los niveles
Requerimientos del negocio Diseño Arquitectónico Productos Requerimientos del Negocio Modelo Dimensional Diseño Físico Planificación Data Staging Implementación Mantenimiento Crecimiento Especificación Aplicaciones Desarrollo Aplicaciones Administración del Proyecto
Relevamiento de requerimientos PREPARACIÓN Entreviste primero a los altos directivos Visión más amplia del negocio Determinación de prioridades Apoyo para las entrevistas posteriores Prepare el grupo de relevamiento Planifique las entrevistas con gerentes intermedios y profesionales de negocios
Relevamiento de requerimientos UNA VEZ IDENTIFICADOS LOS INTERLOCUTORES Elija los medios Entrevistas Sesiones con moderador Prepare el temario Agende las entrevistas y sesiones
Relevamiento de requerimientos ENTREVISTAS Apertura Objetivos de la entrevista Desarrollo Forma de trabajo Métricas Análisis Cierre Cuantificación del éxito
Relevamiento de requerimientos Puntos importantes Escuche atentamente Tome notas No entre en detalles demasiado pronto Trate de captar la terminología de la organización En las entrevistas use el vocabulario del entrevistado
Funciones vs. Datos X INTERLOCUTORES: PROFESIONALES DE NEGOCIOS Productos Fecfa Hora Sucursales Ventas Cantidad de tickets ¿Qué productos se venden más? X ¿Cómo se venden los productos en las sucursales? ¿En qué horas hay más clientes? ¿Qué días de la semana son más flojos?
Entrevistas sobre los datos Interlocutores Conocedores de las fuentes de datos Conocedores del negocio Objetivos Asegurar que hay datos para cumplir con los requerimientos Fijar las expectativas en un nivel razonable
Datos vs. Fuentes X INTERLOCUTORES: ADMINISTRADORES DE BD Productos Inventario Carpeta de sucursales Consolidado de cajas BD de productos Productos X Fecha Hora Sucursales Ventas Cantidad de Tickets
Actividades post-entrevista Informe sobre la reunión Resumen ejecutivo Visión general Detalle de cada proceso de negocios Para qué se requiere análisis de datos Qué funciones se necesitan Cuáles son las limitaciones actuales Cuáles son los beneficios previstos Factibilidad de conseguir los datos necesarios
Actividades post-entrevista Presentación a la alta gerencia Identificación de procesos de negocios Entendimiento de la terminología Análisis de prioridades Impacto en el negocio Factibilidad
Actividades post-entrevista CUADRANTES DE PRIORIDADES Impacto en el negocio Proceso A Alto Proceso B Bajo Proceso C Proceso D Baja Alta Factibilidad
Desarrollo del proyecto El desarrollo del proyecto se realiza en tres líneas Línea de Tecnología Línea de Aplicaciones Requerimientos Línea de Datos
Administración del Proyecto Línea de Tecnología Diseño Arquitectónico Productos Requerimientos del Negocio Modelo Dimensional Diseño Físico Planificación Data Staging Implementación Mantenimiento Crecimiento Especificación Aplicaciones Desarrollo Aplicaciones Administración del Proyecto
Línea de Tecnología Arquitectura Selección de productos Componentes Fuentes de datos Organización de datos (Data Staging) Presentación de datos Acceso a los datos Influencia de los requerimientos Selección de productos
Arquitectura Área de presentación de datos Área de acceso a los datos Sistemas Transaccionales Área de acceso a los datos Data Staging Area SERVICIOS Limpieza Combinación Estandarización NO CONSULTAS ARCHIVOS/TABLAS PROCESOS Ordenamiento Procesamiento secuencial DATA MART 1 Dimensional Un proceso de negocios Datos atómicos y consolidados Consultas especiales Redacción de informes Aplicaciones analíticas Modelos - Pronósticos - Scoring - Data Mining Extracción Acceso Carga Bus del DWh DATA MART 2 Diseño similar
Influencia de los requerimientos Hardware Servidores Discos Software Sistema operativo Motor de base de datos Funcionalidades
Influencia de los requerimientos Alta disponibilidad Espejado de datos Soporte unificado de metadatos Potencia de cálculo para procesos complejos de integración Ubicación de los usuarios Ventana de renovación
Selección de productos Análogo a otras selecciones de tecnología Política de compras Matriz de evaluación Requerimientos técnicos y funcionales Factores de ponderación
Administración del Proyecto Línea de Datos Diseño Arquitectónico Productos Requerimientos del Negocio Modelo Dimensional Diseño Físico Planificación Data Staging Implementación Mantenimiento Crecimiento Especificación Aplicaciones Desarrollo Aplicaciones Administración del Proyecto
Línea de Datos Modelado dimensional Proceso de negocios Granularidad Tablas de hechos Tablas de dimensión Claves subrogadas Dimensiones de cambio lento
Línea de Datos Diseño físico de la base de datos Nombres de columnas Tipos de datos Claves Particiones Estrategia de consolidación Qué consolidaciones se incluyen Estrategia de indexación
Línea de Datos Diseño y desarrollo del ETL Compra vs. Desarrollo Curva de aprendizaje Retorno de la inversión Normalización vs. desnormalización Organización de las tablas de dimensión Organización de las tablas de hechos
ETL Organización de las tablas de dimensión Toma los datos dimensionales de los sistemas transaccionales Depura los valores de los atributos para incorporarlos al modelo dimensional Crea y asigna claves subrogadas Mantiene la tabla de referencias cruzadas Identifica el agregado omodificación de filas en la tabla de dimensión
ETL Organización de las tablas de hechos Toma los datos de hechos de los sistemas transaccionales Recibe dimensiones actualizadas Separa los datos de hechos por granularidad Realiza las transformaciones requeridas en los datos Reemplaza claves de los sistemas fuente por claves subrogadas
ETL Organización de las tablas de hechos Agrega claves adicionales “Sin promoción”, “No aplicable” Asegura la calidad de los datos Cuenta de filas, totales cruzados Construye tablas de hechos sumadas Incorpora los datos al Data Warehouse Informa a los usuarios
Administración del Proyecto Línea de Aplicaciones Diseño Arquitectónico Productos Requerimientos del Negocio Modelo Dimensional Diseño Físico Planificación Data Staging Implementación Mantenimiento Crecimiento Especificación Aplicaciones Desarrollo Aplicaciones Administración del Proyecto
Línea de Aplicaciones Especificación y desarrollo de aplicaciones Diferentes niveles de necesidad de información para diferentes usuarios Documentación de relevamiento de requerimientos
Línea de Aplicaciones Especificación y desarrollo de aplicaciones Vías de acceso Internet Correo electrónico Tableros de control Personalización de herramientas
Administración del Proyecto Implementación Diseño Arquitectónico Productos Requerimientos del Negocio Modelo Dimensional Diseño Físico Planificación Data Staging Implementación Mantenimiento Crecimiento Especificación Aplicaciones Desarrollo Aplicaciones Administración del Proyecto
Implementación Convergencia de las tres líneas La línea de datos es la más impredecible Fechas comprometidas Asegurarse de que el Data Warehouse esté en condiciones Educación
Implementación EDUCACION Entender cuál es la audiencia No empezar la educación demasiado temprano Datos viejos o no reales Posponer la educación si hay problemas en la puesta en marcha Política “Si no hay educación, no hay acceso”
Mantenimiento y Crecimiento Diseño Arquitectónico Productos Requerimientos del Negocio Modelo Dimensional Diseño Físico Planificación Data Staging Implementación Mantenimiento Crecimiento Especificación Aplicaciones Desarrollo Aplicaciones Administración del Proyecto
Mantenimiento y Crecimiento Soporte a los usuarios de negocios Si no hay consultas, posiblemente no estén usando el Data Warehouse Detectar áreas de datos o de aplicaciones no cubiertas Calidad del Data Warehouse Educación Cursos de actualización Usuarios calificados
Mantenimiento y Crecimiento Soporte Técnico Es parte del negocio Rendimiento Nivel de servicio Monitoreo Avance vs. criterios de éxito Revisiones Oportunidades de mejoras
Mantenimiento y Crecimiento Demandas de crecimiento Nuevos usuarios Nuevos datos Nuevas aplicaciones Mejoras de las aplicaciones existentes Revisión de las prioridades establecidas Determinación de las necesidades de la nueva etapa Comienzo de la nueva etapa
Arquitecturas OLAP OLAP Relacional (ROLAP) Usa un esquema relacional para manejar la navegación y administrar los datos consolidados Gran escalabilidad OLAP Multidimensional (MOLAP) Almacenamiento con técnicas multidimensionales Acceso rápido a datos sumados previamente OLAP Híbrido (HOLAP) Bajo nivel ROLAP, Alto nivel MOLAP Motores de BD especializados Manejan consultas con esquemas estrella o copo de nieve