1 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Plan Contexto - Ciclo de vida de un dw –Carga inicial –Problemática.

Slides:



Advertisements
Presentaciones similares
Sistema de Información Cultural, CONACULTA México, 2006 SiC / RENiC Aspectos técnicos relevantes para un Sistema de Información (SI)
Advertisements

Ingeniería de Software II
Microsoft SQL Server 2005 Integration Services
Bases De Datos Para El Soporte En La Toma De Decisiones
DATA MART Sergio Daniel.
Cognos Data Integration
ORACLE OLAP Integrantes: *Aizaga, Martiniano *Gallegos, Marina
UNIX COMP 240.
Portal Hacienda Digital
Microsoft SQL Server 2008 – SQL Server Integration Services
LOS SISTEMAS DE AUTOMATIZACIÓN DE OFICINAS
Especialista en Business Intelligence Integration Services SSIS (Sesión 7) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
SQL Server Integration Services SSIS
Herramientas CASE.
Director: Ing. Washington Pérez Codirector: Ing. Andrés de la Torre
Jesús Angel Ovando División de Estudios de Posgrado Instituto Tecnológico de Orizaba.
Especialista en Business Intelligence Integration Services SSIS (Sesión 7) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
Introducción arquitectura base de datos Microsoft SQL Server 2000/2005
Nacional Financiera, tu brazo derecho.. Objetivo Cronología Flujo de la Información Estadísticas Front-End Factores críticos de éxito Ventajas y Beneficios.
HERRAMIENTAS CASE.
SISTEMAS GETIONADORES DE BASES DE DATOS
Definición de un modelo colaborativo entre Especializada y Primaria aplicado al diagnóstico por imagen médica.
ANALITICA - INTEGRATOR INTRODUCCIÓN Y CONCEPTOS. ANALITICA - INTEGRATOR OBJETIVO Integrar información aislada en archivos o sistemas, tanto corporativos.

SQL Server 2008 Integration Services
Bases de Datos II OLAP Online Analytical Processing
DATA WAREHOUSE PROFESOR: LORENZO DE JESUS ORGANISTA OLIVEROS TABD
Implementación de Datawarehouse
Contenido: 1- Que es el .Net Framework 2- Arquitectura en .Net
DATA WAREHOUSE PREPARADO POR : María Alejandra Franco Lina María Arias.
Diseño de algoritmos La computadora puede realizar procesos y darnos resultados, sin que tengamos la noción exacta de las operaciones que realiza. Con.
Sistema Organizador de Invitaciones, Eventos y Memos basado en una aplicación Cliente – Servidor SOIEM TESIS DE GRADO FIEC – ESPOL 2007 Christian Vulgarin.
Un sistema de gestión de bases de datos: Es un conjunto de programas que permite a los usuarios crear y mantener una base de datos. Por tanto, el SGBD.
Microsoft RMS Headquarters
Juanita Flores Rodríguez Ana Vianey Ferreyra Díaz
PHP PHP (acrónimo de "PHP: Hypertext Preprocessor") es un lenguaje de "código abierto" interpretado, de alto nivel, embebido en páginas HTML y ejecutado.
Página 1 19/04/2005 Materia: Tecnología de la Información Curso: Profesora Ariana Rosenthal Tecnología de la Información Profesora Ariana Rosenthal Repaso.
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS
1 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Microsoft DTS Se trata de una componente predefinida del RDBMS SQL.
Facultad de Ingeniería
Introducción al Lenguaje. ¿ Qué es PHP ? O Hypertext Pre-processoes (PHP) es un lenguaje de "código abierto" interpretado, de alto nivel, embebido en.
Paquetes SSIS.
Sistema informático de apoyo a la evaluación de la enseñanza IN.CO.
Modelo OSI Surgimiento del Modelo OSI ¿Que es el Modelo OSI?
¿Qué es una Base de datos?
Data Compatibility 100% OLE DB architecture (including ODBC) 100% OLE DB architecture (including ODBC) Relational and non-relational sources Relational.
Introducción a UML Departamento de Informática Universidad de Rancagua
Ingeniería de Requisitos
ORACLE OLAP CAECE Integrantes: *Aizaga, Martiniano *Gallegos, Marina *Kleinlein, Guillermo *Schiano di Cola, Emiliano.
DISEÑO CURRICULAR Presentado por: Cesar Augusto Sáenz María Alejandra Hernández 1.contenidos curriculares de competencia.
Arquitectura de un Data Warehouse
Tecnologías Cliente / Servidor Capitulo II Richard Jiménez V. clienteserver.wordpress.com.
Simulador Redes Nombres etc,,.
• SQL Server Integration Services SSIS
Significa Modelo de Interconexión de sistemas Abiertos.
Taller de Inteligencia de Negocios SQL Server Analysis Services Semana 8.
DATA WAREHOUSE.
Bases de Datos 1 Universidad Católica de Costa Rica Prof. Daniel Obando.
SOLUCIONES EMPRESARIALES
Especificación del Problema Partimos del hecho de un programador no puede resolver un problema que no entiende. Por esta razón, la primera etapa en todo.
UNIVERSIDAD LATINA (UNILA) III.- PLAN DE IMPLEMENTACIÓN
Integrantes Miguel Betancourt Alexis Tacuri.  Activiti es una plataforma para la formación de flujos de trabajo y procesos empresariales dentro del.
BPMN COMO HERRAMIENTA DE MODELADO DE NEGOCIO PARA LA CREACIÓN DE MODELOS CONCEPTUALES Integrantes Horenstein, Nicolás Gómez, Federico IDJEI 52.
Ing. Ernesto Sierraalta Fundamentos de Desarrollo de Proyectos de Inteligencia de Negocios ( Decision Support Systems & Data Warehousing.
Diccionario/Directorio de Datos
DLM Transact SQL Sesión I Introducción al SQL Server Uso de las herramientas de consultas del Transact SQL.
Proyecto Harry Generador de aplicaciones. Objetivo Crear una herramienta de desarrollo de sistemas que permita minimizar los tiempos de programación mediante.
Entregables del Proyecto
Taller de Inteligencia de Negocios SQL Server Integration Services SSIS Sesión 2.
 Trabaja con el esquema relacional surgido en los laboratorios de IBM  La instalación completa ocupa alrededor de 10 Mb incluyendo librerías, ejemplos.
Transcripción de la presentación:

1 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Plan Contexto - Ciclo de vida de un dw –Carga inicial –Problemática del proceso de refresque Carga inicial Herramientas ETL –Laboratorio Conclusión

2 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Contexto / Definición de dw El dw puede ser definido como una jerarquia de depósitos de datos [BFM99].... datos fuentes ODS CDW Data Marts integrados sin preparar integrados preparados históricos especializados + preparados

3 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Contexto / Un enfoque de construcción de un dw Se distinguen 4 actividades en la construcción de la jerarquía de depósitos [JLLV00].... datos fuentes ODSCDW Data Marts Preparación IntegraciónAgrupamientoAdaptación ExtracciónLimpiezaIntegraciónAgrupamientoAdaptación...

4 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Herramientas ETL Extraction, Transformation and Loading Características generales Presentación de Hummingbird Genio Presentación de Microsoft DTS

5 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Características generales Objetivo principal –facilitar el desarrollo y la reutilización de aplicaciones que migran datos aplicando transformaciones. En este tipo de aplicaciones, los objetos típicos a definir: –conexiones –estructuras de los depósitos de datos –correspondencias y transformaciones entre los depósitos –excepciones –planificaciones de las transformaciones –informes de resultados de ejecución

6 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Características generales (1) Las herramientas ETL son ambientes especializados que permiten la definición y manipulación de objetos típicos en aplicaciones de intercambios de datos. –Facilidades para la modificación y mantenimiento de las aplicaciones. –Generación de meta-información.

7 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Características generales (2) Una componente importante en la arquitectura de estas herramientas es el diccionario de datos –Permite almacenar la información de los procesos de migración ofreciendo una organización centralizada. –De esta manera, se ofrece acceso a toda la información asociada a los procesos de migración (los objetos definidos anteriormente). En estas herramientas, el data warehouse y/o los data marts son vistos como depósitos adonde migrar datos transformados.

8 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Características generales (3) En general, ETLs NO ofrecen funcionalidades específicas para: –la captura de cambios en los datos, –la integración de esquemas y datos ETLs son "pobres" en cuanto al manejo de excepciones. –No significa que no se puedan manejar sino que su manejo es aún "engorroso". Las herramientas pueden clasificarse en 3 categorias –"Loaders" –Generadores de código –Ambientes especializados

9 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs "Loaders" Importadores/Exportadores convencionales entre archivos ascii y Rdbms. –E.g. SQL*Loader de Oracle. Ofrecen parametrización mediante archivos de control. –E.g. delimitador, formato de fechas,... Adecuado para cargas sin demasiadas transformaciones en los datos a partir de archivos de texto simples. No adecuado –diferentes fuentes de datos (no sólo texto) –transformaciones complejas –planificación de diferentes procesos de carga

10 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Generadores de código Editores gráficos permitiendo definir –conexiones a fuentes de datos –transformaciones entre los datos Generan programas en lenguajes como Cobol, C, RPG, ABAP,... –Pueden ser afinados posteriormente. Orientados particularmente a extracción directa en mainframes. El inconveniente es la gestión y coordinación de una gran cantidad de programas. E.g. Passport (Carleton), Warehouse Manager (Prism).

11 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Ambientes especializados Editores gráficos para definición y planificación de procesos de carga. –Importar información de diccionarios de datos –Integración de mecanismos tales como middleware existentes (odbc, oledb, "nativo"), transferencia de archivos y envio de mails. Lenguajes de programación para definir las transformaciones. –Proveen el motor de ejecución de los programas escritos en estos lenguajes. –Ofrecen funciones predefinidas y permiten el agregado de funciones definidas por el usuario. Mecanismos para el control del flujo de los procesos.

12 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Ambientes especializados (2) Fuertemente basados en el uso de diccionario de datos conteniendo los objetos involucrados en un proceso de extracción, transformación y carga. Inconvenientes: –Soporte limitado de accesos nativos a fuentes de datos en mainframes. –Soporte limitado de acceso a sistemas de bases de datos multidimensionales. –No ofrecen soporte específico para la captura de cambios en los datos. –Manejo elemental de errores y excepciones E.g. Genio (Hummingbird), DTS (Microsoft).

13 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Hummingbird Genio La base de la herramienta consiste en 4 grandes componentes software –Designer Asistente gráfico para la definición de los procesos encargados de la transformación de datos. –Scheduler Asistente gráfico para la planificación de los procesos definidos. –Metadata Explorer Permite visualizar la info. en el diccionario de datos –Server Servicios encargados de la ejecución de los procesos, control del orden de la planificación y del acceso a las fuentes de datos. Usa un referencial para almacenar todas las definiciones. –Instalado sobre un RDBMS estandard

14 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Genio / Arquitectura de la herramienta Scheduler ClientDesigner MD Explorer Especificación Producción Referencial Servidor Génio

15 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Genio / Conexión e importación de estructuras Génio Engine RDBMSSQL server Informix Sybase DB2Oracle Essbase TM1 Oracle Express Archivos texto Genio Data Links Bases de datos

16 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Genio / Módulo Permite definir correspondencias y transformaciones entre la fuente de datos origen y las fuentes de datos destino. Genio provee un lenguaje de programación procedural parecido a Basic: – dim, let – if, for, while – foreach, forall – execute procedure – call module – write – raiseexception

17 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Genio / Módulo (1) Instrucciones específicas para operaciones sobre datos de las fuentes destino. –Relacionales »AddRow, SmartInsert, UpdateRow, DeleteRow. –Multidimensionales »ClearDimension, AddMember, DeleteRow(elimina las celdas de un cubo), SetCell, RefreshCube.

18 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Genio / Módulo (2)

19 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Genio / Proceso Un proceso define una cadena de transformaciones de datos. Un proceso es una secuencia de reglas de la forma: (nro, cond., accion1, accion2) que se lee: if (cond) then accion1 else accion2 donde las acciones pueden ser: »run modulo, run ejecutable (.exe,.bat), »send mensaje, ftp archivo, »commit/rollback, »trigger eventos, »goto nro | exit

20 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Genio / Proceso (1)

21 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Genio / Otros objetos Datasets Variables globales y del sistema Excepciones Funciones Tablas de lookup Procedimientos

22 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Genio / Etapas en la definición 1. Conexión (Acceso a las fuentes de datos) origen GENIO destino módulos 3. Módulos 5. Activación de procesos evento tiempo presencia / modif. archivo 2. Tablas Genio (Importación de estructuras) proceso 4. Procesos

23 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Genio / Otras funcionalidades Análisis de impacto frente a cambios en –esquemas de las fuentes, –objetos Genio Mecanismo de sincronización entre las estructuras de tablas importadas en el referencial Genio y los servidores de BDs. Histórico de cambios. Logs de ejecución en el referencial Genio.