1 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Microsoft DTS Se trata de una componente predefinida del RDBMS SQL.

Slides:



Advertisements
Presentaciones similares
Migrando nuestros paquetes de DTS a Servicios de Integración SQL 2005
Advertisements

Microsoft SQL Server 2005 Integration Services
DATA MART Sergio Daniel.
integridad referencial
Cognos Data Integration
ORACLE OLAP Integrantes: *Aizaga, Martiniano *Gallegos, Marina
COLEGIO DE BACHILLERES PLANTEL 13 XOCHIMILCO-TEPEPAN MATERIA:TIC EQUIPO:23 PRESENTACION: BASE DE DATOS ALUMNAS: Velazquez Corona Elsa Ponciano Antonio.
Microsoft SQL Server 2008 – SQL Server Integration Services
• SQL Server Integration Services SSIS
Especialista en Business Intelligence Reporting Services SSRS (Sesión 16) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
Especialista en Business Intelligence Integration Services SSIS (Sesión 7) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
SQL Server Integration Services SSIS
SQL Server Integration Services SSIS
TecriMil Control de Asistencia.
Informe caso de estudio Implementación de un Datawarehouse
Especialista en Business Intelligence Integration Services SSIS (Sesión 7) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
Introducción arquitectura base de datos Microsoft SQL Server 2000/2005
Especialista en Business Intelligence Integration Services SSIS (Sesión 6) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
UNIDAD II Modelo de Datos.
INTERFAZ DE ACCES DISEÑO DE BASE DE DATOS
Evaluación de Productos
ARIS-G: Software de Monitoreo Geomecánico de Superficies
Introducción a los Conceptos de Bases de Datos Docente: Ing. Marleny Soria Medina.
1 Propuesta de Plataforma Tecnológica Sistema Nacional de Indicadores Universidad Veracruzana.

SQL Server 2008 Integration Services
Weka.
Una base de datos es un “almacén” que nos permite guardar grandes cantidades de información de forma organizada para que luego podamos encontrar y utilizar.
Contenido: 1- Que es el .Net Framework 2- Arquitectura en .Net
LA IMPORTANCIA DE LAS PyMEs
UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO MODULO IV ADMINISTRACIÓN DE BASES DE DATOS Administración del DBMS E.I. L.E. Prof. Ramón Castro Liceaga SEMINARIO.
Colegio de Bachilleres Plantel 13 Xochimilco-Tepepan Integrantes: Karen Elizabeth González Monroy Elizabeth De Jesús Vergara Grupo:308.
Especialista en Business Intelligence Integration Services SSIS Tareas de Flujo de Control (Parte I) Microsoft SQL Server 2008 R2 Suscribase a
1 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Plan Contexto - Ciclo de vida de un dw –Carga inicial –Problemática.
Introducción a los Sistemas Operativos
Especialista en Business Intelligence Integration Services SSIS Paquetes y Tareas de Flujo de Datos Microsoft SQL Server 2008 R2 Suscribase a
SQL Server 2005 Analysis Services.
GUTIÉRREZ GRANADOS HÉCTOR DANIEL
CICLO DE VIDA Y NORMAALIZACION DE UN SISTEMA DE BASE DE DATOS
Nuevos Productos Macro Pro ofrece varias soluciones complementarias para cumplir con los objetivos de control y análisis de información de nuestros clientes.
Herencia. Introducción La idea básica es poder crear clases basadas en clases ya existentes. Cuando heredamos de una clase existente, estamos re-usando.
Especialista en Business Intelligence Integration Services SSIS Transformaciones (Parte 4) Microsoft SQL Server 2008 R2.
COLEGIO DE BACHILLERES PLANTEL 13 XOCHIMILCO-TEPEPAN MATERIA:TIC EQUIPO:21 PRESENTACION: BASE DE DATOS ALUMNAS: Adán Millán Sánchez.
Paquetes SSIS.
ALUMNO: CHIMAL MOSSO MARCO ANTONIO Marín González Luis Alberto MATERIA: T.I.C. III.
EQUIPO:#3 GRUPO:304 NOMBRES: Lizbeth Nava Barón y Erick Ali Mejía.
Sistema informático de apoyo a la evaluación de la enseñanza IN.CO.
Data Compatibility 100% OLE DB architecture (including ODBC) 100% OLE DB architecture (including ODBC) Relational and non-relational sources Relational.
Diseño de Sistemas.
ORACLE OLAP CAECE Integrantes: *Aizaga, Martiniano *Gallegos, Marina *Kleinlein, Guillermo *Schiano di Cola, Emiliano.
Colegio de Bachilleres Plantel 13 Xochimilco - Tepepan
Especialista en Business Intelligence Integration Services SSIS (Sesión 3) Microsoft SQL Server 2008 R2 (Nov.2013) Suscribase a o.
SQL Server Integration Services SSIS
AFM – Web File Manager Versión 5. Novedades técnicas – Forma de Implementación Siguiendo última tecnología de Microsoft: Framework.NET 3.5 Implementación.
INTERFAZ DE ACCESS  Access es un sistema gestor de bases de datos relacionales (SGBD). Una base de datos suele definirse como un conjunto de información.
Taller de Inteligencia de Negocios SQL Server Integration Services SSIS Semana 2.
• SQL Server Integration Services SSIS
• SQL Server Integration Services SSIS
Taller de Inteligencia de Negocios SQL Server Analysis Services Semana 8.
Taller de Inteligencia de Negocios SQL Server Integration Services SSIS Sesión 3.
DATA WAREHOUSE.
Bases de Datos 1 Universidad Católica de Costa Rica Prof. Daniel Obando.
Partes de la ventana Access
BUSINESS T&G Think & Grow Uniclass Business Intelligence La solución Business Objects que analiza los procesos de su negocio.
Diccionario/Directorio de Datos
ACCESO A DATOS EN ASP.NET Controles de origen de datos Controles enlazados a datos.
DLM Transact SQL Sesión I Introducción al SQL Server Uso de las herramientas de consultas del Transact SQL.
Entregables del Proyecto
LE, EI, Profesor Ramón Castro Liceaga UNIVERSIDAD LATINA (UNILA) IV. IMPLANTACION DE ALGORITMOS.
Taller de Inteligencia de Negocios SQL Server Integration Services SSIS Sesión 2.
Transcripción de la presentación:

1 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Microsoft DTS Se trata de una componente predefinida del RDBMS SQL Server 7.0 de Microsoft. Como cliente, esta componente se presenta bajo 3 formas: –DTS Designer Asistente gráfico para la definición de los procesos (paquetes) encargados de la transformación de datos. –DTS Import y Export wizards Asistente gráfico para la definición de paquetes más simples. –DTS programming interfaces (API) Interfaces para ser usadas desde leng. de programación (VBasic, VC++) Para la ejecución y planificación –ServidorSQL Server 7.0 (incluyendo el servicio Agent)

2 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Microsoft DTS (1) Permite el uso de un referencial para almacenar todas las definiciones. –Necesariamente: Microsoft Repository –Otras formas de almacenar las definiciones: »en archivo con formato específico »en SQL Server (dentro de la bd de nombre msdb)

3 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Archivo DTS / Arquitectura de la herramienta DTS Designer Especificación Producción Referencial (Microsoft Repository) Servidor SQL Server 7.0 SQL Server Enterprise Manager BD (SQL Server)

4 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs DTS / Acceso a los datos DTS se apoya fuertemente en el acceso y almacenamiento a través de OLE DB. –DTS es un consumidor OLE DB Provee conexiones especificas para archivos de texto.

5 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs DTS / Tareas DTS se basa en la definición de tareas y un orden parcial entre ellas. La tarea básica que permite definir correspondencias y transformaciones entre la fuente de datos origen y la fuente de datos destino: –Transform data (data pump) Transform data –Accede y almacena datos a traves de Ole DB o archivos de texto. –Transforma datos entre las fuentes. –La transformación puede tratarse de (extremos): »una simple copia entre columnas »una invocación de un script (VB Script, JScript)

6 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs DTS / Transform data Simplificando, se interpreta como: for each o  Origen columnas(d) = T ( columnas(o) ); insert d en Destino; endfor OrigenDestino T T: copia copia más transformaciones incluyendo funciones en un lenguaje script (VB Script, JScript).

7 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs DTS / Otras tareas Data Driven –Permite realizar actualizaciones y borrados además de inserciones. Execute SQL –Permite definir un conjunto de instrucciones SQL. Execute Process –Permite invocar a un ejecutable (.exe,.bat) Send Mail

8 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs DTS / Otras tareas (1) Bulk Insert –Método rápido para copiar datos en archivos ascii a una bd SQL Server. No permite definición de transformaciones. Active X Script –Permite invocar un Active X script (VB Script, Perl Script, Java Script)

9 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs DTS / Paquete Un paquete es un "workflow" que define un proceso de transformación. Un paquete es un grafo donde: –los nodos son tareas, y –los arcos representan pasos que definen el orden en la cual se ejecutarán las tareas. Un paso puede tener asociado una restricción de precedencia definiendo cómo el resultado de una tarea determina la ejecución de la otra. –on success –on failure –on completion

10 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs DTS / Paquete (1) Posible confusión "gráfica": –Transform data es un nodo (tarea) dentro del workflow.

11 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs DTS / Etapas en la definición 1. Conexión (Acceso a las fuentes de datos) origen DTS destino 4. Activación de paquetes tiempo paquete 3. Paquetes tareas 2.Tareas Importación de estructuras

12 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Resumen Genio Proceso –Acción »Módulo + Foreach/Forall + AddRow + datatsets »Módulo + Foreach/Forall + AddRow + DeleteRow + UpdateRow + datatsets »Módulo + Execute Procedure »Ejecutables »Send »  (nro, condición, acción 1, acción 2) DTS Paquete –Tarea »Transform data »Data driven »Execute SQL »Execute Process »Send Mail »Bulk Insert »Active X Script –Paso »restricción de precedencia ( on...)

13 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Resumen (1) DTS maneja explicitamente la sincronización –En Genio, se podría “simular” usando vars globales Genio maneja condiciones dentro del proceso –DTS provee las restricciones de precedencia pero no restricciones. Genio provee 3 mecanismos para la activación de procesos. –DTS ofrece activación por tiempo. Genio ofrece un análisis de impacto –DTS ???

14 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Observación Las dos últimas transparencias resumen comparativamente las caracteristicas del "modelo (de WF?)" de Genio y DTS.

15 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Conclusión Un ambiente de data warehousing tiene características diferentes a un ambiente de migración. Ambiente de data warehousing –Se construye el depósito de datos –A intervalos, se agregan cambios al depósito –Se archivan o se eliminan datos muy viejos –Se ejecutan consultas

16 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Conclusión (1) A nuestro conocimiento, no hay una herramienta que realice o ayude a realizar todas las tareas que requiere instanciar (poblar) un data warehouse relacional. Variedad enfatizando algunos aspectos más que otros –Análisis del estado de los datos origen –Limpieza –Extracción, transformación y carga –Captura de cambios en los datos

17 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Conclusion (2) Notar que ETLs no resuelven todas las tareas. –Una solución "comercial hoy" es una combinación de: »herramientas de análisis del estado de los datos (calidad de los datos) a migrar, »herramientas ETL, »herramientas o mecanismos de captura de cambios en los datos. –Costo

18 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Conclusion (3) La selección de herramientas es una tarea que consume tiempo no despreciable. Algunas sugerencias –(Como siempre) Importante saber lo que se quiere y se requiere. –Fijar un tiempo para evaluar las herramientas y no extenderlo. –Entender el diccionario de datos usado y contrastarlo con los ya existentes en su proyecto o los planeados a incorporar. –No subestimar el tiempo de analizar que tan "sucios" están los datos origen y la metainformación sobre ellos (documentación, personas).

19 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Conclusión (4) Algunas sugerencias (cont.) –No subestimar el volumen y la especificación de las correspondencias. »En una etapa de análisis, identificar las correspondencias de 300 atributos a 10 minutos/atr = 50h  8 dias de 8h. – >

20 7/5/2001InCo - Aplicacion de WF para la definicion de procesos de refresque deDWs Conclusión (5) Dificultad para distinguir la problemática que se resuelve bajo los titulos "Limpieza" e "Integración de datos".