Antonio Soto SQL Server MCT

Slides:



Advertisements
Presentaciones similares
Montevideo 14 de Diciembre
Advertisements

Bienvenido al evento online de Microsoft Small Business Server 2003 R2 (Volumen II) Andrés de Pereda.
Microsoft Office Sharepoint Server Business Intelligence Rubén Alonso Cebrián Código: HOL-SPS07.
Microsoft SQL Server 2005 Integration Services
Cognos Data Integration
ORACLE OLAP Integrantes: *Aizaga, Martiniano *Gallegos, Marina
Guido Rubin Escalabilidad.
Supervisión del rendimiento de SQL Server
Tecnologías Cliente / Servidor Capitulo III Richard Jiménez V. clienteserver.wordpress.com.
“Tuning” Universidad Nacional Autónoma de México Bases de datos I
Microsoft SQL Server 2008 – SQL Server Integration Services
• SQL Server Integration Services SSIS
Especialista en Business Intelligence Reporting Services SSRS (Sesión 16) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
• SQL Server Analysis Services
Especialista en Business Intelligence Integration Services SSIS (Sesión 5) Microsoft SQL Server 2008 R2 (Nov.2013) Suscribase a o.
Especialista en Business Intelligence Integration Services SSIS (Sesión 7) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
SQL Server Integration Services SSIS
SQL Server Integration Services SSIS
SQL Server Integration Services SSIS
SQL Server Integration Services SSIS
• SQL Server Analysis Services
• SQL Server Integration Services SSIS
Presentado por: Katya Aranda Lesley Vallejos Alfredo Yong
Soporte GO-LIVE Crear y seguir tareas, escenarios, requerimientos Asignar trabajo al equipo Uso de workflow para hacer cumplir el proceso.
• SQL Server Integration Services SSIS
Especialista en Business Intelligence Integration Services SSIS (Sesión 6) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
Administración de datos con MS-SQL Server y Visual Basic
ANALITICA - INTEGRATOR INTRODUCCIÓN Y CONCEPTOS. ANALITICA - INTEGRATOR OBJETIVO Integrar información aislada en archivos o sistemas, tanto corporativos.
SQL Server 2008 Integration Services
Mejorando la forma de construir datawarehouses usando Microsoft SQL Server 2008 Integration Services.
InfoPath Ventajas y Uso.
Una base de datos es un “almacén” que nos permite guardar grandes cantidades de información de forma organizada para que luego podamos encontrar y utilizar.
Contenido: 1- Que es el .Net Framework 2- Arquitectura en .Net
Desarrollo de aplicaciones para ambientes distribuidos
Especialista en Business Intelligence Integration Services SSIS Tareas de Flujo de Control (Parte I) Microsoft SQL Server 2008 R2 Suscribase a
Especialista en Business Intelligence Integration Services SSIS Paquetes y Tareas de Flujo de Datos Microsoft SQL Server 2008 R2 Suscribase a
FACTIBILIDAD Migración de Base de Datos
Inteligencia de Negocios Buenos Aires, mayo de 2009 U.T.N. – F.R.B.A. Prof: Ing. Pablo Cigliuti Ayud: Ing. Rafael Rizzo.
SQL Server 2005 Analysis Services.
CICLO DE VIDA Y NORMAALIZACION DE UN SISTEMA DE BASE DE DATOS
Nuevos Productos Macro Pro ofrece varias soluciones complementarias para cumplir con los objetivos de control y análisis de información de nuestros clientes.
Especialista en Business Intelligence Integration Services SSIS Transformaciones (Parte 4) Microsoft SQL Server 2008 R2.
Especialista en Business Intelligence Integration Services SSIS Transformaciones (Parte 3) Microsoft SQL Server 2008 R2 Suscribase a
Paquetes SSIS.
Bases de Datos.
 SQL es un lenguaje de consulta para los sistemas de bases de datos relaciónales, pero que no posee la potencia de los lenguajes de programación.
ORACLE OLAP CAECE Integrantes: *Aizaga, Martiniano *Gallegos, Marina *Kleinlein, Guillermo *Schiano di Cola, Emiliano.
Introducción a la Optimización de Consultas. Francisco Moreno.
CONTRATOS DE CLIENTES Orlando Sedamano Cornejo Marco Bustinza
TALLER DE SISTEMAS OPERATIVOS
TALLER DE SISTEMAS OPERATIVOS
Tecnologías Cliente / Servidor Capitulo II Richard Jiménez V. clienteserver.wordpress.com.
1.2 Requerimientos de instalación > >
SQL Server Analysis Services SSAS
SQL (Structured Query Language) Lenguaje orientado a bases de datos y sobre todo, al manejo de consultas; el objetivo principal de SQL es la realización.
Especialista en Business Intelligence Integration Services SSIS (Sesión 3) Microsoft SQL Server 2008 R2 (Nov.2013) Suscribase a o.
SQL Server Integration Services SSIS
Especialista en Business Intelligence Analysis Services SSAS (Sesión 8) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
Taller de Inteligencia de Negocios SQL Server Integration Services SSIS Semana 2.
• SQL Server Integration Services SSIS
• SQL Server Integration Services SSIS
Taller de Inteligencia de Negocios SQL Server Analysis Services Semana 8.
Taller de Inteligencia de Negocios SQL Server Integration Services SSIS Sesión 3.
DATA WAREHOUSE.
Bases de Datos y Sistemas de Gestión de Bases Relacionales.
INVESTIGACION DE TEMARIO JOSE LUIS VEGA MERINO.  1.2. Requerimientos de instalación.  Microsoft Windows 7 Professional y Microsoft Windows 7 Ultimate.
WINDOWS SERVER 2008 r2 ADMINISTRACION DE RECURSOS: Con el Administrador de recursos del sistema de Windows del sistema operativo Windows Server® 2008 R2,
DLM Transact SQL Sesión I Introducción al SQL Server Uso de las herramientas de consultas del Transact SQL.
SYMFONY Información del Framework. Síntesis de Symfony  Es un framework diseñado para optimizar el desarrollo de aplicaciones web creado con PHP5. 
Taller de Inteligencia de Negocios SQL Server Integration Services SSIS Sesión 2.
Transcripción de la presentación:

Antonio Soto asoto@solidq.com SQL Server MCT

Analysis Services Datawarehouse Integration Services Informes Dashboards Cuadros de Mando Excel HerramientaBI Analysis Services Datawarehouse (SQL Server, Oracle, DB2, Teradata) Integration Services SQL/Oracle SAP/Dynamics Sistemas Propietarios Texto XML

Asumimos Objetivos Experiencia con SSIS y SSAS 3/24/2017 3:59 PM Asumimos Experiencia con SSIS y SSAS Objetivos Discutir el diseño, rendimiento y escalabilidad para construtir paquetes ETL y cubos (UDMs) Buenas Prácticas Errores Comunes

BPA = Best Practice Analyzer Utilidad que escanea los metadatos de SQL Server y recomienda buenas prácticas Buenas prácticas adquiridas del equipo de desarrollo y Customer Support Services Novedades: Soporte para SQL Server 2005 Soporte para Analysis Services y Integration Services Planificación del scaneo Auto actualizable Disponible la CTP, RTM en Abril http://www.microsoft.com/downloads/details.aspx?FamilyId=DA0531E4-E94C-4991-82FA-F0E3FBD05E63&displaylang=en

Agenda Integration Services Analysis Services Pequeña Introducción Principios del Buen Diseño de Paquetes Component Drilldown Optimización de Rendimiento Analysis Services Introducción a UDM Buenas Prácticas de diseño de UDM Tips de Rendimiento

Introducido en SQL Server 2005 El sucesor de Data Transformation Services La plataforma para una nueva genración de tecnologías de integración de alto rendimiento

Reporting y escalación son procesos lentos, retrasando las respuestas. Alertas y escalación Minería de Datos Datos Call Center: semi estructurados Datos propietarios:ficheros binarios Base de Datos Codificación Manual Área Intermedia Minería de Texto ETL Área intermedia Limpieza y ETL Área Intermedia ETL Almacén Informes Datos Móviles Integración y almacenamiento requiren operaciones y almacenamiento intermedio. La preparación de datos necesita de herramientas diferentes, en muchos casos incompatibles. Reporting y escalación son procesos lentos, retrasando las respuestas. Con grandes volúmenes de datos, este escenario poco manejable.

SQL Server Integration Services Alertas y escalación SQL Server Integration Services Minería de texto Origen Personalizado Orígenes Estándard Limpieza de Datos Mezclas Minería de Datos Almacén Informes Datos Móviles Call center: Datos Semi Datos propietarios: ficheros binarios Base de datos Integración y almacenamiento en una operación sencilla y fácilmente administrable. Origen, preparación y carga de daos en un único proceso auditable. Reporting y escalación pueden paralelizarse con la carga del almacén. Puede escalar a requisitos muy altos de complejidad y carga.

Flujo de Control (Motor de Ejecución) Motor de Flujos de Trabajo paralelos Ejecuta contenedores y Tareas Flujo de Datos (“Pipeline”) Tarea Especial del flujo de control A high-performance data pipeline Applies graphs of components to data movement Los Componentes pueden ser orígenes de datos, transformaciones y destinos Posibilidad de crear operaciones en paralelo

Agenda Introducción a Integration Services Principios del Buen Diseño de Paquetes Detalle de los Componentes Optimización de Rendimiento

Seguir las guías: Microsoft Development Guidelines Conocer el Negocio Diseño iterativo, desarrollo y pruebas Conocer el Negocio Comprender las personas y los procesos es crítico para el éxito Una excelente referencia:“Data Warehouse ETL Toolkit” de Kimball Pensar en toda la solución Contención de recursos, ventana de procesamiento, … SSIS no soluciona un mal diseño de base de datos Se siguen aplicando los “viejos” principios – e.j. ¿cargamos con o sin índices? Consideraciones de Plataforma Se ejecutará en IA64 / X64? BIDS no en IA64 – ¿Cómo depuraremos? Está el driver OLE-DB XXX disponible para IA64? Memoria y uso de recursos en plataformas diferentes

Modularidad de Procesos Romper ETL complejos en paquetes lógicos diferentes (vs. Diseño monolítico) Mejora la experiencia de desarrollo y depuración Modularidad de Paquete Separar subprocesos dentro del paquete en diferentes contenedores Más elegante y sencillo de desarrollar Podemos deshabilitar contenedores enteros cuando estamos depurando Modularidad de Componente Utilizar Scripts de Tarea y Transformación para problemas que no sean repetitivos Crear componentes personalizados para maximizar la reutilización

Usar Configuraciones de Paquete Desde el principio Nos facilitará las cosas en el despliegue Simplificar el despliegue Desarrollo  QA  Producción Usar el Registro de Paquetes Rendimiento y Depuración Seguridad desde el primer momento Credenciales y otra información sensible Paquete y Proceso Configuración y Parámetros

SSIS es programación visual Utilizar un sistema de control de código fuente Deshacer no es una buena técnica Pensar en escenarios de múltiples-programadores Comenta tus paquetes y scripts En 2 semanas probablemente puedes haberte olvidado de alguna parte de tu diseño Probablemente en algún momento otra persona tenga que mantenerlo Utilizar el manejo de errores Utilizar las restricciones de precedencia correctamente en las tareas Usar las salidas de error en transformaciones – almacénalas en una tabla para procesarlas más tarde, incluso podemos gestionarlas en el propio paquetes Try…Catch en los scripts

Minimiza los datos auxiliares Evita el sobre-diseño Demasiada modularidad no es elegante y puede ser más lento Pero no tengas miedo de experimentar– Hay muchas formas de resolver un problema Maximiza el Paralelismo Reserva suficientes threads Propiedad EngineThreads en la Tarea de Flujo de Datos “Regla del Pulgar” – Nº de Orígenes + Nº de componentes asíncronos Minimiza Bloqueo Componentes Síncronos vs. Asíncronos Memcopy es caro – reduce el número de componentes asíncronos en un flujo si es posible- veremos un ejemplo Minimiza los datos auxiliares Por ejemplo, minimiza los datos obtenidos por LookupTx

Utilizar las características de registro y auditoría MsgBox es tu amigo Los Depuradores de datos son tus amigos Usar el componente de rendimiento del Proyecto REAL Experimenta con diferentes técnicas Utiliza control de código fuente Enfócate en los cuellos de botella – ahora veremos como Pruebas en diferentes tecnologías 32bit, IA64, x64 Almacenamiento Local, SAN Consideraciones de Memoria Consideraciones de Red y Topología

Elimina campos redundantes Utiliza sentencias SELECT en lugar de tablas SELECT * es tu enemigo Reduce también las columnas redundantes después de cada componente asíncrono! Filtra los Registros La cláusula WHERE es tu amigo Conditional Split en SSIS Concatena o redirige los campos no necesarios Carga en Paralelo EL sistema de origen divide los datos de origen en múltiples partes Ficheros planos – múltiples ficheros Relacional – vía campos clave e índices Componentes de Múltiple Destino. Todas cargan los mismos datos

¿BCP es suficientemente bueno? La sobrecarga de ejecutar un paquete SSIS puede reducir toda la ventaja de rendimiento sobre BCP para conjuntos de resultados pequeños. Necesitamos el mayor control que nos proporciona SSIS? ¿Qué Patrón? Disponemos de varios patrones de Búsqueda – ¿Cuál encaja mejor? En el Proyecto Real existen varios ejemplos de patrones: http://www.microsoft.com/sql/solutions/bi/projectreal.mspx ¿Qué componente? Tarea Bulk Import vs. Data Flow Bulk Import podría darnos mejor rendimiento si no necesitamos transformaciones o filtros y el destino es SQL Server. Lookup vs. MergeJoin (LeftJoin) vs. sentencias basadas en SQL Podríamos necesitar MergeJoin si no somos capaces de rellenar la cache de búsqueda. Sentencias SQL nos pueden proporcionar un método para persistir los registros no encontrados en la cache y aplicar una operación basada en conjunto de resultados para un mejor rendimiento. Script vs. Componente personalizado Los scripts pueden ser buenos para pequeñas transformaciones que no serán reutilizadas

Utilizando Error Output para manejar los no encontrados Ignorando los errores y comprobando nulos en la columna derivada 105 segundos 83 segundos

Optimiza y estabiliza lo básico Minimiza las áreas intermedias (utiliza Ficheros Raw si es posible) Asegúrate de que tienes suficiente memoria Windows, Disco, Red, … Grupos de Ficheros de SQL, indexación, Particionado Obtener una Línea de Base Reemplazar los destinos con RowCount Origen->Rendimiento RowCount Origen->Rendimiento en Destino Añade / cambia los componentes de forma incremental para ver los efectos Esto podría incluir la capa de base de datos Utiliza control de código fuente Optimiza los componentes lentos para los recursos disponibles

Restricciones de Memoria Restricciones de lectura y CPU Enfocarse en las rutas críticas Utilizar recursos Disponibles Restricciones de Memoria Restricciones de lectura y CPU Dejémoslo!! Optimiza el más lento

24/03/2017 3:59 PM ©2005 Microsoft Corporation. All rights reserved. This presentation is for informational purposes only. Microsoft makes no warranties, express or implied, in this summary.

Sigue las buenas prácticas de desarrollo Comprende como la arquitectura de SSIS influye en el rendimiento Buffers, tipos de componentes Patrones de Diseño Aprende las nuevas características Pero no olvides los principios existentes Utiliza la funcionalidad nativa Pero no tengas miedo de extenderla Mide el Rendimiento Enfócate en los cuellos de botella Maximiza el Paralelismo y el uso de memoria donde se oportuno Piensa en las posibilidades de otras plataformas (RAM en 64bit ) Probar es clave