SQL Data Warehouse, casos de uso, escalabilidad, cargas de datos

Slides:



Advertisements
Presentaciones similares
Microsoft SQL Server 2005 Integration Services
Advertisements

Enero 28, 2009 Módulo de Inteligencia de Negocios.
Microsoft SQL Server 2008 – SQL Server Integration Services
Especialista en Business Intelligence Integration Services SSIS (Sesión 7) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
Julio Pacheco SQL SERVER 2005 XML APRENDIENDO CON EJEMPLOS.
Introducción arquitectura base de datos Microsoft SQL Server 2000/2005
On Line Analytical Processing
SQL Server 2008 Integration Services
Bases de Datos II OLAP Online Analytical Processing
DATA MART Los data warehouses están hechos para proporcionar una fuente de datos única para todas las actividades de apoyo para la toma de decisiones.
Bases de Datos Oracle Optimización
Inteligencia de Negocios Buenos Aires, mayo de 2009 U.T.N. – F.R.B.A. Prof: Ing. Pablo Cigliuti Ayud: Ing. Rafael Rizzo.
Especialista en Business Intelligence Integration Services SSIS Tareas de Flujo de Control (Parte I) Microsoft SQL Server 2008 R2 Suscribase a
Universidad del Cauca – FIET – Departamento de Sistemas CAPITULO 19 Extensiones de Oracle 9i para las sentencias DML y DDL.
CAPITULO 4 Despliegue de Datos Desde Múltiples Tablas
Levantamiento de necesidades BI Ministerio de Salud
1 Prof:Paula Quitral INTRODUCCIÓN DATAWAREHOUSE Departamento de Informática Universidad de Rancagua.
Especialista en Business Intelligence Integration Services SSIS Transformaciones (Parte 4) Microsoft SQL Server 2008 R2.
PROCEDIMIENTOS ALMACENADOS Es una consulta almacenada en la base de datos en un servidor. Los P.A. Mejoran el Rendimiento Disminuyen el tráfico. Los P.A.
Universidad del Cauca – FIET – Departamento de Sistemas CAPITULO 0 Introducción.
Data Compatibility 100% OLE DB architecture (including ODBC) 100% OLE DB architecture (including ODBC) Relational and non-relational sources Relational.
Manual violento de Navicat
Johandra Gastier David De Freitas
Ing. Ernesto Sierraalta Fundamentos de Desarrollo de Proyectos de Inteligencia de Negocios ( Decision Support Systems & Data Warehousing.
¿Qué es una base de datos? Una base de datos se puede definir como un conjunto de información relacionada que se encuentra agrupada ó estructurada. Desde.
Funcionalidades Híbridas en SQL 2014 Víctor Hugo Cárdenas.
Septiembre 12, 2015 Bogotá, Colombia #sqlsatBogota.
Interactuando con MS SQL Server a través de SMO Erik LinkedIn Blog Creador de SQLServerBooster.
Data Warehouse RONALD FERNANDO QUINTERO VEGA DIEGO ALEJANDRO VALENCIA RIVERA INTELIGENCIA DE NEGOCIOS CREAD-HONDA 2017.
ALFRESCO.
#606 | SANTIAGO 2017 Abril 1, 2017 Santiago, Chile #sqlsatSantiago.
Matrices Ana Pola I.E.S. Avempace.
SSAS Tabular Model Julio Urriola Barra
#606 | SANTIAGO 2017 Abril 1, 2017 Santiago, Chile #sqlsatSantiago.
Integrando múltiples fuentes de datos con Microsoft Azure
SEGURIDAD SQL Usuarios, privilegios y perfiles.
09 de mayo del 2016Pg. 1 ING. BERTHA MAZON, UNIDAD III: SOLUCIONES DE INTELIGENCIA DE NEGOCIOS.
DB - BASES DE DATOS BI - BUSINESS INTELLIGENCE
Extendiendo la virtualización hacia la Nube.
SQL Data Warehouse Guía para un desarrolador
MANUAL DE SILOS MANAGMENT – Gestión de Inventarios
SQL Server o SQL Database
Mayo 13, 2017 Bogotá, Colombia #sqlsatBogota.
Prof. Daniel Obando Fuentes
DATA WAREHOUSE Y ALMACENAMIENTO
Tarea 3: data warehouse y san
Computación Curso 2017.
#606 | SANTIAGO 2017 Abril 1, 2017 Santiago, Chile #sqlsatSantiago.
BASES DE DATOS Quienes las utilizan? Qué son? Beneficios
Orígenes Funciones Condicionales
M.I.R.S.T. Gabriel Orozco Martínez
Excel.
Excel.
¿Qué es una Base de Datos? z“Una colección de información que persiste en un período largo de tiempo” zNo son simplemente “archivos de datos”
Noviembre18, 2017 Concepción, Chile #sqlsatconce.
Ing. David Sánchez Aguilar @davidsancheza
Noviembre18, 2017 Concepción, Chile #sqlsatconce.
INGENIERÍA INFORMÁTICA Y DE SISTEMAS Docente: Mg Ing. Jesús Ocaña Velásquez ARQUITECTURA DEL COMPUTADOR.
Matrices I.E.S. Seritium.
Power BI, Sharepoint y SQL Server, una gran conversación
Nuevas Características de SQL Server 2016
Noviembre18, 2017 Concepción, Chile #sqlsatconce.
Análisis de la Salud de una Base de Datos SQL Server
SQL Graph Databases Ricardo Estrada DPA
Capítulo 8: Introducción a redes
DATA WAREHOUSE Joseba Gil Noelia Suaña. ÍNDICE 1. Introducción. 2. ¿Qué es Data Warehouse? 3. Arquitectura. 4. Ventajas/Inconvenientes.
Presentación CRM 2019.
Nuevas Características de SQL Server 2019
2. PRINCIPIOS BASICOS DE MICROSOFT ACCESS. -Sistema que tiene la capacidad de realizar tareas de distinta índole utilizando herramientas que interactúan.
Base de datos años  En la década de los años 80’, se desarrolló el SQL, un lenguaje de consultas que permite consultar, valga la redundancia,
Transcripción de la presentación:

SQL Data Warehouse, casos de uso, escalabilidad, cargas de datos Adrian Miranda Cordero SQL Data Warehouse, casos de uso, escalabilidad, cargas de datos

Agradecimiento a los patrocinadores Premium Silver Personal

Speaker Administrador de base de datos Profesor Universitario y de Cursos Oficiales MOC Conferencista en eventos SQL Saturday - Latinoamerica Youtube: www.youtube.com/BILatam Facebook: facebook.com/CloudLatam Twtter: @JMCJOSEAD Linkedin: https://cr.linkedin.com/in/admiranda Blog: www.medium.com/@adrianmc Correo: amiranda@nemesyscr.com

Agenda SQL Data Warehouse Inicios Demo : Provisionamiento Diseño de tablas / Demo Cargas de Datos / Integración con Polybase / Demo Consideraciones de Administración Protección de los datos

Inicios

Data Warehouse tradicional CRM Data Warehouse Visualización Data sources ETL Una única fuente de datos en un único repositorio de datos con todos los datos de una compañía. ERP LOB Con esto no estamos diciendo que el enfoque esté mal, para nada, siempre va a ser un gran enfoque, pero nos tenemos que poner a pensar en la siguiente pregunta. Qué necesito para tener una solución de BI On-Premise? OLTP

Tomemos en consideración la cantidad de datos con que se cuenta hoy en día. La variedad de datos que tenemos con que contamos, que no son solo los datos estructurados si no también los datos no estructurados.

SQL DW

SQL DW Si usted está pensando en Sistemas OLTP Frecuentes lecturas / escrituras Multiples Select (Ejecutados secuencialmente) Procesamiento fila por fila Recordar mencionar la problemática actual con el tema del manejo de datos y análisis en tiempo real en sistemas transaccionales.

SQL DW - MPP Lo que trabajamos hoy en día. Compartimos recursos SMP – Symmetric Multiprocessing Lo que trabajamos hoy en día. Compartimos recursos CPU Memoria Disco MPP – Massively Parallel Processing Concepto de “Share nothing” SQL DW funciona de la siguente manera, existe un cerebro y está el músculo, o sea los que completan el trabajo. SQL DW viene siendo el cerebro y AZURE SQL Database viene siendo el musculo que hace el trabajo. Cada servidor controla sus recursos y opera de forma separada

Con qué está relacionado? SQL DW - DWU Con qué está relacionado? Recursos como Memoria CPU IOPS Medición de Métricas Scan / Agregation, Cargas, CTAS Pueden ser cargadas en tiempo real (*)

A cada tabla se le asignan 60 buckets

Ejemplo DWU 100 60 Buckets (Blob Storage) 1-Engine Role 1 2 3 4 5 6 7 1- Worker Nodes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60

Ejemplo DWU 300 60 Buckets (Blob Storage) 1-Engine Role 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Worker Node

DEMO

Diseño de Tablas

Diseño de Tablas Hash Round Robin Inserta basado en el valor de una columna que sirve como elemento diferenciador. Se pueden utilizar para Fact tables. Se pueden usar para Summarized tables. Importante, los puntos anteriores son válidos si y solo sí cuentan con una columna que permita agrupar valores en común. Si un Full Scan no tiene un buen rendimiento. Inserta de manera aleatoria. Joins entre tablas que tienen que ir de PK a FK. Ejem: Dimensiones. Si necesitan hacer cargas de muchos datos en un área Stage, sería la mejor configuración. A cada tabla se le asignan 60 buckets

Consideraciones para el diseño de tablas Tablas se crean con Page Compression de forma predeterminada. Round Robin también es el valor predeterminado en la opción de distribución de datos. No hay limite de filas, es determinado por el storage. 1024 columnas por tabla 2 billones de tablas por base de datos Distribución = Round Robin Mencionar que no se soporta Identity, tampoco se soporta PK y FK ni tipos de datos como XML, SQL_Variant, Text, CLR

DEMO

Preguntas?