DB - BASES DE DATOS BI - BUSINESS INTELLIGENCE Por: Ing. Hugo González Olaya
Qué es una Base de Datos (DB) Datos almacenados en tablas DB no estructuradas Archivos planos: CSV separados por coma Excel DB estructuradas DBMS (database management system) o sistema administrador de bases de datos Modelo Entidad - Relación Servidor DB Petición - Datos Aplicación Cliente Respuesta RDBMS
Tipos DB Relacionales (DBMS) Analíticas (OLAP) Transaccionales Online Transaction Processing (OLTP) SA: Staging Area ODS: Operational Data Store DW: Data Warehouse (Bodega datos) Analíticas (OLAP) Multidimensional (Cubos) Tabular (Cubos tabulares) Data Mining (Minería de datos) ERP BI
Motores DB / Lenguajes / Servicios Microsoft SQL Server (Transact-SQL) Enterprise Edition Standar Edition Develorper Edition Express Edition (gratis) SQL Azure (DB en la nube) Microsoft Access Oracle (PL-SQL) Postgres MySQL Sybase DB2 No-SQL Mongo En las instalaciones $ Servicios
Objetos DB PK FK Checkx##### 10191 10192 10202 Labrie Martin Angela DISEÑO TABLAS: 1ª Forma normal 2ª Forma normal 3ª Forma normal EmpNum Apellido Nombre Extension CodCiudad 10191 10192 10202 Labrie Martin Angela Eva Jose x19891 x19433 x21467 SP FR UltMod \HR\KarlD \HR\AmyL Índice Clusterado Anderson Barr ... integer longstring varchar(20) char(6) char(2) Trigger viwEmpleadoTel SELECT lastname, firstname, extension FROM employee Stored Procedure PK FK Checkx#####
BI
Necesidad de Analizar Datos Organizar datos en información Datos: Conjunto de hechos Información: Medio para cambiar la percepción sobre algo (datos con sentido) Identificar tendencias del negocio, para la toma de decisiones Identificar comportamiento que puede predecir el futuro Compañías de seguros analizan información de reclamos para predecir fraudes
Definición BI BI es un grupo de aplicaciones y tecnologías orientadas a adquirir, almacenar, analizar y datos que permitan a la organización una mejor toma de decisiones Impacto en el negocio
Porqué Necesito una Solución BI ¿Dedica mucho tiempo a hacer informes en Excel atractivos? ¿Dedica más tiempo recolectando y preparando información que analizándola? ¿ No sabe qué hacer con tanta información? ¿No encuentra información? ¿Ha perdido oportunidades de negocio por recibir información atrasada? ¿Quiere saber qué productos fueron más rentables? ¿Quiere conocer patrones de compra de clientes? ¿Desconoce porqué sus clientes le devuelven la mercancía? BI ayuda a rastrear lo que en realidad funciona y lo que no (Bill Gates)
Arquitectura BI
Diseño de Data Warehouse Consumo de datos por el Usuario Herramientas Cliente Orígenes Datos Data Marts Paquetes ETL Área Almacenamiento DW: Bodega de Datos
Modelo Multidimensional ¿Qué información da por sí misma el número 500 en una tabla de ventas? 500 Tabla Hechos (Ventas)
Un Modelo Estrella da un Contexto Employee_Dim EmployeeKey EmployeeID ... Modelo Copo Nieve Tablas Dimensiones Tabla Hechos Time_Dim TimeKey TheDate ... Product_Dim ProductKey ProductID ... Ventas_Fact TimeKey EmployeeKey ProductKey CustomerKey ShipperKey Sales Amount Unit Sales ... Shipper_Dim ShipperKey ShipperID ... Customer_Dim CustomerKey CustomerID ...
Cubos, Dimensiones y Medidas Suma Promedio Semi-Aditivas Hecho Ventas Atlanta Chicago Dimensión Geografía Denver Grapes Cherries Dallas Melons Apples Dimensión Producto Q1 Q2 Q3 Q4 Dimensión Tiempo
Key Performance Indicators (KPIs) Miden grado de cumplimiento de los objetivos de la empresa Compara las métricas del negocio (Value) con metas establecidas (Goal) Visualización depende de la herramienta
Data Mining (DM) Clúster Árboles de decisión Redes neuronales Regresión lineal Regresión logarítmica Series de tiempo Reglas de asociación Naive Bayes
DM: Entrenamiento del Modelo Datos Entranamiento Modelo Minería Datos a Predecir DM Motor DM Motor Modelo Minería Datos Predecidos
DM - Árboles de Decisión Asistir Colegio: 33% Yes 67% No Todos Estudiantes IQ: Coeficiente Intelectual Asistir Colegio: 57% Yes 43% No Fomento Padres = Yes 6% Yes 94% No Fomento Padres = No Fomento Padres ? Asistir Colegio: 18% Yes 82% No 9% Yes 91% No 4% Yes 96% No Alto IQ Medio IQ Bajo IQ Asistir Colegio: 74% Yes 26% No 29% Yes 71% No Alto IQ Bajo IQ IQ IQ
Analítica Avanzada Con R R lenguaje open source de computación estadísticas Minería de datos Maching learning Big data – Big analítica Científicos de datos
Clientes Reportes Excel – Power Pivot Reporting Services Power BI