La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Presentaciones similares


Presentación del tema: "Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan."— Transcripción de la presentación:

1 Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan

2 Juan Alvites HERRAMIENTAS DE BUSINESS INTELLIGENCE - DATAWAREHOUSE Contenido 1.Introducción 2.Definición 3.Datawarehouse 4.Estructura del Datawarehouse 2

3 Juan Alvites 1. Introducción 3

4 Juan Alvites 2. Definición Se entiende como herramientas de Business Intelligence todas las aplicaciones orientadas a convertir datos en conocimiento para la organización, mediante la transformación de datos en información estructurada para su explotación directa por parte de la dirección. 4

5 Juan Alvites 2. Definición 5

6 Juan Alvites 3. Datawarehouse Un Datawarehouse es un gran almacén de datos, en el que se integran datos procedentes de varias fuentes. Además un Datawarehouse debe disponer de una gran capacidad de almacenamiento (gigabytes o terabytes) 6

7 Juan Alvites 7 Definición Datawarehouse (Almacén de datos) se define como una colección de datos que verifican las siguientes propiedades: – Está orientado a objetos (a un tema) – Datos integrados – No volátiles – Variante en el tiempo que surgieron como una herramienta de soporte para la toma de decisiones a nivel gerencial

8 Juan Alvites 8 Explicación de la definición Orientado hacia temas: los datos se almacenan y agrupan por temas de interés.

9 Juan Alvites 9 Explicación de la definición Datos integrados: el almacén de datos integra datos que provienen de varias fuentes. Partimos de una base de datos (operacional) y mediante un proceso de carga de datos hacemos el Datawarehouse. El proceso de carga es lo más complicado por problemas de codificación, medidas de los atributos… de las bases de datos. BD DW CARGA

10 Juan Alvites 10 Explicación de la definición No volátiles: son estables, una vez almacenados los datos no se modifican. BD DW DWDW SELECT INSERT UPDATE DELETE REPORTSSELECT CARGA

11 Juan Alvites 11 Explicación de la definición Variante en el tiempo: los datos contienen información sobre la fecha de los mismos, porque se hacen cargas de datos continuamente. Cuando los datos van cambiando, se actualizan los históricos y se guardan en ficheros temporales. Siempre va haber una variable tiempo. TIEMPO # id_tiempo * periodo

12 Juan Alvites 12 Características Podemos resumir las características de un Datawarehouse: – Trabaja con datos de negocio – Orientado a un sujeto – Almacena datos actuales orientado a un histórico (actual + histórico) – Datos más bien resumidos (no información detallada)

13 Juan Alvites 13 DIFERENCIAS  BD OPERACIONAL -Datos operacionales -Orientado a aplicaciones -Datos Actuales -Datos Detallados -Datos en continuo cambio  DATAWAREHOUSE -Datos de negocio -Orientado al sujeto -Actuales + Histórico -Datos Resumidos -Datos Estables

14 Juan Alvites Almacenes y Minería de Datos14 ARQUITECTURA DATAWAREHOUSE GESTOR CARGA GESTOR ALMACENAMIENTO GESTOR CONSULTAS BD operacional Partimos de una BD operacional y se basa en 3 módulos

15 Juan Alvites 15 GESTOR DE CARGA Permite hacer la carga. Como dificultades nos podemos encontrar: – La integración de los datos – Elección del momento de la carga – El tiempo de carga sea el mínimo posible – Buen diccionario de datos o METADATA (para evitar cometer errores en la carga) – Diseño de procedimientos PL/SQL

16 Juan Alvites 16 GESTOR DE ALMACENAMIENTO Se encarga del almacenamiento, de la estructura,…. Existe una tabla llamada FACT (Hecho) y unas tablas llamadas dimensiones o tablas dimensionales. Entre la tabla FACT y las tablas dimensionales suele haber relaciones 1:N Este modelo tiene forma de estrella por eso se denomina MODELO STAR

17 Juan Alvites 17 MODELO ESTRELLA - STAR FACT DIM_1 DIM_2 DIM_TIEMPO DIM_3 # PK4 # PK1 # PK2 # PK3 # PK1 # PK2 # PK3 # PK4 *campoA *campoB

18 Juan Alvites 18 GESTOR DE CONSULTAS Las consultas se hacen sobre la tabla FACT. También se encarga de los perfiles, pues las consultas (reports) serán diferentes dependiendo del usuario y sus necesidades.

19 Juan Alvites 19 Ejemplo 1: CATEGORIAS_PROF # c_categoria * descripción * salario_min * salario_max USUARIOS # c_usuario * nombre * apellido1 * apellido2 * c_categoria * direccion USU_OFERTAS # c_categoria # c_oferta * salario_deseado OFERTAS # c_oferta * descripción * salario_min * salario_max * fx_alta 1 n 11 nn

20 Juan Alvites 20 Ejemplo 1: CATEGORIAS_PROF # c_categoria * descripción * salario_min * salario_max USUARIOS # c_usuario * nombre * apellido1 * apellido2 * c_categoria * direccion OFERTAS # c_oferta * descripción * salario_min * salario_max * fx_alta TIEMPO # c_tiempo * descripcion USU_OFERTAS # c_usuario # c_categoria # c_oferta * salario_deseado

21 Juan Alvites 21 REPORTS ¿Cuántos usuarios se han apuntado a las ofertas de empleo del mes de enero? SELECT count(*) FROM USUARIOS_OFERTAS U, OFERTAS O WHERE U.c_oferta=o.c_oferta AND O.fx_alta BETWEEN (’01/01/07’,`31/01/07´)

22 Juan Alvites Ejemplos Arquitectura de Datawarehouse 22

23 Juan Alvites


Descargar ppt "Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan."

Presentaciones similares


Anuncios Google