La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Data Warehouse y Sistemas de Soporte a la Decisión

Presentaciones similares


Presentación del tema: "Data Warehouse y Sistemas de Soporte a la Decisión"— Transcripción de la presentación:

1 Data Warehouse y Sistemas de Soporte a la Decisión
Un Enfoque Práctico Hugo M. Castro

2 El Caso RapiServ es una empresa de comidas rápidas con 20 locales que se distribuyen en tres zonas: Capital Provincia de Buenos Aires Interior

3 RapiServ Sus menúes comprenden platos de carne y pollo, papas fritas y una variedad de ensaladas y postres Por supuesto ofrecen bebidas frías (gaseosas y agua mineral) y también bebidas calientes (té, café) y pastelería, principalmente a la mañana.

4 RapiServ Pero su plato distintivo es una especialidad que recibe el nombre de Cordon Bleu, una comida con carne y verduras que tiene bastante aceptación.

5 RapiServ José, el Presidente, dice: Hay que aumentar las ventas

6 RapiServ Mario, Director de Marketing, se pregunta: ¿Qué podemos ofrecer a nuestros clientes?

7 RapiServ Para responder a esa pregunta, Mario necesita saber:
¿Qué productos se venden más? ¿Qué sucursales venden mejor? ¿En qué horas hay más clientes? ¿Qué días de la semana son más flojos?

8 RapiServ ¿Quién puede darle esa información?
Mario sabe que Sistemas procesa los tickets de las sucursales en los procesos de stock de mercadería y contabilidad Por eso se dirige a Carlos, Encargado de Sistemas

9 RapiServ Carlos, el Encargado de Sistemas, recibe el pedido y estima que tendrá lista la información en un plazo de veinte días a un mes

10 RapiServ Mario pregunta: ¿Cómo un mes? ¿Acaso la información no está dentro de su computadora?

11 RapiServ Carlos responde: Sí, los datos están en la computadora, pero no tienen la estructura adecuada para contestar esas preguntas

12 RapiServ Mario queda convencido de que si los datos están guardados en la computadora tan difícil no debe ser obtener las respuestas que busca

13 RapiServ Carlos queda convencido de que Mario siempre pide cosas diferentes y todo lo quiere para ayer

14 RapiServ Este es el momento en que recurren a nosotros para que los ayudemos

15 RapiServ Antes de actuar analicemos la situación
¿Dónde está el problema? Mario tiene razón en que los datos están en la computadora Y Carlos tiene razón en que no es fácil darles la forma que Mario necesita

16 RapiServ Ambos hacen uso de los mismos datos, pero...
Mario necesita analizar la información para saber qué ocurre y tomar decisiones estratégicas Carlos necesita llevar a cabo los procesos que requiere la operatoria diaria de la empresa

17 RapiServ Hay una diferencia fundamental
A Carlos le basta con manejar datos Mario necesita extraer información de esos datos

18 Cadena de Valores Conocimiento Datos
Decisión Hagan propaganda del producto X en la zona Capital Estudien promociones para la franja horaria 1 Ofrezcan el servicio en auto en la zona Buenos Aires Conocimiento En la zona Capital hubo H pedidos del producto X En la franja horaria 1 se vende menos que en la 2 Información La sucursal X está en el distrito Z de la zona W El producto P cuesta $Q La franja horaria 1 comprende las horas de la mañana Datos Sucursales Poductos Franjas Horarias Estacionamiento Servicio en auto

19 El proceso de toma de decisiones
Se encuentran hechos destacados Se explican en términos de negocios Se toman las decisiones correspondientes

20 Una Nueva Estructura Si los datos están en la computadora pero la forma no es la adecuada, la solución es CREAR UNA BASE DE DATOS CON LA FORMA ADECUADA

21 Un Nuevo Tipo de BD La base de datos con la estructura adecuada es lo que se denomina DATA WAREHOUSE Es una base de datos separada de los sistemas transaccionales e independiente de ellos.

22 Data Warehouse Un Data Warehouse es una Base de Datos con una estructura Orientada al negocio Integrada Variable en el tiempo No Volátil

23 Orientada al negocio Organiza y presenta los datos desde la perspectiva de los conceptos que maneja la empresa (fecha, franja horaria, producto, sucursal, ventas). Los datos tienen el nivel de detalle y la estructura que necesitan los que toman decisiones

24 Integrada Se construye a partir de fuentes de datos heterogéneas
Bases de datos relacionales, archivos planos, hojas de cálculo, documentos impresos Se unifican denominaciones, codificaciones, formatos Limpieza Integración

25 Variable en el Tiempo El horizonte temporal del Data Warehouse es más amplio que el de los sistemas transaccionales Vida útil de los datos Datos históricos La fecha es un dato fundamental Marcación temporal

26 No Volátil En el Data Warehouse los datos no se modifican
El Data Warehouse se renueva Los datos permanecen intactos entre renovaciones Sólo existen dos operaciones Carga Acceso

27 Data Warehouse UN DATA WAREHOUSE CONTIENE Información histórica
Para visualizar tendencias y efectuar comparaciones Información consolidada Para acelerar la respuesta a las consultas Las bases de datos más voluminosas son Data Warehouses

28 Procesos Extracción, Transformación y Carga Extracción Transformación
Se eligen qué datos se van a llevar al DWh desde las diversas fuentes Transformación Los datos se depuran, completan y transforman Carga Los datos se ordenan, se consolidan, se calculan los datos derivados, severifica la integridad y se incorporan al DWh Este es un proceso repetitivo

29 Procesos Explotación de datos
Guardar y estructurar los datos en un Data Warehouse es sólo parte de la tarea Necesitamos analizar los datos para la toma de decisiones

30 Explotación de datos Herramienta de redacción de informes orientada al usuario Empezamos por producir los mismos informes que el profesional de negocios estaba recibiendo hasta ahora Pero ahora él puede armarlos en forma interactiva

31 Informes Para obtener los informes no es necesario escribir ningún programa Lo puede definir el propio profesional de negocios La herramienta que produce los informes está preparada para que él la utilice

32 Informes El profesional de negocios decide
Qué criterios de selección va a usar sobre la base de datos Qué datos va a incluir en el informe Cómo se van a ordenar los datos Cómo se van a agrupar los datos

33 Informes Con estas herramientas queda resuelto el problema de la producción de informes, pero Mario y su gente encuentran que LAS RESPUESTAS GENERAN PREGUNTAS

34 Preguntas ¿Cómo se vende en cada sucursal por franja horaria?
¿Qué productos se venden más en las tardes? ¿Venden más las sucursales que tienen servicio en el auto? ¿Y las que tienen estacionamiento?

35 Modelo de datos Modelo de Entidad-Relación Modelo dimensional
Orientado a la implementación de los procesos transaccionales Tareas operativas Modelo dimensional Orientado a las características del negocio (variables del negocio) Tareas de análisis

36 Modelo dimensional Dimensiones Medidas Variables del negocio
Productos, sucursales, fechas Medidas Valores numéricos Sumas, consolidaciones, operaciones aritméticas

37 Modelo dimensional Cantidad de pedidos por fecha, producto y sucursal
Dimensiones: Producto, Sucursal, Fecha Estructura Jerárquica Sucursal Categoría Zona Año Subcategoría Distrito Trimestre Producto Sucursal Mes Día Producto Fecha

38 Cubo Es una forma de presentar los datos al usuario
No existe físicamente El usuario puede trabajar con los datos como si existiera Es independiente de la forma en que realmente se almacenan los datos

39 OLAP Sistemas transaccionales: OLTP T identifica transacciones
Sistema de Análisis: OLAP A identifica análisis

40 OLAP Es el proceso de almacenar y administrar datos sobre la base de las variables del negocio (dimensiones), para permitir a los profesionales de negocios visualizarlos y analizarlos para entender cuál es su significado

41 Preguntas ¿Cómo se vende en cada sucursal por franja horaria?
¿ Qué productos se venden más en las tardes? ¿Venden más las sucursales que tienen servicio en el auto? ¿Y las que tienen estacionamiento?

42 Navegación Cambio de dimensiones Cambio de ejes
Cambio de forma de presentación Cambio de medidas Cambio de nivel de detalle Drill down Drill up Conexión con otras tablas de hechos Drill across Conexión con tablas externas Drill through/Drill Out

43 Operaciones OLAP Drill down (roll down): Mayor nivel de detalle
De datos sumados a datos desagregados Drill up (roll up): Menor nivel de detalle Mayor consolidación de datos Slice and dice Cambio en la orientación y en la forma de visualización del cubo Drill across: Conexión con otras tablas de hechos Drill through/Drill Out: Conexión con tablas externas

44 Análisis OLAP Unidades DIMENSIONES MEDIDAS FECHA VENTAS FECHA ARTICULO
Se elige la dimensión para las filas Se elige la dimensión para las columnas DIMENSIONES MEDIDAS Se elige la medida a representar FECHA VENTAS FECHA ARTICULO UNIDADES Unidades SUCURSAL ARTICULO TICKETS

45 Unidades vendidas por tipo de artículo durante 2004

46 “Drill down”: Mayor detalle sobre Comestibles

47 Unidades de comestibles vendidas por ciudad

48 “Drill down”: unidades de comestibles vendidas en sucursales de Capital

49 Tablero de Comando Enfoque tradicional Indicadores financieros
Ventas Ganancias Cobranza Stock valorizado El resto carece de importancia

50 Tablero de Comando Enfoque tradicional
No tiene en cuenta aspectos tales como Relación con los clientes Análisis de los procesos internos Capacitación y crecimiento del personal Descubrir esta falta demasiado tarde puede traer graves consecuencias

51 Tablero de Comando Tablero de Comando Integral (BSC)
Distintas perspectivas Fijación de objetivos Máximo (ej. gastos) Mínimo (ej. ventas) Establecimiento de metas y tolerancias

52 Tablero de Comando Colores Mínimo Máximo Tolerancia Meta Meta

53 Tablero de Comando Perspectivas (Cobranza, Ventas)

54 Tablero de Comando Indicadores

55 Componentes Informes Consultas OLAP Data mining Sirve para Data
BD Transaccionales Otras Fuentes de Datos Mecanismo de Integración Servidor OLAP Metadatos Extracción Transformación Carga Renovación Informes Consultas OLAP Data mining Sirve para Data Warehouse Data Marts Fuentes de Datos Motor OLAP Explotación Almacenamiento

56 Metadatos Son datos que describen objetos del data warehouse
Estructura del Data Warehouse Esquema, visiones, dimensiones, datos derivados, ubicación y contenido de los data mart Datos sobre los datos Origen de los datos Validez de los datos (activo, histórico, eliminado) Información de control (estadísticas de uso, errores, información de auditoría) Algoritmos que se usan para la consolidación Correspondencia entre datos operativos y los del data warehouse Datos de Negocios Definiciones de términos del negocio, dueños de los datos

57 Tres Alternativas Data warehouse Data Mart Data warehouse virtual
Recoge información de toda la empresa Data Mart Sirve a un grupo específico de usuarios. Su alcance se reduce a un área en particular (p.ej. Marketing) Independiente: Se genera a través de un proceso de ETL Dependiente : Se toma del Data Warehouse Data warehouse virtual Se forma a partir de distintos Data Marts

58 ¿Y ahora? Mario sabe que con OLAP puede contestar todas las preguntas que puede formular, pero... ¿y las que no puede formular?

59 Preguntas ¿A qué clientes me conviene ofrecer este nuevo producto?
¿Cuántos pedidos de pollo vamos a recibir durante las vacaciones de invierno? ¿La compra de Cordon Bleu influye en la compra de papas fritas?

60 Preguntas La respuesta a esas preguntas van a salir de un proceso llamado DATA MINING

61 Data Mining Es un proceso automático que permite extraer esquemas interesantes y no triviales de los datos y descubrir relaciones entre variables Estamos ahogados en datos, pero sedientos de información

62 El Proceso de Data Mining
Selección y Preprocesamiento Data Mining Interpretación y Evaluación Consolidación de Datos Conocimiento p(x)=0.02 Warehouse Datos Originales Esquemas y Modelos Preparados Consolidados

63 Ejemplo Veamos cómo un modelo de Data Mining ayuda a Mario a contestar una de las preguntas que se formulaba ¿La compra de Cordon Bleu influye en la compra de papas fritas?

64 Ejemplo Del análisis del contenido de los tickets surge que
De un total de tickets Hay que contienen Cordon Bleu Hay que contienen papas fritas De esos tickets hay que contienen ambos productos

65 Ejemplo Hay dos aspectos que Mario debe tener en cuenta:
Cuál es la importancia que tiene esa relación para la empresa Cuál es la fuerza que tiene la relación

66 Ejemplo En este caso: ¿Qué proporción de todos los tickets tienen Cordon Bleu y papas fritas? 30.000/ o sea el 6% de los tickets

67 Ejemplo Pregunta: ¿Qué proporción de clientes en general compra papas fritas? 40.000/ o sea el 8%

68 Ejemplo ¿Qué proporción de los compradores de Cordon Bleu compran además papas fritas? 30.000/60.000 o sea que el 50% de los compradores de Cordon Bleu piden papas fritas

69 Ejemplo La conclusión es que el empuje de Cordon Bleu sobre las papas fritas es de 50/8 o sea 6,25 Esto quiere decir que la gente que compra Cordon Bleu compra 6,25 veces más papas fritas que el promedio de los clientes

70 Uso del Data Warehouse Tres clases de aplicaciones del Data Warehouse
Procesamiento de Información Consultas, análisis estadísticos sencillos, informes Tablas, diagramas, gráficos Procesamiento Analítico Análisis multidimensional de datos Operaciones OLAP: slice-dice, drilling, rotaciones Data mining Descubrimiento de esquemas ocultos Modelos analíticos: predicción, asociación, segmentación

71 Inteligencia de Negocios
Alta Gerencia Decisiones de Marketing Potencial de Soporte a la Decisión José Presentación Profesional de Negocios Visualización Mario Data Mining Analista de Datos Descubrimiento de Información Exploración de datos OLAP – Análisis Multidimensional Data Warehouses / Data Marts Administrador de Datos Análisis Estadístico-Consultas-Informes Fuentes de Datos Carlos Papel, Archivos Planos,Planillas de Cálculo, BD, OLTP

72 RapiServ José, el Presidente, obtiene la información que necesita en tiempo y forma

73 RapiServ Mario, Director de Marketing, tiene a su gente analizando la información y no imaginando qué informes deberían pedir

74 RapiServ A Carlos, el Encargado de Sistemas, también le mejoró la vida: ya no le llegan pedidos de marketing con plazos imposibles de cumplir

75 En Resumen La información adecuada En el plazo adecuado
Para la persona adecuada MEJORES DECISIONES

76 LA INTUICIÓN INFORMADA ES INSUPERABLE
En Resumen LA INTUICIÓN INFORMADA ES INSUPERABLE


Descargar ppt "Data Warehouse y Sistemas de Soporte a la Decisión"

Presentaciones similares


Anuncios Google