La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Data Warehouse y Sistemas de Soporte a la Decisión Un Enfoque Práctico Hugo M. Castro.

Presentaciones similares


Presentación del tema: "Data Warehouse y Sistemas de Soporte a la Decisión Un Enfoque Práctico Hugo M. Castro."— Transcripción de la presentación:

1 Data Warehouse y Sistemas de Soporte a la Decisión Un Enfoque Práctico Hugo M. Castro

2 El Caso RapiServ es una empresa de comidas rápidas con 20 locales que se distribuyen en tres zonas: Capital Provincia de Buenos Aires Interior

3 RapiServ Sus menúes comprenden platos de carne y pollo, papas fritas y una variedad de ensaladas y postres Por supuesto ofrecen bebidas frías (gaseosas y agua mineral) y también bebidas calientes (té, café) y pastelería, principalmente a la mañana.

4 RapiServ Pero su plato distintivo es una especialidad que recibe el nombre de Cordon Bleu, una comida con carne y verduras que tiene bastante aceptación.

5 RapiServ José, el Presidente, dice: Hay que aumentar las ventas

6 RapiServ Mario, Director de Marketing, se pregunta: ¿Qué podemos ofrecer a nuestros clientes?

7 RapiServ Para responder a esa pregunta, Mario necesita saber: ¿Qué productos se venden más? ¿Qué sucursales venden mejor? ¿En qué horas hay más clientes? ¿Qué días de la semana son más flojos?

8 RapiServ ¿Quién puede darle esa información? Mario sabe que Sistemas procesa los tickets de las sucursales en los procesos de stock de mercadería y contabilidad Por eso se dirige a Carlos, Encargado de Sistemas

9 RapiServ Carlos, el Encargado de Sistemas, recibe el pedido y estima que tendrá lista la información en un plazo de veinte días a un mes

10 RapiServ Mario pregunta: ¿Cómo un mes? ¿Acaso la información no está dentro de su computadora?

11 RapiServ Carlos responde: Sí, los datos están en la computadora, pero no tienen la estructura adecuada para contestar esas preguntas

12 RapiServ Mario queda convencido de que si los datos están guardados en la computadora tan difícil no debe ser obtener las respuestas que busca

13 RapiServ Carlos queda convencido de que Mario siempre pide cosas diferentes y todo lo quiere para ayer

14 RapiServ Este es el momento en que recurren a nosotros para que los ayudemos

15 RapiServ Antes de actuar analicemos la situación ¿Dónde está el problema? Mario tiene razón en que los datos están en la computadora Y Carlos tiene razón en que no es fácil darles la forma que Mario necesita

16 RapiServ Ambos hacen uso de los mismos datos, pero... Mario necesita analizar la información para saber qué ocurre y tomar decisiones estratégicas Carlos necesita llevar a cabo los procesos que requiere la operatoria diaria de la empresa

17 RapiServ Hay una diferencia fundamental A Carlos le basta con manejar datos Mario necesita extraer información de esos datos

18 Cadena de Valores Datos Sucursales Poductos Franjas Horarias Estacionamiento Servicio en auto Información La sucursal X está en el distrito Z de la zona W El producto P cuesta $Q La franja horaria 1 comprende las horas de la mañana Conocimiento En la zona Capital hubo H pedidos del producto X En la franja horaria 1 se vende menos que en la 2 Decisión Hagan propaganda del producto X en la zona Capital Estudien promociones para la franja horaria 1 Ofrezcan el servicio en auto en la zona Buenos Aires

19 El proceso de toma de decisiones Se encuentran hechos destacados Se explican en términos de negocios Se toman las decisiones correspondientes

20 Una Nueva Estructura Si los datos están en la computadora pero la forma no es la adecuada, la solución es CREAR UNA BASE DE DATOS CON LA FORMA ADECUADA

21 Un Nuevo Tipo de BD La base de datos con la estructura adecuada es lo que se denomina DATA WAREHOUSE Es una base de datos separada de los sistemas transaccionales e independiente de ellos.

22 Data Warehouse Un Data Warehouse es una Base de Datos con una estructura Orientada al negocio Integrada Variable en el tiempo No Volátil

23 Orientada al negocio Organiza y presenta los datos desde la perspectiva de los conceptos que maneja la empresa (fecha, franja horaria, producto, sucursal, ventas). Los datos tienen el nivel de detalle y la estructura que necesitan los que toman decisiones

24 Integrada Se construye a partir de fuentes de datos heterogéneas Bases de datos relacionales, archivos planos, hojas de cálculo, documentos impresos Se unifican denominaciones, codificaciones, formatos Limpieza Integración

25 Variable en el Tiempo El horizonte temporal del Data Warehouse es más amplio que el de los sistemas transaccionales Vida útil de los datos Datos históricos La fecha es un dato fundamental Marcación temporal

26 No Volátil En el Data Warehouse los datos no se modifican El Data Warehouse se renueva Los datos permanecen intactos entre renovaciones Sólo existen dos operaciones Carga Acceso

27 Data Warehouse UN DATA WAREHOUSE CONTIENE Información histórica Para visualizar tendencias y efectuar comparaciones Información consolidada Para acelerar la respuesta a las consultas Las bases de datos más voluminosas son Data Warehouses

28 Procesos Extracción, Transformación y Carga Extracción Se eligen qué datos se van a llevar al DWh desde las diversas fuentes Transformación Los datos se depuran, completan y transforman Carga Los datos se ordenan, se consolidan, se calculan los datos derivados, severifica la integridad y se incorporan al DWh Este es un proceso repetitivo

29 Procesos Explotación de datos Guardar y estructurar los datos en un Data Warehouse es sólo parte de la tarea Necesitamos analizar los datos para la toma de decisiones

30 Explotación de datos Herramienta de redacción de informes orientada al usuario Empezamos por producir los mismos informes que el profesional de negocios estaba recibiendo hasta ahora Pero ahora él puede armarlos en forma interactiva

31 Informes Para obtener los informes no es necesario escribir ningún programa Lo puede definir el propio profesional de negocios La herramienta que produce los informes está preparada para que él la utilice

32 Informes El profesional de negocios decide Qué criterios de selección va a usar sobre la base de datos Qué datos va a incluir en el informe Cómo se van a ordenar los datos Cómo se van a agrupar los datos

33 Informes Con estas herramientas queda resuelto el problema de la producción de informes, pero Mario y su gente encuentran que LAS RESPUESTAS GENERAN PREGUNTAS

34 Preguntas ¿Cómo se vende en cada sucursal por franja horaria? ¿Qué productos se venden más en las tardes? ¿Venden más las sucursales que tienen servicio en el auto? ¿Y las que tienen estacionamiento?

35 Modelo de datos Modelo de Entidad-Relación Orientado a la implementación de los procesos transaccionales Tareas operativas Modelo dimensional Orientado a las características del negocio (variables del negocio) Tareas de análisis

36 Modelo dimensional Dimensiones Variables del negocio Productos, sucursales, fechas Medidas Valores numéricos Sumas, consolidaciones, operaciones aritméticas

37 Modelo dimensional Cantidad de pedidos por fecha, producto y sucursal Producto Sucursal Fecha Dimensiones: Producto, Sucursal, Fecha Estructura Jerárquica Categoría Zona Año Subcategoría Distrito Trimestre Producto Sucursal Mes Día

38 Cubo Es una forma de presentar los datos al usuario No existe físicamente El usuario puede trabajar con los datos como si existiera Es independiente de la forma en que realmente se almacenan los datos

39 OLAP Sistemas transaccionales: OLTP T identifica transacciones Sistema de Análisis: OLAP A identifica análisis

40 OLAP Es el proceso de almacenar y administrar datos sobre la base de las variables del negocio (dimensiones), para permitir a los profesionales de negocios visualizarlos y analizarlos para entender cuál es su significado

41 Preguntas ¿Cómo se vende en cada sucursal por franja horaria? ¿ Qué productos se venden más en las tardes? ¿Venden más las sucursales que tienen servicio en el auto? ¿Y las que tienen estacionamiento?

42 Navegación Cambio de dimensiones Cambio de ejes Cambio de forma de presentación Cambio de medidas Cambio de nivel de detalle Drill down Drill up Conexión con otras tablas de hechos Drill across Conexión con tablas externas Drill through/Drill Out

43 Operaciones OLAP Drill down (roll down): Mayor nivel de detalle De datos sumados a datos desagregados Drill up (roll up): Menor nivel de detalle Mayor consolidación de datos Slice and dice Cambio en la orientación y en la forma de visualización del cubo Drill across: Conexión con otras tablas de hechos Drill through/Drill Out: Conexión con tablas externas

44 Análisis OLAP FECHA ARTICULO SUCURSAL VENTAS UNIDADES TICKETS DIMENSIONESMEDIDAS ARTICULO FECHA Se elige la dimensión para las filas Se elige la dimensión para las columnas Se elige la medida a representar

45 Unidades vendidas por tipo de artículo durante 2004

46 Drill down: Mayor detalle sobre Comestibles

47 Unidades de comestibles vendidas por ciudad

48 Drill down: unidades de comestibles vendidas en sucursales de Capital

49 Tablero de Comando Enfoque tradicional Indicadores financieros Ventas Ganancias Cobranza Stock valorizado El resto carece de importancia

50 Tablero de Comando Enfoque tradicional No tiene en cuenta aspectos tales como Relación con los clientes Análisis de los procesos internos Capacitación y crecimiento del personal Descubrir esta falta demasiado tarde puede traer graves consecuencias

51 Tablero de Comando Integral (BSC) Distintas perspectivas Fijación de objetivos Máximo (ej. gastos) Mínimo (ej. ventas) Establecimiento de metas y tolerancias Tablero de Comando

52 Colores Mínimo MetaTolerancia Máximo MetaTolerancia

53 Tablero de Comando Perspectivas (Cobranza, Ventas)

54 Tablero de Comando Indicadores

55 Componentes Data Warehouse Extracción Transformación Carga Renovación Motor OLAP Informes Consultas OLAP Data mining Mecanismo de Integración Metadatos Fuentes de Datos Explotación Sirve para Data Marts BD Transaccionales Otras Fuentes de Datos Almacenamiento Servidor OLAP

56 Metadatos Son datos que describen objetos del data warehouse Estructura del Data Warehouse Esquema, visiones, dimensiones, datos derivados, ubicación y contenido de los data mart Datos sobre los datos Origen de los datos Validez de los datos (activo, histórico, eliminado) Información de control (estadísticas de uso, errores, información de auditoría) Algoritmos que se usan para la consolidación Correspondencia entre datos operativos y los del data warehouse Datos de Negocios Definiciones de términos del negocio, dueños de los datos

57 Tres Alternativas Data warehouse Recoge información de toda la empresa Data Mart Sirve a un grupo específico de usuarios. Su alcance se reduce a un área en particular (p.ej. Marketing) Independiente: Se genera a través de un proceso de ETL Dependiente : Se toma del Data Warehouse Data warehouse virtual Se forma a partir de distintos Data Marts

58 ¿Y ahora? Mario sabe que con OLAP puede contestar todas las preguntas que puede formular, pero... ¿y las que no puede formular?

59 Preguntas ¿A qué clientes me conviene ofrecer este nuevo producto? ¿Cuántos pedidos de pollo vamos a recibir durante las vacaciones de invierno? ¿La compra de Cordon Bleu influye en la compra de papas fritas?

60 Preguntas La respuesta a esas preguntas van a salir de un proceso llamado DATA MINING

61 Data Mining Es un proceso automático que permite extraer esquemas interesantes y no triviales de los datos y descubrir relaciones entre variables Estamos ahogados en datos, pero sedientos de información

62 Selección y Preprocesamiento Data Mining Interpretación y Evaluación Consolidación de Datos Conocimiento p(x)=0.02 Warehouse Datos Originales Esquemas y Modelos Datos Preparados Datos Consolidados El Proceso de Data Mining

63 Ejemplo Veamos cómo un modelo de Data Mining ayuda a Mario a contestar una de las preguntas que se formulaba ¿La compra de Cordon Bleu influye en la compra de papas fritas?

64 Ejemplo Del análisis del contenido de los tickets surge que De un total de tickets Hay que contienen Cordon Bleu Hay que contienen papas fritas De esos tickets hay que contienen ambos productos

65 Ejemplo Hay dos aspectos que Mario debe tener en cuenta: Cuál es la importancia que tiene esa relación para la empresa Cuál es la fuerza que tiene la relación

66 Ejemplo En este caso: ¿Qué proporción de todos los tickets tienen Cordon Bleu y papas fritas? / o sea el 6% de los tickets

67 Ejemplo Pregunta: ¿Qué proporción de clientes en general compra papas fritas? / o sea el 8%

68 Ejemplo ¿Qué proporción de los compradores de Cordon Bleu compran además papas fritas? / o sea que el 50% de los compradores de Cordon Bleu piden papas fritas

69 Ejemplo La conclusión es que el empuje de Cordon Bleu sobre las papas fritas es de 50/8 o sea 6,25 Esto quiere decir que la gente que compra Cordon Bleu compra 6,25 veces más papas fritas que el promedio de los clientes

70 Uso del Data Warehouse Tres clases de aplicaciones del Data Warehouse Procesamiento de Información Consultas, análisis estadísticos sencillos, informes Tablas, diagramas, gráficos Procesamiento Analítico Análisis multidimensional de datos Operaciones OLAP: slice-dice, drilling, rotaciones Data mining Descubrimiento de esquemas ocultos Modelos analíticos: predicción, asociación, segmentación

71 Potencial de Soporte a la Decisión Alta Gerencia Profesional de Negocios Analista de Datos Administrador de Datos Decisiones de Marketing Presentación Visualización Data Mining Descubrimiento de Información Exploración de datos Análisis Estadístico-Consultas-Informes OLAP – Análisis Multidimensional Data Warehouses / Data Marts Fuentes de Datos Papel, Archivos Planos,Planillas de Cálculo, BD, OLTP Inteligencia de Negocios José Mario Carlos

72 RapiServ José, el Presidente, obtiene la información que necesita en tiempo y forma

73 RapiServ Mario, Director de Marketing, tiene a su gente analizando la información y no imaginando qué informes deberían pedir

74 RapiServ A Carlos, el Encargado de Sistemas, también le mejoró la vida: ya no le llegan pedidos de marketing con plazos imposibles de cumplir

75 En Resumen La información adecuada En el plazo adecuado Para la persona adecuada MEJORES DECISIONES

76 En Resumen LA INTUICIÓN INFORMADA ES INSUPERABLE


Descargar ppt "Data Warehouse y Sistemas de Soporte a la Decisión Un Enfoque Práctico Hugo M. Castro."

Presentaciones similares


Anuncios Google