La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Introducción a Pentaho Analysis

Presentaciones similares


Presentación del tema: "Introducción a Pentaho Analysis"— Transcripción de la presentación:

1 Introducción a Pentaho Analysis
Lic. Ana Smail Año 2010

2 Introducción a Pentaho Analysis
“La comunidad de código abierto se nutre de la participación y la cooperación. Hay varios canales de comunicación disponibles donde las personas pueden ayudar, pero no están obligados a hacerlo. Usted es responsable de su propio éxito, lo que requerirá tiempo, esfuerzo y una pequeña cantidad de capacidad técnica. Si prefiere tener una relación con un proveedor conocido que responderá a preguntas por teléfono, le ayudará durante su evaluación y lo apoyará en la producción, por favor visite (Pentaho Coporation) Año 2010

3 Introducción a Pentaho Analysis
Bibliografía HowTo Pentaho 3.5 & Cubo Mondrian en GNU/Linux – por Alvarez Sebastián Matias – 2009 Pasos para crear Cubos con Mondrian Schema WorkBench – por Ing. Dennos Alba Infante para la comunidad Open Business Intelligence Mondrian Technical Guide - Developing OLAP solutions with Mondrian – 2009 Mondrian Schema Workbench Pentaho Solutions - Business Intelligence and Data -Warehousing with Pentaho and MySQL – de Roland Bouman Jos van Dongen Año 2010

4 Introducción a Pentaho Analysis
Bibliografía web 1 - Herramientas Libres para OLAP: Mondrian y JPivot Java Año 2010

5 Introducción a Pentaho Analysis
Qué veremos en este módulo ? Introducción a pentaho Analysis Mondrian WorkBench Jpivot – Análisis Ad-hoc Desarrollo de un cubo OLAP Año 2010

6 Introducción a Pentaho Analysis
Pentaho Analysis Service PAS consiste de los siguientes 4 componentes: JPIVOT analisys en el front end: interface de usuario basada en Java. Mondrian ROLAP Engine: motor OLAP, recibe queries MDX desde una herramienta en el front-end como JPIVOT, y responde enviando un result-set multidimensional. Shema Workbench: es una interface visual para diseñar y testear schemas de Mondrian. Mondrian usa Schemas para interpretar MDX y trasladar a queries SQL que pueda ser interpretado por un RDBMS. Agregate Designer: una herramienta visual para analizar la performance y generar tablas agregadas. Año 2010

7 Introducción a Pentaho Analysis
Componentes OLAP en Pentaho (extraído de Pentaho Solutions - Business Intelligence and Data -Warehousing with Pentaho and MySQL) Año 2010

8 Introducción a Pentaho Analysis
Qué es OLAP ? El procesamiento analítico en línea OLAP (On Line Analytic Processing), es la componente más poderosa del Data Warehousing, ya que es el motor de consultas especializado del depósito de datos. Permite recolectar y organizar la información analítica necesaria para los usuarios y disponer de ella en diversos formatos, tales como tablas, gráficos, reportes, tableros de control, etc. Soporta análisis complejos de grandes volúmenes de datos. Complementa las actividades de otras herramientas que requieran procesamiento analítico en línea. Presenta al usuario una visión multidimensional de los datos (matricial) para cada tema de interés del negocio. Es transparente al tipo de tecnología que soporta el DW, ya sea ROLAP, MOLAP u HOLAP. No tiene limitaciones con respecto al número máximo de dimensiones permitidas. Permite a los usuarios, analizar la información basándose en más criterios que un análisis de forma tradicional. Al contar con muestras grandes, se pueden explorar mejor los datos en busca de respuestas. Permiten realizar agregaciones y combinaciones de los datos de maneras complejas y específicas, con el fin de realizar análisis más estratégicos. (extraído de HEFESTO del Ing. Bernabeu Ricardo Dario) Año 2010

9 Introducción a Pentaho Analysis
Qué es OLAP ? Reporte de análisis OLAP en JPIVOT (extraído de HEFESTO del Ing. Bernabeu Ricardo Dario) Año 2010

10 Introducción a Pentaho Analysis
Qué es OLAP ? Bases de Datos OLAP Conceptualmente, una base de datos multidimensional utiliza la idea de "cubos". Un cubo posee N dimensiones y en él están registrados "hechos" de un determinado tipo. Los hechos podrían ser, por ejemplo, desde las ventas realizadas por una empresa (según estudios la utilización de OLAP para el análisis de ventas es la aplicación más popular) hasta los defectos que reportan los usuarios de un sistema informático, según cuál fuese la finalidad de la aplicación. Un ejemplo de consulta MDX es el siguiente: SELECT { [Measures].[Importe] } ON COLUMNS, { [Tiempo].[2002], [Tiempo].[2003] } ON ROWSFROM VentasWHERE ( [Sucursal].[Zona Oeste].[Tablada] ) (extraído de “Herramientas libres para OLAP” de Héctor Francisco Hernández) Año 2010

11 Introducción a Pentaho Analysis
Mondrian Mondrian está compuesto por un conjunto de archivos "jar", que proveen una API inspirada en JDBC pero diseñada para trabajar con una base multidimensional. El sistema necesita que escribamos en un archivo "xml" cómo se corresponden los elementos de esta base con la base relacional. Las estructuras comunmente usadas son tres: Una única tabla para el cubo donde existe un registro por cada hecho (por ejemplo, un registro por cada venta). El registro tendrá un código único, un campo o más por cada dimensión y un campo por cada valor del hecho (un campo con el importe de la venta, otro con la cantidad de artículos vendidos, etc.). (La última versión de Mondrian y su documentación se encuentra en Año 2010

12 Introducción a Pentaho Analysis
Mondrian Una estructura de estrella (La última versión de Mondrian y su documentación se encuentra en Año 2010

13 Introducción a Pentaho Analysis
Mondrian Una estructura de copo de nieve (La última versión de Mondrian y su documentación se encuentra en Año 2010

14 Introducción a Pentaho Analysis
Mondrial Ejemplo de mapeo Supongamos un cubo llamado "Ventas" que posee todas las ventas de una pequeña cadena de mercados. Este cubo tendrá tres dimensiones: "Rubro", "Sucursal" y "Tiempo", y también un valor, el "Importe" de la venta. Previamente crearíamos una base de datos en algún servidor que tenga conectividad con JDBC, por ejemplo MySQL. Nuestra arquitectura será la típica estrella, con la tabla de hechos "venta" y una tabla adicional por cada dimensión. Año 2010

15 Introducción a Pentaho Analysis
Mondrial Ejemplo de mapeo Para mapear el cubo con la tabla, creamos un archivo llamado "olapmercado.xml" con el siguiente contenido: Año 2010

16 Introducción a Pentaho Analysis
Mondrial Cómo funciona ? Mondrian es un motor ROLAP con caché. ROLAP significa que en mondrian no residen datos (salvo en la caché) sino que estos residen en una Sistema de Gestion de Bases de Datos externo. Es en esta base de datos en la que residen las tablas que conforman la información multidimensional con la que mondrian trabaja (los modelos en estrella de nuestros data marts por ejemplo). MOLAP es el nombre que reciben los motores olap en los que los datos residen en una estructura dimensonal. (extraído de HEFESTO) (extraído de “Análisis del estod de Mondrian” de Javier Giménez para Stratebi) Año 2010

17 Introducción a Pentaho Analysis
Mondrial Flujo de ejecución Año 2010

18 Introducción a Pentaho Analysis
Mondrial Tablas agregadas En el caso de que tengamos tablas agregadas en nuestro modelo en estrella (versión de las tablas de hechos reducidas con el fin de acelerar las queries), Mondrian es capaz de aprovecharlas. Ejemplo: Disponemos de dos tablas de hechos, una básica con un millon de registros e información a nivel de día y una versión agregada con información a nivel de mes y registros (HECHOS y HECHOS_AGG). Si el usuario lanza una consulta MDX que solicita la información de este cubo Mondrian hará lo siguiente: Verá si tiene la información en la caché (opción más rápida) Ver si para el nivel jerárquico para el que piden los datos puede obtenerlos con una SQL contra la tabla HECHOS_AGG, si puede lo hace. (ej. La consulta pedía agregados para los 4 primeros meses). Si la sentencia MDX pedía información a nivel de día, Mondrian obtendrá lo que pueda de la caché, lo que pueda de la tabla agregada y para los niveles de detalle irá a la tabla de HECHOS principal. Año 2010

19 Introducción a Pentaho Analysis
Mondrial Tablas agregadas Para informar a Mondrian de que tablas agregadas hay disponible hay dos opciones: Definirlas explicítamente (todas las que haya) en los metadatos (Esquema de Mondrian con las definiciones de cubos). Utilizar una nomenclatura para los nombres de las tablas de forma que Mondrian (con una reglas gramaticales que tiene definidas y que son customizables) pueda saber automáticamente que tabla agregada puede utilizar en cada caso. Año 2010

20 Introducción a Pentaho Analysis
Mondrial Caché El objeto de esta memoria intermedia es almacenar información del cubo de forma que se pueda responder a queries (o partes de las queries) más rápidamente no siendo necesario lanzar consultas SQL contra la base de datos. Mondrian, permite desactivar la caché (para entornos en los que el rendimiento no sea crítico pero si lo sea disponer siempre del dato residente en la base de datos) y además (a partir de la versión 2.3) gestionarla de un modo sofisticado. Año 2010

21 Introducción a Pentaho Analysis
Cómo diseñar un cubo en Mondrian ? Archivos de Schema Modelo Lógico Dimensiones, Jerarquías y Niveles Año 2010

22 Introducción a Pentaho Analysis
JPivot JPivot se puede descargar de la página del proyecto en SourceForge, La distribución binaria incluye el archivo ".war" listo para ser colocado en algún servidor JEE y funcionar. (extraído de “ ” de Héctor Francisco Hernández) Año 2010

23 Introducción a Pentaho Analysis
JPivot Las operaciones que se pueden realizar sobre modelos multidimensionales y que son las que verdaderamente les permitirán a los usuarios explorar e investigar los datos en busca de respuestas, son: (extraído de “ ” de Héctor Francisco Hernández) Año 2010

24 Introducción a Pentaho Analysis
JPivot (extraído de “ ” de Héctor Francisco Hernández) Año 2010

25 Lic. Ana Smail (anasmail@unnoba.edu.ar)
Preguntas Lic. Ana Smail Año 2010


Descargar ppt "Introducción a Pentaho Analysis"

Presentaciones similares


Anuncios Google