Introducción a Pentaho Analysis

Slides:



Advertisements
Presentaciones similares
Procesamiento y Análisis en Línea OLAP
Advertisements

Cubos de Información Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se.
YUKON EN EL HORIZONTE Valeria Rodríguez Z. MVP SQL Server Business Manager Paradigma Software S.R.L.
Red Social: “Un millón de Amigos”.
B2B Definición. Marketplaces. Modelo de operación.
Cognos Data Integration
ORACLE OLAP Integrantes: *Aizaga, Martiniano *Gallegos, Marina
Guillermo A. Díaz Sanhueza
Gloria Guirado Departamento de Formación La comunidad de Visual Chart V.
Tecnologías Cliente / Servidor Capitulo III Richard Jiménez V. clienteserver.wordpress.com.
Business Intelligence (BI) Software (Software de Inteligencia Impresario)
Especialista en Business Intelligence Reporting Services SSRS (Sesión 16) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
• SQL Server Analysis Services
• SQL Server Analysis Services
DESARROLLO DE CUBOS OLAP
Presentado por: Lenin Isaías Escobar Mendoza
Director: Ing. Washington Pérez Codirector: Ing. Andrés de la Torre
Presentado por: Katya Aranda Lesley Vallejos Alfredo Yong
Framework Hexápodo PHP fácil, rápido y sin dolor
Informe caso de estudio Implementación de un Datawarehouse
Jesús Angel Ovando División de Estudios de Posgrado Instituto Tecnológico de Orizaba.
On Line Analytical Processing
DIAGRAMA DE COMPONENTES INTEGRANTES Córdova Vásquez Giovanny Escobar Alvares Calixto Gomez Quinteros Adelaida Pinto Flores Yarmila.
PENTAHO BI (Open Source) Introducción
INFOPATH 2010 DANIELA CHEDRAUI.
Microsoft InfoPath. Creación y publicación de formularios empresariales Dese su aparición en Office 2003, Microsoft InfoPath se ha convertido en una de.
Ingeniero Fredys Simanca
INTELIGENCIA DE NEGOCIOS
Gestión de Contenido Electrónico CONCEPTOS DE INFOPATH De Andrés Concha Bucaram.
Presentación de la Herramienta Repositorio de Información del Observatorio Mtra. Graciela Eugenia Espinosa De la Rosa 09 de Julio.
SQL. PRESENTADO POR: JHENYFER PUENTES ADRIANA LOTE MARCO YEPEZ ROQUE ECHEVARRIA CARLOS ROBLES JAVIER TRUJILLO.
Bases de Datos II OLAP Online Analytical Processing
DATA MART Los data warehouses están hechos para proporcionar una fuente de datos única para todas las actividades de apoyo para la toma de decisiones.
Implementación de Datawarehouse
InfoPath Ventajas y Uso.
DATA WAREHOUSE Equipo 9.
BASE DE DATOS BY: Julián Villar Vázquez.
Ingeniería en Sistemas de Información Diseño de Sistemas (3K1)
Eguana Reports Servidor de Reportes basado en Tecnología Java y XML Presentado por: Roy Cox S. Fernando Pérez M. José Pérez S.
Utilización de memoria del O3 Server Caché de cubos.
Introducción a Pentaho BI Suite 3.5
Business Intelligence
Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010.
Taller de Base de Datos Procesamiento Analítico en Línea ¿Qué es OLAP? Imaginemos el siguiente escenario: Una cadena de supermercados posee una (o varias)
1 Prof:Paula Quitral INTRODUCCIÓN DATAWAREHOUSE Departamento de Informática Universidad de Rancagua.
Introducción al Lenguaje. ¿ Qué es PHP ? O Hypertext Pre-processoes (PHP) es un lenguaje de "código abierto" interpretado, de alto nivel, embebido en.
Manual Desarrollo Flex – J2EE. Contenidos Análisis y Diseño 1 Implementación 2 J2EE 3 Pruebas 4.
1ra Sesión Práctica – Informática II Semana No. 3 Período 2010 – II 1ra Sesión Práctica – Informática II Semana No. 3 Período 2010 – II Utilizar la hoja.
 La capacidad para tomar decisiones de negocio precisas y de forma rápida se ha convertido en una de las claves para que una empresa llegue al éxito.
FACULTAD: CIENCIAS ECONÓMICAS Y EMPRESARIALES ASIGNATURA: GESTIÓN DE CONTENIDO ELECTRÓNICO TÍTULO: TINFOPATH - VENTAJAS Y USO. AUTORA: MARIA DANIELA TOMALÁ.
Tema 11 Bases de Datos y el Lenguaje SQL
Tecnologías Cliente / Servidor Capitulo II Richard Jiménez V. clienteserver.wordpress.com.
SQL Server Analysis Services SSAS
INTERFAZ DE ACCESS  Access es un sistema gestor de bases de datos relacionales (SGBD). Una base de datos suele definirse como un conjunto de información.
Especialista en Business Intelligence Analysis Services SSAS (Sesión 8) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
Aplicaciones en 2,3 y n capas
Taller de Inteligencia de Negocios SQL Server Analysis Services Semana 8.
SOLUCIONES EMPRESARIALES
BUSINESS T&G Think & Grow Uniclass Business Intelligence La solución Business Objects que analiza los procesos de su negocio.
Por: Jorge Aguirre.  Microsoft InfoPath es una aplicación usada para desarrollar formularios de entrada de datos basados en XML.  Su primera publicación,
Business Intelligence 2013 (Conceptos Generales) Microsoft SQL Server 2008 R2 Suscribase a o escríbanos a
María Trinidad Serna Encinas
Sistematización de Conceptos
Integrantes Miguel Betancourt Alexis Tacuri.  Activiti es una plataforma para la formación de flujos de trabajo y procesos empresariales dentro del.
Servicios Web Conjunto de aplicaciones o de tecnologías con capacidad para interoperar en la Web. Estas aplicaciones o tecnologías intercambian datos entre.
Ing. Ernesto Sierraalta Fundamentos de Desarrollo de Proyectos de Inteligencia de Negocios ( Decision Support Systems & Data Warehousing.
Diccionario/Directorio de Datos
República Dominicana Ministerio de Economía, Planificación y Desarrollo Los recursos automatizados de información estadística en el portal web de la ONE.
Es el proceso mediante el cual quienes toman decisiones en una organización obtienen, procesan y analizan información pertinente, interna y externa,
Introducción a phpmyadmin índice 1. Introducción 6. Insertar registros 5. Crear usuario para php 8. Modificar registros 2. Base de datos MySQL 3. Crear.
Transcripción de la presentación:

Introducción a Pentaho Analysis Lic. Ana Smail Año 2010

Introducción a Pentaho Analysis “La comunidad de código abierto se nutre de la participación y la cooperación. Hay varios canales de comunicación disponibles donde las personas pueden ayudar, pero no están obligados a hacerlo. Usted es responsable de su propio éxito, lo que requerirá tiempo, esfuerzo y una pequeña cantidad de capacidad técnica. Si prefiere tener una relación con un proveedor conocido que responderá a preguntas por teléfono, le ayudará durante su evaluación y lo apoyará en la producción, por favor visite www.pentaho.com.” (Pentaho Coporation) Año 2010

Introducción a Pentaho Analysis Bibliografía HowTo Pentaho 3.5 & Cubo Mondrian en GNU/Linux – por Alvarez Sebastián Matias – 2009 Pasos para crear Cubos con Mondrian Schema WorkBench – por Ing. Dennos Alba Infante para la comunidad Open Business Intelligence Mondrian 3.0.4 - Technical Guide - Developing OLAP solutions with Mondrian – 2009 Mondrian Schema Workbench Pentaho Solutions - Business Intelligence and Data -Warehousing with Pentaho and MySQL – de Roland Bouman Jos van Dongen Año 2010

Introducción a Pentaho Analysis Bibliografía web http://mondrian.pentaho.org/documentation/schema.php http://assets.en.oreilly.com/1/event/2/Creating%20Interactive%20OLAP%20Applications%20with%20MySQL%20Enterprise%20and%20Mondrian%20Presentation.ppt#351,1,Diapositiva 1 http://programacionbizarra.blogspot.com/2009/04/olap.html - Herramientas Libres para OLAP: Mondrian y JPivot Java Año 2010

Introducción a Pentaho Analysis Qué veremos en este módulo ? Introducción a pentaho Analysis Mondrian WorkBench Jpivot – Análisis Ad-hoc Desarrollo de un cubo OLAP Año 2010

Introducción a Pentaho Analysis Pentaho Analysis Service PAS consiste de los siguientes 4 componentes: JPIVOT analisys en el front end: interface de usuario basada en Java. Mondrian ROLAP Engine: motor OLAP, recibe queries MDX desde una herramienta en el front-end como JPIVOT, y responde enviando un result-set multidimensional. Shema Workbench: es una interface visual para diseñar y testear schemas de Mondrian. Mondrian usa Schemas para interpretar MDX y trasladar a queries SQL que pueda ser interpretado por un RDBMS. Agregate Designer: una herramienta visual para analizar la performance y generar tablas agregadas. Año 2010

Introducción a Pentaho Analysis Componentes OLAP en Pentaho (extraído de Pentaho Solutions - Business Intelligence and Data -Warehousing with Pentaho and MySQL) Año 2010

Introducción a Pentaho Analysis Qué es OLAP ? El procesamiento analítico en línea OLAP (On Line Analytic Processing), es la componente más poderosa del Data Warehousing, ya que es el motor de consultas especializado del depósito de datos. Permite recolectar y organizar la información analítica necesaria para los usuarios y disponer de ella en diversos formatos, tales como tablas, gráficos, reportes, tableros de control, etc. Soporta análisis complejos de grandes volúmenes de datos. Complementa las actividades de otras herramientas que requieran procesamiento analítico en línea. Presenta al usuario una visión multidimensional de los datos (matricial) para cada tema de interés del negocio. Es transparente al tipo de tecnología que soporta el DW, ya sea ROLAP, MOLAP u HOLAP. No tiene limitaciones con respecto al número máximo de dimensiones permitidas. Permite a los usuarios, analizar la información basándose en más criterios que un análisis de forma tradicional. Al contar con muestras grandes, se pueden explorar mejor los datos en busca de respuestas. Permiten realizar agregaciones y combinaciones de los datos de maneras complejas y específicas, con el fin de realizar análisis más estratégicos. (extraído de HEFESTO del Ing. Bernabeu Ricardo Dario) Año 2010

Introducción a Pentaho Analysis Qué es OLAP ? Reporte de análisis OLAP en JPIVOT (extraído de HEFESTO del Ing. Bernabeu Ricardo Dario) Año 2010

Introducción a Pentaho Analysis Qué es OLAP ? Bases de Datos OLAP Conceptualmente, una base de datos multidimensional utiliza la idea de "cubos". Un cubo posee N dimensiones y en él están registrados "hechos" de un determinado tipo. Los hechos podrían ser, por ejemplo, desde las ventas realizadas por una empresa (según estudios la utilización de OLAP para el análisis de ventas es la aplicación más popular) hasta los defectos que reportan los usuarios de un sistema informático, según cuál fuese la finalidad de la aplicación. Un ejemplo de consulta MDX es el siguiente: SELECT { [Measures].[Importe] } ON COLUMNS, { [Tiempo].[2002], [Tiempo].[2003] } ON ROWSFROM VentasWHERE ( [Sucursal].[Zona Oeste].[Tablada] ) (extraído de “Herramientas libres para OLAP” de Héctor Francisco Hernández) Año 2010

Introducción a Pentaho Analysis Mondrian Mondrian está compuesto por un conjunto de archivos "jar", que proveen una API inspirada en JDBC pero diseñada para trabajar con una base multidimensional. El sistema necesita que escribamos en un archivo "xml" cómo se corresponden los elementos de esta base con la base relacional. Las estructuras comunmente usadas son tres: Una única tabla para el cubo donde existe un registro por cada hecho (por ejemplo, un registro por cada venta). El registro tendrá un código único, un campo o más por cada dimensión y un campo por cada valor del hecho (un campo con el importe de la venta, otro con la cantidad de artículos vendidos, etc.). (La última versión de Mondrian y su documentación se encuentra en http://mondrian.pentaho.org/) Año 2010

Introducción a Pentaho Analysis Mondrian Una estructura de estrella (La última versión de Mondrian y su documentación se encuentra en http://mondrian.pentaho.org/) Año 2010

Introducción a Pentaho Analysis Mondrian Una estructura de copo de nieve (La última versión de Mondrian y su documentación se encuentra en http://mondrian.pentaho.org/) Año 2010

Introducción a Pentaho Analysis Mondrial Ejemplo de mapeo Supongamos un cubo llamado "Ventas" que posee todas las ventas de una pequeña cadena de mercados. Este cubo tendrá tres dimensiones: "Rubro", "Sucursal" y "Tiempo", y también un valor, el "Importe" de la venta. Previamente crearíamos una base de datos en algún servidor que tenga conectividad con JDBC, por ejemplo MySQL. Nuestra arquitectura será la típica estrella, con la tabla de hechos "venta" y una tabla adicional por cada dimensión. Año 2010

Introducción a Pentaho Analysis Mondrial Ejemplo de mapeo Para mapear el cubo con la tabla, creamos un archivo llamado "olapmercado.xml" con el siguiente contenido: Año 2010

Introducción a Pentaho Analysis Mondrial Cómo funciona ? Mondrian es un motor ROLAP con caché. ROLAP significa que en mondrian no residen datos (salvo en la caché) sino que estos residen en una Sistema de Gestion de Bases de Datos externo. Es en esta base de datos en la que residen las tablas que conforman la información multidimensional con la que mondrian trabaja (los modelos en estrella de nuestros data marts por ejemplo). MOLAP es el nombre que reciben los motores olap en los que los datos residen en una estructura dimensonal. (extraído de HEFESTO) (extraído de “Análisis del estod de Mondrian” de Javier Giménez para Stratebi) Año 2010

Introducción a Pentaho Analysis Mondrial Flujo de ejecución Año 2010

Introducción a Pentaho Analysis Mondrial Tablas agregadas En el caso de que tengamos tablas agregadas en nuestro modelo en estrella (versión de las tablas de hechos reducidas con el fin de acelerar las queries), Mondrian es capaz de aprovecharlas. Ejemplo: Disponemos de dos tablas de hechos, una básica con un millon de registros e información a nivel de día y una versión agregada con información a nivel de mes y 20.000 registros (HECHOS y HECHOS_AGG). Si el usuario lanza una consulta MDX que solicita la información de este cubo Mondrian hará lo siguiente: Verá si tiene la información en la caché (opción más rápida) Ver si para el nivel jerárquico para el que piden los datos puede obtenerlos con una SQL contra la tabla HECHOS_AGG, si puede lo hace. (ej. La consulta pedía agregados para los 4 primeros meses). Si la sentencia MDX pedía información a nivel de día, Mondrian obtendrá lo que pueda de la caché, lo que pueda de la tabla agregada y para los niveles de detalle irá a la tabla de HECHOS principal. Año 2010

Introducción a Pentaho Analysis Mondrial Tablas agregadas Para informar a Mondrian de que tablas agregadas hay disponible hay dos opciones: Definirlas explicítamente (todas las que haya) en los metadatos (Esquema de Mondrian con las definiciones de cubos). Utilizar una nomenclatura para los nombres de las tablas de forma que Mondrian (con una reglas gramaticales que tiene definidas y que son customizables) pueda saber automáticamente que tabla agregada puede utilizar en cada caso. Año 2010

Introducción a Pentaho Analysis Mondrial Caché El objeto de esta memoria intermedia es almacenar información del cubo de forma que se pueda responder a queries (o partes de las queries) más rápidamente no siendo necesario lanzar consultas SQL contra la base de datos.   Mondrian, permite desactivar la caché (para entornos en los que el rendimiento no sea crítico pero si lo sea disponer siempre del dato residente en la base de datos) y además (a partir de la versión 2.3) gestionarla de un modo sofisticado. Año 2010

Introducción a Pentaho Analysis Cómo diseñar un cubo en Mondrian ? Archivos de Schema Modelo Lógico Dimensiones, Jerarquías y Niveles Año 2010

Introducción a Pentaho Analysis JPivot JPivot se puede descargar de la página del proyecto en SourceForge, http://jpivot.sourceforge.net/. La distribución binaria incluye el archivo ".war" listo para ser colocado en algún servidor JEE y funcionar. (extraído de “ ” de Héctor Francisco Hernández) Año 2010

Introducción a Pentaho Analysis JPivot Las operaciones que se pueden realizar sobre modelos multidimensionales y que son las que verdaderamente les permitirán a los usuarios explorar e investigar los datos en busca de respuestas, son: (extraído de “ ” de Héctor Francisco Hernández) Año 2010

Introducción a Pentaho Analysis JPivot (extraído de “ ” de Héctor Francisco Hernández) Año 2010

Lic. Ana Smail (anasmail@unnoba.edu.ar) Preguntas Lic. Ana Smail (anasmail@unnoba.edu.ar) Año 2010