Manipulación de datos con Kettle

Slides:



Advertisements
Presentaciones similares
Andres Alarcón Guerrero. Inteligencia de Negocios Conjunto de estrategias y herramientas enfocadas a la administración y creación de conocimiento mediante.
Advertisements

Curso de PHP Tema 1: Introducción.
Sistema de Información Cultural, CONACULTA México, 2006 SiC / RENiC Aspectos técnicos relevantes para un Sistema de Información (SI)
Microsoft Office Sharepoint Server Business Intelligence Rubén Alonso Cebrián Código: HOL-SPS07.
Microsoft SQL Server 2005 Integration Services
TIBERIUS Predictive Modelling Software
Todo el Software necesario puede ser conseguido por separado. Para facilitar la puesta al punto del ambiente, nosotros utilizaremos una herramienta particular.
POSTGRESQL MI JUAN PABLO TORRES HERRERA UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA FACULTAD DE INGENIERÍA ENSENADA Agosto de 2006.
Microsoft SQL Server 2008 – SQL Server Integration Services
DEFINICION Un sistema de gesti ó n de base de datos es una suite de aplicaciones de software que hacen que le sea posible para las personas o empresas.
• SQL Server Integration Services SSIS
TRABAJO DE PHP BB. PHP BB  Desde su creación en el 2000, php bb se ha convertido en la solución de Foros Open Source más utilizada. Como sus predecesores,
Especialista en Business Intelligence Integration Services SSIS (Sesión 7) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
SQL Server Integration Services SSIS
SQL Server Integration Services SSIS
Uso actual y futuras prestaciones
SERVIDOR DE CONTENIDOS
Especialista en Business Intelligence Integration Services SSIS (Sesión 7) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
INSTALACIÓN Y MANTENIMIENTO DE SISTEMAS OPERATIVOS
Especialista en Business Intelligence Integration Services SSIS (Sesión 6) Microsoft SQL Server 2008 R2 (2013) Suscribase a o escríbanos.
DESARROLLO DE APLICACIONES
Envolviendo la API de Firebird/Interbase CoNaIISI 2013 UTN FRC Mg. Guillermo Cherencio.
PENTAHO BI (Open Source) Introducción
Free Pascal 1. Introducción 2. Instalación 3. Uso 4. Documentación 5. Información Adicional.
ANALITICA - INTEGRATOR INTRODUCCIÓN Y CONCEPTOS. ANALITICA - INTEGRATOR OBJETIVO Integrar información aislada en archivos o sistemas, tanto corporativos.
SQL Server 2008 Integration Services
SQL. PRESENTADO POR: JHENYFER PUENTES ADRIANA LOTE MARCO YEPEZ ROQUE ECHEVARRIA CARLOS ROBLES JAVIER TRUJILLO.
Manual tecnico pagina web
Proceso para la creación de una publicación digital
UNIVERSIDAD TECNOLÓGICA ECOTEC. ISO 9001:2008 Julio Carranza Rabih Safadi 1.
Desarrollo de sitios web con
Paulina Guevara UNITA - IBARRA. Lenguaje de programación orientado a objetos y procedural. Un Sistema Gestor de Bases de datos o Database Management System.
Especialista en Business Intelligence Integration Services SSIS Tareas de Flujo de Control (Parte I) Microsoft SQL Server 2008 R2 Suscribase a
Marco Conceptual para la Gestión de Conocimiento de entornos de colaboración: aplicación a la creación de un portal de revistas electrónicas EUITIO Daniel.
Diseño de Sitios Web con CMS David Chura. Sesión 1.
BASE DE DATOS EN LA WEB.
Especialista en Business Intelligence Integration Services SSIS Paquetes y Tareas de Flujo de Datos Microsoft SQL Server 2008 R2 Suscribase a
ORACLE LAURA ANGÉLICA MOLINA GARDUÑO NESAYD ESPINOZA LÓPEZ JOSÉ DIEGO POPOCA ROMÁN.
Inteligencia de Negocios Buenos Aires, mayo de 2009 U.T.N. – F.R.B.A. Prof: Ing. Pablo Cigliuti Ayud: Ing. Rafael Rizzo.
Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010.
DIFERENCIAS ENTRE LOS SGBD´s
Especialista en Business Intelligence Integration Services SSIS Transformaciones (Parte 4) Microsoft SQL Server 2008 R2.
Paquetes SSIS.
Programación Java y Desarrollo de Aplicaciones Modulo 3 Lenguaje de programación Java Software utilizado.
UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO MODULO IV ADMINISTRACIÓN DE BASES DE DATOS (licenciamiento) SGBD disponibles en el mercado E.I. L.E. Prof. Ramón.
Nombre: Germania Ruiz UNIVERSIDAD TECNOLOGICA AMERICA.
Data Compatibility 100% OLE DB architecture (including ODBC) 100% OLE DB architecture (including ODBC) Relational and non-relational sources Relational.
Ihr Logo PHP Parte 2 “php toma muchas sintaxis de lenguajes de alto nivel conocidos para poder trabajar”
Manual violento de Navicat
Miguel de Icaza es un desarrollador mexicano de software libre, reconocido por su proyectoGNOME , por su participación en el administrador de archivos Mindnight.
DISEÑO CURRICULAR Presentado por: Cesar Augusto Sáenz María Alejandra Hernández 1.contenidos curriculares de competencia.
Instrumentos Científicos, SA · · Instrumentos Científicos SA.
SharePoint Day Bogotá Julio 25 de 2015 Workshop BI PowerQuery COMUNIDAD SHAREPOINT DE COLOMBIA.
Especialista en Business Intelligence Integration Services SSIS (Sesión 3) Microsoft SQL Server 2008 R2 (Nov.2013) Suscribase a o.
SQL Server Integration Services SSIS
Taller de Inteligencia de Negocios SQL Server Integration Services SSIS Semana 2.
• SQL Server Integration Services SSIS
• SQL Server Integration Services SSIS
9. Servicelab. Descripción El sistema SERVICELAB está desarrollado para funcionar con un servidor LAMP (Linux, Apache, MySQL y PHP) con las siguientes.
Taller de Inteligencia de Negocios SQL Server Integration Services SSIS Sesión 3.
DATA WAREHOUSE.
Ing. Lorena Ruhl - Marco Rapallini - Javier FabiánMódulo 3: Integración de PHP con Bases de Datos Ing. A. Lorena Ruhl Universidad.
INSTALACION LAMP Linux sistema operativo Apache servidor web MySQL gestor de Bases de Datos P lenguaje de programación Copyright by Patrick Piñarete1.
UNIVERSIDAD LATINA I.- PLANEACIÓN DE LA BASE DE DATOS. E.I. L.E. Prof. Ramón Castro Liceaga.
Servicios Web Conjunto de aplicaciones o de tecnologías con capacidad para interoperar en la Web. Estas aplicaciones o tecnologías intercambian datos entre.
``ACTIVIDAD INTEGRADORA ´´
Bitnami Implantación de Aplicaciones Web. Bitnami Proyecto de código abierto. Descargar (versiones para Windows y GNU/Linux).
1. Objetivos. 2. Contenido Informativo. 3. Actividades. 4. Evaluación del Aprendizaje. 1. Objetivos. 2. Contenido Informativo. 3. Actividades. 4. Evaluación.
Taller de Inteligencia de Negocios SQL Server Integration Services SSIS Sesión 2.
MANTIS BUG TRACKER.
Transcripción de la presentación:

Manipulación de datos con Kettle Ing. Marcos Pierri SIU-Datawarehouse dw@siu.edu.ar Taller Anual de los sistemas SIU-Diaguita, SIU-Mapuche y SIU-Pilagá - 15 y 16 de septiembre 2011 – UNCOR 1

Contenido ¿Qué es Kettle? ¿Para qué sirve? Principales características Instalación Ejemplos de uso - DEMO Taller Anual de los sistemas SIU-Diaguita, SIU-Mapuche y SIU-Pilagá - 15 y 16 de septiembre 2011 – UNCOR 2

¿Qué es Kettle? Herramienta de ETL (extracción, transformación y carga) Open Source. Creado por Matt Casters - @mattcasters Adquirido por Pentaho en 2006. Actualmente se llama Pentaho Data Integration (PDI). Desarrollado integramente en Java. Licencia GNU LGPL. Última versión estable 4.1.0 (30-11-2010). Versión en desarrollo 4.2.0-RC1 (01-07-2011). Taller Anual de los sistemas SIU-Diaguita, SIU-Mapuche y SIU-Pilagá - 15 y 16 de septiembre 2011 – UNCOR 3

¿Para qué sirve? Integración de datos Carga de datawarehouses y datamarts Limpieza de datos (data cleansing) Análisis y perfilado de datos (data profiling) Migración de datos entre Bases de datos Exportar datos de Bases de datos a archivos planos Etc, etc ... Taller Anual de los sistemas SIU-Diaguita, SIU-Mapuche y SIU-Pilagá - 15 y 16 de septiembre 2011 – UNCOR 4

Principales características GUI muy avanzada. Soporte para gran cantidad de fuentes de información. Basado en dos tipos de objetos diferentes: Transformaciones Trabajos Las T&T utilizan un lenguaje descriptivo (XML). Cuenta con herramientas y utilidades para crear, administrar y ejecutar T&T. Permite extender las funcionalidad mediante el desarrollo de Plugins propios. Taller Anual de los sistemas SIU-Diaguita, SIU-Mapuche y SIU-Pilagá - 15 y 16 de septiembre 2011 – UNCOR 5

GUI muy avanzada Taller Anual de los sistemas SIU-Diaguita, SIU-Mapuche y SIU-Pilagá - 15 y 16 de septiembre 2011 – UNCOR 6

Fuentes de información Bases de datos (+40): - PostgreSQL - MySql - Informix - dBase III, IV o 5 - Firebird SQL - IBM DB2 - MS SQL Server - MS Access - Oracle - SAP ERP System - Teradata - LucidDB - Hypersonic - Apache Derby - etc, etc ... Excel Xml Txt / CSV RSS Salesforce Google Analytics Web services Taller Anual de los sistemas SIU-Diaguita, SIU-Mapuche y SIU-Pilagá - 15 y 16 de septiembre 2011 – UNCOR 7

Transformaciones Orientación a los Datos. Representa una tarea ETL. Es una colección de “pasos”. Cada paso es una operación particular sobre datos. Los “pasos” se conectan entre sí a través de “saltos”, que indica cual será el flujo de los datos. Los “pasos” trabajan de manera simultánea y asincrónica. Taller Anual de los sistemas SIU-Diaguita, SIU-Mapuche y SIU-Pilagá - 15 y 16 de septiembre 2011 – UNCOR 8

Trabajos Orientación a la Tarea y a los Datos. Usualmente un Trabajo se compone de una o más Transformaciones/Trabajos, que serán ejecutadas secuencialmente. La ejecución de cada “Entrada de Trabajo” presenta una salida de status, que puede ser analizada para la realización de diferentes acciones. Taller Anual de los sistemas SIU-Diaguita, SIU-Mapuche y SIU-Pilagá - 15 y 16 de septiembre 2011 – UNCOR 9

Herramientas y utilidades para crear, administrar y ejecutar T&T Spoon: IDE gráfico para crear T&T. Kitchen: herramienta de línea de comandos para ejecutar Trabajos. Pan: herramienta de línea de comandos para ejecutar Transformaciones. Carte: servidor liviano para ejecutar T&T en host remotos. Taller Anual de los sistemas SIU-Diaguita, SIU-Mapuche y SIU-Pilagá - 15 y 16 de septiembre 2011 – UNCOR 10

Instalación Pre-requisitos - JRE (o JDK) 5.x o superior. Descarga - http://sourceforge.net/projects/pentaho/files/ - Carpeta “Data Integration” - Versión 4.1.0 – 106.5 MB - Versión 4.2.0-RC1 – 225.3 MB Taller Anual de los sistemas SIU-Diaguita, SIU-Mapuche y SIU-Pilagá - 15 y 16 de septiembre 2011 – UNCOR 11

Después de descomprimir el archivo - Ejecutar spoon.sh (Linux) o spoon.bat (Windows) Taller Anual de los sistemas SIU-Diaguita, SIU-Mapuche y SIU-Pilagá - 15 y 16 de septiembre 2011 – UNCOR 12

Pantalla de Bienvenida Taller Anual de los sistemas SIU-Diaguita, SIU-Mapuche y SIU-Pilagá - 15 y 16 de septiembre 2011 – UNCOR 13

Ejemplos de uso - DEMO 01 - leer un archivo txt. Los ejemplos fueron extraidos del libro Pentaho Data Integration 4 Cookbook – María C. Roldán. (http://www.packtpub.com/support) 01 - leer un archivo txt. 02 - escribir un archivo txt. 03 - leyendo un archivo simple XML. 04 - leyendo un archivo excel. 05 - generando datos de ejemplo para testeo. 06 - cargando datos desde txt en una base postgresql. 07 - leyendo datos desde una base postgresql y exportarlos a un txt. 08 - programando una funcionalidad a medida. 09 - enviando e-mails con archivos adjuntos. 10 - copiando o moviendo uno a más archivos. Taller Anual de los sistemas SIU-Diaguita, SIU-Mapuche y SIU-Pilagá - 15 y 16 de septiembre 2011 – UNCOR 14

Libros - Información Pentaho Solutions - Roland Bouman, Jos van Dongen – Wiley - ISBN:978-0-470-48432-6 Pentaho 3.2 Data Integration: Beginner's Guide - María Carina Roldán - Packt Publishing - ISBN:1847199542 Pentaho Kettle Solutions - Matt Casters, Roland Bouman, Jos van Dongen – Wiley - ISBN:978-0-470-63517-9 Pentaho Data Integration 4 Cookbook - Adrián Sergio Pulvirenti, María Carina Roldán - Pack Publishing - ISBN: 978-1-84951-524-5 Wiki SIU Pentaho: http://repositorio.siu.edu.ar/trac/dw_pentaho/wiki/WikiStart Foro SIU Comunidad: http://comunidad.siu.edu.ar/index.php?board=49.0 --------------------------------------------------------------------------------------------------------------- Sitio de PDI - Kettle: http://kettle.pentaho.com/ Foros Pentaho: http://forums.pentaho.com/ Taller Anual de los sistemas SIU-Diaguita, SIU-Mapuche y SIU-Pilagá - 15 y 16 de septiembre 2011 – UNCOR 15

¿Preguntas? Taller Anual de los sistemas SIU-Diaguita, SIU-Mapuche y SIU-Pilagá - 15 y 16 de septiembre 2011 – UNCOR 16

Muchas Gracias!!! Más información: www.siu.edu.ar dw@siu.edu.ar Taller Anual de los sistemas SIU-Diaguita, SIU-Mapuche y SIU-Pilagá - 15 y 16 de septiembre 2011 – UNCOR 17