1 2015-11-23/27 1 Herramientas ETL Extract, Transform & Load Julián González García.

Slides:



Advertisements
Presentaciones similares
Mantenimiento preventivo al software
Advertisements

Iniciación al Power Point
ALGORITMOS Y LENGUAJES Estructuras de Control CONDICIONAL
Razonamiento algorítmico
IRIS.
Resolución de Problemas Algoritmos y Programación
Introducción a la Programación
DIAGRAMAS DE FLUJO Y PSEUDOCÓDIGO
Concepto de programa. Directorio Concepto de programa. Analisis del problema. Resolucion del problema. Desarroollo de un programa. Partes constitutivas.
Introducción a la Computación
SISTEMAS DE INFORMACION
LOGICA DE NEGOCIOS ADAN GONZALEZ BARRERA.
ING. CATALINA DONCEL GONZÁLEZ ING. MÓNICA LORENA TORRES VIVAS
INTELIGENCIA DE NEGOCIOS
Microcomputadores Prof : Tatiana Marín R.. Sistema basado en microprocesador de 8 bits.
TRADUCTOR DE UN PROGRAMA
Temas importantes para el desarrollo de la segunda parte del TPE
Visualizador de imágenes remotas Alumno: Juan Pablo García Ortíz Director: Vicente Gonzalez Ruiz.
DISEÑO DE LA INTERFAZ DE USUARIO
LENGUAJES DE PROGRAMACIÓN
ACIDE A C onfigurable I ntegrated D evelopment E nvironment (Un entorno integrado de desarrollo configurable)
Tema 6. Conceptos básicos de programación (Repaso) Prof. María Alejandra Quintero Informática Año 2013.
Almacenamiento de la información Conabio CNA INEGI Conanp Profepa INE Otras dependencias Conafor Semarnat.
1.4 Traductor y Su estructura
ILIANA CORDOVA.
UNIDAD 2. ALGORITMOS Y ESTRUCTURAS DE DATOS.
LENGUAJES DE PROGRAMACIÓN

ALGORITMOS.
SISTEMAS DE INFORMACION GEOGRAFICA. LOS SIG DEFINICION DEFINICION Un SIG se define como un conjunto de métodos, herramientas y datos que están diseñados.
 Es un visualizador de datos geográficos que permite la gestión de la información territorial de una ciudad de una manera simple y accesible para usuarios.
UD 1: “Adopción de pautas de seguridad informática” Análisis de las principales vulnerabilidades de un sistema informático. Luis Alfonso Sánchez Brazales.
Herramientas ETL.
Herramientas informáticas
VISOR SITNA 9.0. ¿Qué es el VISOR SITNA? Herramienta de SIG básico personalizada. Año de lanzamiento: 2002 Versión nueva anual.
Representación de Algoritmos
Especialista en Business Intelligence Integration Services SSIS Transformaciones (Parte 4) Microsoft SQL Server 2008 R2.
Ing. Noretsys Rodríguez. Definición de Conceptos  Falla: Ocurre cuando un programa no se comporta de manera adecuada. Es una propiedad estadística de.
DIAGRAMA DE FLECHAS O RUTA CRITICA
Taller de Herramientas de Presentación
PRACTICA 1. Introducción Mezcla de audio en Cubase
UNIVERSIDAD LATINA VII. ACTUALIZACIÓN DE LAS BASES DE DATOS. E.I. L.E. Prof. Ramón Castro Liceaga.
UNIVERSIDAD LATINA III. MANTENIMIENTO Y GESTIÓN DE LA INFORMACIÓN DE UNA BASE DE DATOS. E.I. L.E. Prof. Ramón Castro Liceaga.
Versión 4.0 SOFTNET: Es una empresa dedicada a brindar Soluciones Informáticas. Nuestro objetivo es el desarrollo e implementación de sistemas de gestión.
Software El software permite comunicar al computador los problemas y hace posible que nos comunique las soluciones Los programas son el software del computador.
ALGORITMO QUE ES ??.
Vamos a tratar algunos temas que es necesario conocer a la hora de administrar un sistema informático y que nos van a ser útiles sin importar el sistema.
FACULTAD: CIENCIAS ECONÓMICAS Y EMPRESARIALES ASIGNATURA: GESTIÓN DE CONTENIDO ELECTRÓNICO TÍTULO: TINFOPATH - VENTAJAS Y USO. AUTORA: MARIA DANIELA TOMALÁ.
Elaboración de algoritmos usando lógica de programación
Escuela de Geografía Asignatura: Programación Digital Asignatura: Programación Digital Profesora: Nelly García Mora Semestre: B-2010 Sem B-2010Ing. Nelly.
Análisis de las principales vulnerabilidades de un sistema informático. Gabriel Montañés León.
Profesora: Angela Maiz
Edwin Oliveros.  El diseño de sistemas consiste en la transformación del modelo de diseño, que toma en cuenta los requerimientos no funcionales y las.
Algoritmos Programación
UNIDAD 2: “Características del Modelado UML” CONTENDIDO Elaborado por: Ingeniero Harold Cabrera Meza Actualizado por: Ingeniero Nilson Albeiro Ferreira.
Vamos a tratar algunos temas que es necesario conocer a la hora de administrar un sistema informático y que nos van a ser útiles sin importar el sistema.
SISTEMAS DE INFORMACION ORGANIZACIONAL
Software.
HTML.
PROGRAMA NUESTRAS CIUDADES SISTEMA DE INFORMACION PARA LA GESTION URBANA TERRITORIAL.
Partes de la ventana Access
Curso: Fundamentos de Computación
ESTE TERMINO SE DEFINE COMO : UN PROCESO EN EL CUAL SE NOS DESCRIBE UN PROBLEMA (EN LENGUAJE NATURAL), LUEGO DE ESTO SE PLANTEAN POSIBLES RESOLUCIONES.
 La computación en nube es una tecnología nueva que busca tener todos nuestros archivos e información en Internet y sin depender de poseer la capacidad.
Presentación De UML Lenguaje estándar para escribir planos de software Se usa para visualizar, especificar, construir y documentar los artefactos de un.
Requerimientos del software
Prof. Jonathan Silva Ingeniería Civil – Informática I Ingeniería Civil Informática I Clase 3 – Diseño de Programas.
GeoBuilder Fernando Alonso-Pastor Es un gestor de geoprocesos que facilita la realización de múltiples operaciones que deben ejecutarse simultánea.
SISTEMAS DE INFORMACION GEOGRAFICA (SIG) Néstor Acosta Rodríguez Código: 7137.
Arquitectura de Computadoras (Taller) Semestre II de 2008.
Transcripción de la presentación:

/27 1 Herramientas ETL Extract, Transform & Load Julián González García

/27  Son capaces de : Extraer o leer datos de diferentes fuentes de datos. Transformar los datos: corrigiendo errores; cambiando su estructura; haciéndolos conformes a especificaciones; etc. Cargar o escribir los datos transformados en diferentes fuentes de datos.  Fuentes de datos: ficheros, bases de datos (espaciales), servicios web. ETL - ¿para qué?

/27  Habitualmente partimos de modelos de datos bien establecidos.  En la mayoría de las ocasiones estos modelos han de ser respetados, al igual que sus implementaciones, sean en ficheros o en bases de datos, debido a todas las aplicaciones que los utilizan.  Por lo tanto crearemos una copia de los datos en diferentes bases de datos, esquemas dentro de la misma base de datos, exportaremos a ficheros, etc., transformando los datos a un modelo parecido al que marcan las especificaciones de datos INSPIRE en el mismo proceso de copia. ETL - ¿Cómo nos pueden ayudar?

/27  Se basan en flujos de trabajo y se diseñan utilizando una interfaz gráfica en la que: Los orígenes de datos se colocan a la izquierda, A continuación se especifican las operaciones/transformaciones que se quieren aplicar de derecha a izquierda. Los caminos que siguen los datos pueden determinarse en función de los valores de algún atributo, copiarse y bifurcarse en varios caminos o confluir como datos de entrada para una operación transformación. Los destinos de los datos se colocan a la derecha  Por defecto estas herramientas nos proporcionan una galería de operadores/transformadores. Pero cada vez más, dan la posibilidad de procesar los datos utilizando algún lenguaje de programación (Python, JavaScript, …) ETL – Al rescate!

/27  Suelen incorporar inspectores o visualizadores para inspeccionar los datos a medida que se va realizando la transformación.  En algunos casos pueden indicarse puntos de ruptura en donde la ejecución se para que tengamos la posibilidad de depurar el flujo de trabajo.  Una vez configurado el espacio de trabajo o flujo se puede salvar para ser ejecutado tantas veces como sea necesario y pueden ser parametrizados mediante variables ETL – Al rescate!

/27  El más conocido:  El gratuito más conocido:  Uno “made in Spain”:  Algunos que realizan la transformación entre formatos pero dependen de software de terceros para procesar los datos: ETL – Algunos programas

/27  Objetivo buscado: Determinar que ficheros de manzanas, parcelas y contrucciones procedentes de Catastro se podían importar directamente para realizar la capa fondo urbano de CartoCiudad y cuales debían ser analizados.  Problemas: Cada shapefile de municipio podía venir en diferente SRS En algunos casos la cartografía podía estar desplazada o incorporar parcelas de otros municipios.  Solución: Calcular el porcentaje de coincidencia entre los datos almacenados en CartoCiudad con los procedentes de Catastro. Ejemplo real 1

/27 Solución con FME

/27 Solución con GeoKettle

/27  Objetivo buscado: Determinar que calles intersectan en cada uno de los cruces de calles.  Solución: Extraer los puntos iniciales y finales de cada tramo y espacialmente encontrar todas las calles que confluían en ese cruce Ejemplo real 2

/27 Solución con FME  Después de 2 días:

/27 Solución con PL/pgSQL  Después de 1 hora:

/27 Gracias por vuestra atención Julián González García Centro Nacional de Información Geográfica Instituto Geográfico Nacional