Descargar la presentación
La descarga está en progreso. Por favor, espere
1
Herramientas ETL
2
1. Definición. Extract Transform Load
Extract : extraer datos de diferentes fuentes Transform : transformar los datos Load : cargar los datos en un data Warehouse
3
2. Procesos ETL. Extraer : Consiste en extraer los datos desde diferentes sistemas de origen. Extraer : Analizar los datos extraídos . Correspondencia Bases de datos operacionales Almacenamiento intermedio Almacén de datos Extracción
4
2. Procesos ETL. Transformación : En esta fase se aplica una serie de reglas de negocio o funciones sobre los datos extraídos para convertirlos en datos que serán cargados . Correspondencia Bases de datos operacionales Almacenamiento intermedio Almacén de datos Transformación
5
2. Procesos ETL. Limpieza de datos: eliminar datos, corregir y completar datos, eliminar duplicados. 12M65431 12-m-65421 “12m65421” “ ” 12 M m 65431 65421
6
2. Procesos ETL. Codificar valores libres (por ejemplo, convertir “Hombre” en “H” o “Mujer” en “M″) Aplicación: Hombre y Mujer H - M
7
2. Procesos ETL. Unir varias columnas en una .
8
2. Procesos ETL. Obtener nuevos valores calculados
Calcular totales de múltiples filas de datos Dividir una columna en varias
9
2. Procesos ETL. Cargar : En esta false los datos de la fase anterior (transformar) son cargados en el sistema de destino . Correspondencia Almacenamiento intermedio Extracción Carga Bases de datos operacionales Transformación Almacén de datos
10
2. Procesos ETL. Existen dos etapas del proceso de carga:
- Carga inicial. - Mantenimiento periódico. Existen dos formas de desarrollar el proceso de carga: - TAL (Trunc and Load) . - Incremental .
11
2. Procesos ETL. Procesamiento : Un desarrollo reciente en el software ETL es la aplicación de procesamiento paralelo . Hay 3 tipos principales de paralelismos que se pueden implementar en las aplicaciones ETL: - De datos - De segmentacion (pepline) - De componente
12
3. Herramientas ETL
13
3.Herramientas ETL Colver.ETL : Es una herramienta ETL open source basado en un framework Java que puede ser utilizado para transformar datos estructurados . Puede ser utilizado solo como un servidor de aplicación .
14
4. Desventajas de ETL. Costo de las licencias Flexibilidad
Incertidumbre
15
5. Conclusión. En sistemas de información no existen soluciones universales, es decir soluciones que siempre van a dar buenos resultados en el ciento por ciento de los casos. Por esta razón durante la presentación , veremos otras soluciones que pueden ser mejores o peores .
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.