Relaciones entre minería de datos, bodegas de datos y OLAP

Slides:



Advertisements
Presentaciones similares
Análisis y Diseño de Sistemas Enfoque Estructurado
Advertisements

Procesamiento y Análisis en Línea OLAP
Cubos de Información Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se.
Inteligencia de Negocios
Comisión Mixta Octubre Ejercicio crediticio Al 22 de Octubre de 2006 Crédito 99%
1 LA UTILIZACION DE LAS TIC EN LAS PYMES GALLEGAS AÑO de Junio de 2005.
1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN LAS EMPRESAS GALLEGAS ( Resumen PYMES ) Noviembre de 2004.
© Dr. Iván E. Calimano Formas, usos, etc.
TEMA 2 MÚLTIPLOS Y DIVISORES
02- Plan Organización Docente v.2 Noviembre 2009 SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR.
02- PLAN DOCENTE Febrero 2009 SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR.
01- OFERTA FORMATIVA v.2 Noviembre 2009 SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR.
Contenido Sistemas de Información Desarrollo de software
Enero 28, 2009 Módulo de Inteligencia de Negocios.
Leo Marthe x 2123 COMMANDperformance Leo Marthe x 2123.
Razonamiento basado en memoria
ORACLE OLAP Integrantes: *Aizaga, Martiniano *Gallegos, Marina
U I B 12/05/1999 Datawarehouse 1. U I B 12/05/1999 Datawarehouse 2 Conceptos Datawarehouse Datawarehouse: Repositorio completo de datos de la empresa,
DATA WAREHOUSE Presentador Por: Andrés Fabián Cortes Solano.
Presentación 20 de Mayo 2009.
Campus virtual Autoevaluaciones Teletutorías Salas de estudio Clases en línea Contratos didácticos Proyecto E.D.U.F. Universidad Universidad.
1 Reporte Componente Impacto Por Orden Territorial Por Departamento No Disponible ND *Los indicadores para el año 2008 no fueron calculados.
BASES DE DATOS MULTIDIMENSIONALES
DATAWAREHOUSE.
P ROCESO DE R ECAUDACIÓN SIRI 1. Í NDICE 2 Ventajas del Nuevo Portal SIRIIntroducciónServicios a liberar en el Nuevo Portal SIRIDiferencias en la operación.
50 principios 1. Los clientes asumen el mando.
1 PROYECTO DE PRESUPUESTO DE EGRESOS DE LA FEDERACION 2002 COORDINACIÓN DE POLITICA ECONOMICA GP-PRD.
Clasificación de los indicadores por categoría
Contabilidad FINANCIERA
¡Primero mira fijo a la bruja!
Informe caso de estudio Implementación de un Datawarehouse
ORACLE OLAP Integrantes: *Aizaga, Martiniano *Gallegos, Marina
Jesús Angel Ovando División de Estudios de Posgrado Instituto Tecnológico de Orizaba.
MINIMO COMÚN MÚLTIPLO DE DOS NÚMEROS a y b
On Line Analytical Processing
RESULTADOS DE ECAES 2005 AREAS - COMPETENCIAS M. OSWALDO BUSTAMANTE RÚA, PhD COORDINADOR ECAES DE LA SEDE DIRECCIÓN ACADEMICA DE LA SEDE.
APENDICE TEMA 4. MÉTRICA DE LOS PUNTOS DE FUNCIÓN
Nacional Financiera, tu brazo derecho.. Objetivo Cronología Flujo de la Información Estadísticas Front-End Factores críticos de éxito Ventajas y Beneficios.
Armando Lechler Avitia
Requerimientos No Funcionales
ALUMNAS: LEÓN MORÁN, Karla PEZO SANTA MARÍA, Iriana 1 ASESOR : MBA Ing. Carlos Zorrilla Vargas.
Reporte POS para Comercios Afiliados
Ingeniero Fredys Simanca
ØNivel ejecutivo no cuenta con una solución integrada donde pueda analizar los indicadores operativos y financieros ØNo cuentan con una perspectiva que.

Aplicaciones del Big Data a la Inteligencia del Negocio
Bases de Datos II OLAP Online Analytical Processing
DATA MART Los data warehouses están hechos para proporcionar una fuente de datos única para todas las actividades de apoyo para la toma de decisiones.
Implementación de Datawarehouse
Sistema Subregional de Información Estadística de la Comunidad Andina - SSIECAN - Erick Bocanegra Consultor Sistemas de Información Proyecto ANDESTAD.
DATA WAREHOUSE Equipo 9.
OLAP vs OLTP.
OBTENER CONOCIMIENTO Conocimiento Minería Bodega de Datos ETL
Taller de Base de Datos Procesamiento Analítico en Línea ¿Qué es OLAP? Imaginemos el siguiente escenario: Una cadena de supermercados posee una (o varias)
1 Prof:Paula Quitral INTRODUCCIÓN DATAWAREHOUSE Departamento de Informática Universidad de Rancagua.
Fundamentos de Sistemas de Información
DATA WAREHOUSE.
ORACLE OLAP CAECE Integrantes: *Aizaga, Martiniano *Gallegos, Marina *Kleinlein, Guillermo *Schiano di Cola, Emiliano.
Sistemas de Bases de Datos
Introducción al Data Warehouse
DATA WAREHOUSE.
María Trinidad Serna Encinas
Ing. Ernesto Sierraalta Fundamentos de Desarrollo de Proyectos de Inteligencia de Negocios ( Decision Support Systems & Data Warehousing.
Almacén de Datos MC BEATRIZ BELTRÁN MARTÍNEZ. Primavera 2016 MC BEATRIZ BELTRÁN MARTÍNEZ 33 Definición Colección de datos orientada a un dominio, integrado,
La Empresa La Problemática Estado Actual, Bases de datos relacionales Problemas con las consultas No muestra datos históricos Poca integridad en.
Diccionario/Directorio de Datos
Es el proceso mediante el cual quienes toman decisiones en una organización obtienen, procesan y analizan información pertinente, interna y externa,
BASES DE DATOS DISTRIBUIDAS M.C.C. María Guadalupe Villanueva Carrasco INGENIERIA EN SISTEMAS COMPUTACIONALES.
1 Conferencia 5 OLAP. 2 Contenido Definición OLAP. Reglas de Codd. Gestores que dan soporte OLAP y los diferentes modos de Almacenamiento.
Data Warehouse - OLAP.
Transcripción de la presentación:

Relaciones entre minería de datos, bodegas de datos y OLAP Tema 3 Dr. Francisco J. Mata

Arquitectura de los datos Minería de datos, técnicas de minería de datos Conocimiento Reglas de negocio Bodegas de datos, OLAP Nivel de abstracción Información Datos de resumen Bases de datos, OLTP Datos Datos operacionales Detalle Dr. Francisco J. Mata

Arquitectura de los datos Datos operacionales Forma más básica de datos Asociados con sistemas operacionales Bases de datos operacionales OLTP: “online transaction processing” Dr. Francisco J. Mata

Arquitectura de los datos Datos de resumen Derivados de datos operacionales Forma más común que los usuarios interactúan con los datos Datos en reportes que presentan una visión estática del negocio Condensar Sumarizar Agregar Dr. Francisco J. Mata

Arquitectura de los datos Datos de resumen Entender datos y las dimensiones utilizadas para su resumen que representan áreas de acción en el negocio Región Producto Dr. Francisco J. Mata

Arquitectura de los datos Datos de resumen Asociados con sistemas para toma de decisiones Bodegas de datos OLAP: “On-line Analytical Processing Dr. Francisco J. Mata

Arquitectura de los datos Datos de resumen Bodegas de datos Orientadas a temas Clientes Proveedores Productos Integradas Múltiples fuentes heterogéneas de datos Bases de datos Archivos Registros de transacciones en línea Dr. Francisco J. Mata

Arquitectura de los datos Datos de resumen Bodegas de datos Dependientes del tiempo Proveen información desde una perspectiva histórica Todas las estructuras de datos tienen explícito o implícito un elemento de tiempo No-volátil Se encuentran almacenadas físicamente separadas de los datos operacionales No requiere mecanismos para procesamiento de transacciones, recuperación y control de concurrencia Dr. Francisco J. Mata

OLTP versus OLAP Característica OLTP OLAP Objeto Procesamiento operacional Procesamiento informacional Orientación Transacciones Análisis Función Operaciones diarias Información de largo plazo, apoyo a decisiones Diseño Basado en modelo entidad-relación, orientado a aplicaciones Basado en modelo estrella/copo de nieve, orientado a temas Datos actuales; actualizados a la fecha Históricos; precisión en el tiempo Dr. Francisco J. Mata

OLTP versus OLAP Característica OLTP OLAP Nivel de sumarización Poco, mucho detalle Intermedio a mucho, sumarizados o consolidados Vista Detallada y usualmente plana Sumarizada, multidimensional (cubos) Números de registros accesados Decenas Miles o millones Número de usuarios Miles Cientos Tamaño de la base de datos 100 MB a GB 100 GB a TB Dr. Francisco J. Mata

OLTP versus OLAP Característica OLTP OLAP Prioridad Alto desempeño, alta disponibilidad Gran flexibilidad, autonomía de los usuarios Métrica “Throughput” de transacciones “Throughput” de consultas, tiempo de respuesta Dr. Francisco J. Mata

Ejemplo datos de resumen Grados Bachilleratos Licenciatura Maestría Año 1998 1999 2000 2001 2002 Centro educativo Universidades públicas Universidad de Costa Rica 58 110 99 128 7 2 20 10 9 19 35 Universidad Nacional 66 114 57 107 96 17 12 18 N/O 27 24 16 Instituto Tecnológico de Costa Rica 37 38 76 85 23 21 26 Universidades privadas Universidad Latina 40 78 156 106 210 13 Universidad Interamericana 1  0 29 Universidad Hispanoamericana 32 33 42 15 Dr. Francisco J. Mata

Ejemplo cubo Año Centros de enseñanza Grados 1998 1999 2000 2001 2002 1998 1999 2000 2001 2002 UCR 58 110 99 128 128 Públicos UNA 66 114 57 107 96 ITCR 37 57 38 76 85 ULat 40 78 156 106 210 Maestría Privados UInt 1 0 9 7 29 Licenciatura UHis 9 27 32 33 42 Grados Bachillerato Dr. Francisco J. Mata

Arquitectura de los datos Reglas de negocios Describen por qué existen relaciones entre los datos Son difíciles de capturar Técnicas de minería de datos producen tales reglas Dr. Francisco J. Mata

Bodegas de datos y minería de datos Existencia de una bodega de datos facilita la recolección de información en la minería de datos Sin embargo, la minería de datos no requiere la existencia de una bodega de datos Dr. Francisco J. Mata

OLAP y minería de datos OLAP es una herramienta útil para visualización y pude ser utilizada en conjunto con técnicas de descubrimiento indirecto de conocimiento OLAP no es minería de datos Dr. Francisco J. Mata