La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Dr. Francisco J. Mata 1 Relaciones entre minería de datos, bodegas de datos y OLAP Tema 3.

Presentaciones similares


Presentación del tema: "Dr. Francisco J. Mata 1 Relaciones entre minería de datos, bodegas de datos y OLAP Tema 3."— Transcripción de la presentación:

1 Dr. Francisco J. Mata 1 Relaciones entre minería de datos, bodegas de datos y OLAP Tema 3

2 2Dr. Francisco J. Mata Arquitectura de los datos Datos operacionales Datos de resumen Reglas de negocio Detalle Nivel de abstracción Bases de datos, OLTP Bodegas de datos, OLAP Minería de datos, técnicas de minería de datos Datos Información Conocimiento

3 3Dr. Francisco J. Mata Arquitectura de los datos Datos operacionales Forma más básica de datos Forma más básica de datos Asociados con sistemas operacionales Asociados con sistemas operacionales Bases de datos operacionales OLTP: online transaction processing

4 4Dr. Francisco J. Mata Arquitectura de los datos Datos de resumen Derivados de datos operacionales Derivados de datos operacionales Forma más común que los usuarios interactúan con los datos Forma más común que los usuarios interactúan con los datos Datos en reportes que presentan una visión estática del negocio Datos en reportes que presentan una visión estática del negocioCondensarSumarizarAgregar

5 5Dr. Francisco J. Mata Arquitectura de los datos Datos de resumen Entender datos y las dimensiones utilizadas para su resumen que representan áreas de acción en el negocio Entender datos y las dimensiones utilizadas para su resumen que representan áreas de acción en el negocioRegiónProducto

6 6Dr. Francisco J. Mata Arquitectura de los datos Datos de resumen Asociados con sistemas para toma de decisiones Asociados con sistemas para toma de decisiones Bodegas de datos OLAP: On-line Analytical Processing

7 7Dr. Francisco J. Mata Arquitectura de los datos Datos de resumen Bodegas de datos Bodegas de datos Orientadas a temas Clientes Clientes Proveedores Proveedores Productos ProductosIntegradas Múltiples fuentes heterogéneas de datos Múltiples fuentes heterogéneas de datos Bases de datos Archivos Registros de transacciones en línea

8 8Dr. Francisco J. Mata Arquitectura de los datos Datos de resumen Bodegas de datos Bodegas de datos Dependientes del tiempo Proveen información desde una perspectiva histórica Proveen información desde una perspectiva histórica Todas las estructuras de datos tienen explícito o implícito un elemento de tiempo Todas las estructuras de datos tienen explícito o implícito un elemento de tiempoNo-volátil Se encuentran almacenadas físicamente separadas de los datos operacionales Se encuentran almacenadas físicamente separadas de los datos operacionales No requiere mecanismos para procesamiento de transacciones, recuperación y control de concurrencia No requiere mecanismos para procesamiento de transacciones, recuperación y control de concurrencia

9 9Dr. Francisco J. Mata OLTP versus OLAP CaracterísticaOLTPOLAP ObjetoProcesamientooperacional Procesamiento informacional OrientaciónTransaccionesAnálisis Función Operaciones diarias Información de largo plazo, apoyo a decisiones Diseño Basado en modelo entidad-relación, orientado a aplicaciones Basado en modelo estrella/copo de nieve, orientado a temas Datos actuales; actualizados a la fecha Históricos; precisión en el tiempo

10 10Dr. Francisco J. Mata OLTP versus OLAP CaracterísticaOLTPOLAP Nivel de sumarización Poco, mucho detalle Intermedio a mucho, sumarizados o consolidados Vista Detallada y usualmente plana Sumarizada, multidimensional (cubos) Números de registros accesados Decenas Miles o millones Número de usuarios MilesCientos Tamaño de la base de datos 100 MB a GB 100 GB a TB

11 11Dr. Francisco J. Mata OLTP versus OLAP CaracterísticaOLTPOLAP Prioridad Alto desempeño, alta disponibilidad Gran flexibilidad, autonomía de los usuarios Métrica Throughput de transacciones Throughput de consultas, tiempo de respuesta

12 12Dr. Francisco J. Mata Ejemplo datos de resumen GradosBachilleratosLicenciaturaMaestría Año199819992000200120021998199920002001200219981999200020012002 Centro educativo Universidades públicas Universidad de Costa Rica5811099128 72022201091935 Universidad Nacional6611457107961720121718N/O 272416 Instituto Tecnológico de Costa Rica3757387685N/O 1623212619 Universidades privadas Universidad Latina40781561062105737351323N/O Universidad Interamericana1 09729N/O 22720 Universidad Hispanoamericana927323342215109N/O

13 13Dr. Francisco J. Mata Ejemplo cubo UCR UNA ITCR ULat UInt UHis 1998 1999 2000 2001 2002 58 110 99 128 128 66 114 57 107 96 37 57 38 76 85 40 78 156 106 210 1 0 9 7 29 9 27 32 33 42 Bachillerato Licenciatura Maestría Públicos Privados Centros de enseñanza Año Grados

14 14Dr. Francisco J. Mata Arquitectura de los datos Reglas de negocios Describen por qué existen relaciones entre los datos Describen por qué existen relaciones entre los datos Son difíciles de capturar Son difíciles de capturar Técnicas de minería de datos producen tales reglas Técnicas de minería de datos producen tales reglas

15 15Dr. Francisco J. Mata Bodegas de datos y minería de datos Existencia de una bodega de datos facilita la recolección de información en la minería de datos Sin embargo, la minería de datos no requiere la existencia de una bodega de datos

16 16Dr. Francisco J. Mata OLAP y minería de datos OLAP es una herramienta útil para visualización y pude ser utilizada en conjunto con técnicas de descubrimiento indirecto de conocimiento OLAP no es minería de datos


Descargar ppt "Dr. Francisco J. Mata 1 Relaciones entre minería de datos, bodegas de datos y OLAP Tema 3."

Presentaciones similares


Anuncios Google