La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

OLAP vs OLTP.

Presentaciones similares


Presentación del tema: "OLAP vs OLTP."— Transcripción de la presentación:

1 OLAP vs OLTP

2 OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de transacciones. OLAP (On Line Analytic Processing) (Procesamiento analítico en línea) Bases de datos orientadas al procesamiento analítico. OLTP Insert Delete Update Select ACID OLAP OLTP: Una transacción que puede involucrar operaciones de inserción, modificación y borrado de datos. OLAP: la lectura de grandes cantidades de datos para llegar a extraer algún tipo de información útil: tendencias de ventas, patrones de comportamiento de los consumidores, elaboración de informes complejos… etc

3 OLAP Permite a los usuarios de negocio examinar minuciosamente los datos a su antojo. Normalmente, los datos en una organización se distribuyen en múltiples fuentes de datos y son incompatibles entre sí. Un ejemplo de venta: Los datos de punto de ventas y las ventas realizadas a través del call-center o en la web se almacenan en lugares y formatos diferentes. Para un ejecutivo obtener informes OLAP como - ¿Cuáles son los productos más populares comprados por clientes entre las edades de 15 a 30? es un proceso que lleva tiempo.

4 Un ejemplo de datos incompatibles:
Parte del proceso de implementación OLAP consiste en extraer los datos de diferentes repositorios y hacerlos compatibles. Hacer compatibles los datos consiste en garantizar que el significado de los datos en un repositorio coincida con el de otros repositorios. Un ejemplo de datos incompatibles: Las edades de los clientes se pueden almacenar como fecha de nacimiento en las compras realizadas a través de Internet y almacenarse en categorías de edad (es decir, entre 15 y 30) para ventas en las tiendas.

5 OLAP vs. OLTP Sistema Operacional (OLTP)
Data Warehouse (Basado en Modelos Dimensionales: OLAP) Almacena datos actuales. Almacena datos históricos. Almacena datos de detalle. Amacena datos de detalle y datos agregados a distintos niveles. Los datos son dinámicos (actualizables). Los datos son estáticos. Las transacciones son repetitivos. Los procesos no son previsibles. El número de transacciones es elevado. El número de transacciones es bajo o medio. Dedicado al procesamiento de transacciones. Dedicado al análisis de datos. Orientado a los procesos de la organización. Orientado a la información relevante. Soporta decisiones diarias. Soporta decisiones estratégicas. Sirve a muchos usuarios administrativos. Sirve a técnicos de dirección.

6 Data Warehouse El objetivo del almacenamiento de datos es generar un front-end de análisis que apoye a los ejecutivos de negocios y gerentes de operaciones.

7 Pre-Data Warehouse Limpieza de Datos
Proporciona los datos para el Data Warehouse. Metadatos garantiza la exactitud de los datos que entran en el proceso de ciclo de vida de los datos. Asegura que los datos tienen el formato y relevancia. Limpieza de Datos Antes de que los datos entren en el almacén de datos, la extracción, transformación y limpieza (ETL) asegura que los datos pasan el umbral de calidad de datos. ETLs son también responsables de las tareas programadas que extraer los datos de los OLTPs.

8 Repositorios de Datos El Data Warehouse es la base de datos que almacena datos activos de valor de negocio para una organización. Hay variantes de Almacenes de Datos - Data Marts y ODS. Los Data Marts no son físicamente diferentes de los almacenes de datos. Pueden ser vistos como pequeños data warehouses basados en un departamento en lugar de a nivel de toda la compañía. Un Data Warehouse recoge datos y es el depositario de datos históricos. Por lo tanto, no siempre es eficiente para proporcionar análisis hasta la fecha . Aquí es donde los ODS, almacenes de datos operativos, ayudan. Los ODSs se utilizan para mantener los datos más recientes antes de la migración hacia el Data Warehouse. ODS se utilizan para almacenar datos que tienen una historia más profunda que OLTPs. Mantener grandes cantidades de datos en OLTPs puede reducir la velocidad de procesamiento – imaginen esperar en el cajero automático 10 minutos entre las indicaciones para las entradas.

9 Análisis Front End Las aplicaciones de front-end que los usuarios de negocio a utilizan para interactuar con los datos almacenados en los repositorios. Data Mining: es el descubrimiento de patrones útiles en los datos. Por ejemplo, ¿Cuál es la probabilidad de que un cliente migre a un competidor? OLAP, procesamiento analítico en línea, se utiliza para analizar datos y a menudo son utilizados por los gerentes de marketing. Por ejemplo: ¿Cuántos clientes entre los años de edad, que viven en la provincia del Guayas, compran más de $1000 dólares en el supermercado en un mes? Las Herramientas de informes se utilizan para proporcionar informes sobre los datos. Las Herramientas de visualización de datos se usan para mostrar datos de un repositorio de datos. A menudo, la visualización de datos se combina con la minería de datos y herramientas OLAP. La Visualización de datos puede permitir al usuario manipular los datos para mostrar la relevancia y los patrones.

10 OLTP Ejemplos de OLTPs pueden incluir ERP, CRM, SCM, aplicaciones de Punto de Venta, Call Center. Están diseñados para una velocidad de transacción óptima. Los datos no se almacenan por un período prolongado en OLTPs, por costos de almacenamiento y las razones de velocidad de transacciones. Cuando un consumidor realiza una compra en línea, se espera que las transacciones se produzcan de forma instantánea. Con un diseño de base de datos se crea el registro rápido en la base de datos y los resultados pueden ser llamados por los administradores con la misma rapidez si es necesario. Modelo de Datos para un OLTP

11 OLAP Modelo Dimensional de Datos
OLAPs están diseñados para ofrecer un análisis general de lo que sucedió. Por lo tanto el almacenamiento de datos (es decir, el modelado de datos) tiene que establecerse de manera diferente. El método más común es el diseño de la estrella. Son distintos a la tercera forma normal, utilizados en sistemas OLTP. Usando el modelo de datos anteriores, es posible crear informes que responden a preguntas tales como:      El supervisor que dio la mayoría de los descuentos.      La cantidad enviada en una fecha determinada, mes, año o trimestre.      En cual código postal el producto A se vende más. El supervisor que dio la mayoría de los descuentos. La cantidad enviada en una fecha determinada, mes, año o trimestre. En cual código postal el producto A se vende más.

12 OLAP Para obtener respuestas, como las anteriores, a partir de un modelo de datos cubos OLAP se crean. Para los usuarios es llamado cubo mientras que para los desarrolladores modelo multidimensional. Cubos OLAP no son estrictamente cuboides - es el nombre dado al proceso de vinculación de datos desde las diferentes dimensiones. Tiempo Cliente Producto

13 Conceptos Dimensión: Es una categoría de información, por ejemplo, la dimensión del tiempo. Atributo: Es un nivel único dentro de una dimensión, por ejemplo Mes en la dimensión del tiempo. Jerarquía: La especificación de niveles que representa la relación entre los diferentes atributos en una dimensión, por ejemplo, Año->Trimestre->Mes->Día

14 Conceptos Tabla de hechos: La tabla de hechos contiene las medidas de interés. Por ejemplo, el monto de ventas puede ser esta medida. Esta medida puede ser almacenada en la tabla de hechos con la granularidad apropiada. Por ejemplo puede ser monto de ventas en cada tienda cada día.

15 Conceptos Granularidad: Se refiere al mínimo nivel de información que será almacenada en la tabla de hechos. Es el nivel de detalle.

16 Conceptos Tabla LookUp: Provee información detallada acerca de los atributos. Por ejemplo, una tabla LookUp para el atributo Trimestre incluiría una lista de información de todos los trimestres disponibles en el datawarehouse, y cada columna (cada trimestre) incluiría muchos campos entre ellos un id que identifique al Trimestre, y campos adicionales que especifiquen que tan particular es el trimestre (primer trimestre del año, etc.)

17 Enfoque Tecnológico Desktop OLAP (DOLAP)
El cubo se forma en el cliente Las operaciones las realiza el cliente una vez que se extrae la información de las bases. Motor Cubo Motor Cliente

18 Enfoque Tecnológico Relational OLAP (ROLAP)
El visualizador pregunta al cubo creado dónde está la base, ambos creados por el RDMS (motor), si se requiere algo de otra base, los motores interactúan y el cubo se forma con esos datos. Cliente

19 Enfoque Tecnológico Multidimensional OLAP (MOLAP)
El MDBMS forma la base, abstrayendo datos de otras bases RDBMS. El cubo es creado por el MDBMS WAC permite la manipulación del cubo. RDBMS MDBMS RDBMS Cliente

20 Enfoque Tecnológico Hibrid OLAP (HOLAP): Mezcla el multidimensional con el ROLAP.

21 Visualizando el Cubo.. El punto cartesiano es un conjunto de valores.
El cubo siempre va a tener la dimensión del tiempo. Gye Uio Cue Rio Ana Juan Mia Pablo 250 10 100 300 15 50 400 17 30 200 20

22 Visualizando el Cubo.. Drill UP, Drill Down, subo y bajo según mi granularidad lo permita. Cuando se quiere cambiar de columna, se lo hace bajo ciertas condiciones, como el efecto de la columna de pivoteo, al cambiarla, cambian sus coordenadas. Ana Juan Mia Pablo 2001 Gye Uio Cue Rio 2002 2003

23


Descargar ppt "OLAP vs OLTP."

Presentaciones similares


Anuncios Google