La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos aggregados –Analizar resultados –Visualizar resultados El conjunto.

Presentaciones similares


Presentación del tema: "Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos aggregados –Analizar resultados –Visualizar resultados El conjunto."— Transcripción de la presentación:

1 Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos aggregados –Analizar resultados –Visualizar resultados El conjunto de datos se representa como un espacio n-dimensional. La reducción dimensional se ejecuta mediante la sumarización sobre las dimensiones que son dejadas de lado

2 Ejemplo Ventas (storeId,itemId,timeId,…,monto) Store(storeId,nombre,region,pais,ciudad) Sumarizar por region: SELECT region,sum(monto) FROM Ventas V, Store S WHERE V.sotreId=S.storeId GROUP BY region

3 Sumarización Un problema n-dimensional se representa en un archivo de 2 dimensiones, con n dominions de atributos. Ej.: Clima(tiempo,lat.long,altit,temp, presion) 4 dimensiones, 2 medidas.

4 Problemas del Group By Es complicado para : –Histogramas –Roll-up –Subtotales, drill-dpown –Cross-tabs

5 Problemas (cont.) Histogramas –SELECT day,pais,max(temp) FROM ( SELECT day(time) as day, nation (lat,long) as pais FROM clima) as foo Group by day,pais Primero debe armar la tabla y luego agrupar.

6 Roll-up/drill-down ModeloAñoColorVentas por M,A,C Ventas por M,A Ventas por M M11990N50 B60 110 1991N60 B80 140250 M21990N100 B200 300 1991N100 B300 400700 950 Roll-Up

7 Solución en SQL ModeloA~oColorVentasVentas x M,A Ventas x M,C Ventas x M M11990N50110 250 M11990B60110140250 M11991N60140110250 M11991B80140 250 M21990N100300200700 M21990B200300500700

8 Problema Aumento de la cantidad de columnas P.ej: 6 dimensiones =>64 columnas Alternativa: introducir un valor “ALL”. El nro de columnas permanece constante

9 Data Cube ModeloAñoColorVentas M11990N50 M11990B60 M11990All110 M11991N60 M11991B80 M11991All140 M21990N100 ….

10 Data Cube (cont.) ModeloAñoColorVentas M21990B200 M21990All300 M21991N100 M21991B300 M21991All400 M2All 750 M1All 250 All 950

11 Data Cube (cont.) ModeloAñoColorVentas M1AllN110 M1AllB140 M2AllN200 M2AllB500

12 Operador CUBE en SQL SELECT “ALL”, “ALL, “ALL”, SUM (ventas) FROM Sales UNION SELECT Modelo, “ALL, “ALL”, SUM (ventas) FROM Sales GROUP BY Modelo UNION SELECT Modelo, “ALL”,Color, SUM (ventas) FROM Sales GROUP BY Modelo,Color UNION ……


Descargar ppt "Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos aggregados –Analizar resultados –Visualizar resultados El conjunto."

Presentaciones similares


Anuncios Google