La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Sistematización de Conceptos

Presentaciones similares


Presentación del tema: "Sistematización de Conceptos"— Transcripción de la presentación:

1 Sistematización de Conceptos
DATA WAREHOUSE UNIVERSIDAD SAN PEDRO – HZ ING. Juan Carlos Tarazona Jimenez Fuente: Investigación y Sistematización de Conceptos HEFESTO Ing. Bernabeu, Ricardo Dario

2 ...si supiese qué es lo que estoy haciendo,
no lo llamaría INVESTIGACIÓN... Albert Einstein

3 BUSINESS INTELLIGENCE
Se puede describir BI, como un concepto que integra por un lado el almacenamiento y por el otro el procesamiento de grandes cantidades de datos, con el principal objetivo de transformarlos en conocimiento y en decisiones en tiempo real, a través de un sencillo análisis y exploración. La definición antes expuesta puede representarse a través de la siguiente fórmula:

4 Existe una definición muy popular acerca de BI, que dice: “Inteligencia de Negocios es el proceso de convertir datos en conocimiento y el conocimiento en acción, para la toma de decisiones”.

5 Proceso de BI

6 Fase 1 – Dirigir y Planear
Fase 1 – Dirigir y Planear. En esta fase inicial es donde se deberán recolectar los requerimientos de información específicos de los diferentes usuarios, así como entender sus diversas necesidades, para que luego en conjunto con ellos se generen efectivamente las preguntas que les ayudarán a alcanzar sus objetivos. Fase 2 – Recolección de Información. Es aquí en donde se realiza el proceso de extraer desde las diferentes fuentes de información de la empresa, tanto internas como externas, los datos que serán necesarios para encontrar las respuestas a las preguntas planteadas en el paso anterior. Fase 3 – Procesamiento de Datos. En esta fase es donde se integran y cargan los datos en crudo en un formato utilizable para el análisis. Esta actividad puede realizarse mediante la creación de una nueva base de datos, agregando datos a una base de datos ya existente o bien consolidando la información. Fase 4 – Análisis y Producción. Ahora, se procederá a trabajar sobre los datos extraídos e integrados, utilizando herramientas y técnicas propias de la tecnología BI, para crear inteligencia. Como resultado final de esta fase se obtendrán las respuestas a las preguntas, mediante la creación de reportes, indicadores, etc. Fase 5 – Difusión. Finalmente se les entregará a los usuarios que lo requieran las herramientas necesarias, que les permitirán explorar los datos de manera veloz y sencilla.

7 DATA WAREHOUSE El DW posibilita la extracción de datos de sistemas operacionales y fuentes externas, permite la integración y homogenización de los datos de toda la empresa, provee información que ha sido transformada y sumarizada, para que ayude en el proceso de toma de decisiones estratégicas y tácticas. El DW, convertirá entonces los datos operacionales de la empresa en una herramienta competitiva, debido a que pondrá a disposición de los usuarios indicados la información pertinente, correcta e integrada, en el momento que se necesita.

8 Una de las definiciones más famosas sobre DW, es la de W. H
Una de las definiciones más famosas sobre DW, es la de W. H. Inmon, quien define: “Un Data Warehouse es una colección de datos orientada al negocio, integrada, variante en el tiempo y no volátil para el soporte del proceso de toma de decisiones de la gerencia”.

9 ARQUITECTURA DEL DATA WAREHOUSE

10 Base de datos multidimensional
Las bases de datos multidimensionales, proveen una estructura que permite tener acceso flexible a los datos, para explorar y analizar sus relaciones, y resultados consiguientes. Estas se pueden visualizar como un cubo multidimensional, en donde las variables asociadas existen a lo largo de varios ejes o dimensiones, y la intersección de las mismas representa la medida, indicador o el hecho que se esta evaluando.

11 Los mencionados esquemas pueden ser implementados de diversas maneras, que, independientemente al tipo de arquitectura, requieren que toda la estructura de datos este desnormalizada o semi desnormalizada, para evitar desarrollar uniones (Join) complejas para acceder a la información, con el fin de agilizar la ejecución de consultas. Los diferentes tipos de implementación son los siguientes: Relacional – ROLAP8. Multidimensional – MOLAP9. Híbrido – HOLAP10.

12 Tablas de Dimensiones Las tablas de dimensiones definen como están los datos organizados lógicamente y proveen el medio para analizar el contexto del negocio. Representan los ejes del cubo, y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la tabla de hechos.

13 Tablas de Hechos Las tablas de hechos contienen los hechos, medidas o indicadores que serán utilizados por los analistas de negocio para apoyar el proceso de toma de decisiones. Los hechos son datos instantáneos en el tiempo, que son filtrados, agrupados y explorados a través de condiciones definidas en las tablas de dimensiones.

14 Esquema en Estrella El esquema en estrella, consta de una tabla de hechos central y de varias tablas de dimensiones relacionadas a esta, a través de sus respectivas claves. En la siguiente figura se puede apreciar un esquema en estrella estándar:

15 El modelo ejemplificado cuando se abordo el tema de las tablas de hechos, es un esquema en estrella, por lo cual se lo volverá a mencionar para explicar sus cualidades.

16 Este modelo debe estar totalmente desnormalizado, es decir que no puede presentarse
en tercera forma normal (3ra FN), es por ello que por ejemplo, la dimensión “PRODUCTOS” contiene los atributos “Rubro”, “Tipo” y “NombreProducto”. Si se normaliza esta tabla, se obtendrá el siguiente resultado: Figura

17 Esquema Copo de Nieve

18 Esquema Constelación Este modelo está compuesto por una serie de esquemas en estrella, y tal como se puede apreciar en la siguiente figura, está formado por una tabla de hechos principal (“HECHOS_A”) y por una o más tablas de hechos auxiliares (“HECHOS_B”), las cuales pueden ser sumarizaciones de la principal. Dichas tablas yacen en el centro del modelo y están relacionadas con sus respectivas tablas de dimensiones.

19 Cubo Multidimensional

20 METODOLOGÍA HEFESTO HEFESTO es una metodología propia, cuya propuesta está fundamentada en una muy amplia investigación, comparación de metodologías existentes y experiencias propias en procesos de confección de almacenes de datos. La idea principal, es comprender cada paso que se realizará, para no caer en el tedio de tener que seguir un método al pie de la letra sin saber exactamente qué se está haciendo, ni por qué.

21 Descripción

22

23 Características Esta metodología cuenta con las siguientes características: Los objetivos y resultados esperados en cada fase se distinguen fácilmente y son sencillos de comprender. Se basa en los requerimientos del usuario, por lo cual su estructura es capaz de adaptarse con facilidad y rapidez ante los cambios en el negocio. Reduce la resistencia al cambio, ya que involucra al usuario final en cada etapa para que tome decisiones respecto al comportamiento y funciones del DW. Utiliza modelos conceptuales y lógicos, los cuales son sencillos de interpretar y analizar. Es independiente del tipo de ciclo de vida que se emplee para contener la metodología. Es independiente de las herramientas que se utilicen para su implementación. Es independiente de las estructuras físicas que contengan el DW y de su respectiva distribución. Cuando se culmina con una fase, los resultados obtenidos se convierten en el punto de partida para llevar a cabo el paso siguiente. Se aplica tanto para DM como para DW.

24 Pasos y aplicación metodológica
PASO 1) ANÁLISIS DE REQUERIMIENTOS El primer paso comienza con el acopio de las necesidades de información, el cual puede llevarse a cabo a través de muy variadas y diferentes técnicas, cada una de las cuales poseen características inherentes y específicas, como por ejemplo entrevistas, cuestionarios, observaciones, etc. El análisis de los requerimientos de los diferentes usuarios, es el punto de partida de esta metodología, ya que ellos son los que deben, en cierto modo, guiar la investigación hacia un desarrollo que refleje claramente lo que se espera del depósito de datos, en relación a sus funciones y cualidades.


Descargar ppt "Sistematización de Conceptos"

Presentaciones similares


Anuncios Google