La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Unidad de Aprendizaje DATA WAREHOUSE I Tema: PRESENTACIÓN E INTRODUCCIÓN Dra. Carmen Liliana Rodríguez Páez Ingenieriera en Sistemas Inteligentes Universidad.

Presentaciones similares


Presentación del tema: "Unidad de Aprendizaje DATA WAREHOUSE I Tema: PRESENTACIÓN E INTRODUCCIÓN Dra. Carmen Liliana Rodríguez Páez Ingenieriera en Sistemas Inteligentes Universidad."— Transcripción de la presentación:

1 Unidad de Aprendizaje DATA WAREHOUSE I Tema: PRESENTACIÓN E INTRODUCCIÓN Dra. Carmen Liliana Rodríguez Páez Ingenieriera en Sistemas Inteligentes Universidad Autónoma del Estado de México Unidad Academica Profesional Nezahualcóyotl

2 DIRECTORIO DE LA UAEM Dr. en D. Jorge Olvera García Rector Dr. en Ed. Alfredo Barrera Baca Secretario de Docencia Dra. en Est. Lat. Ángeles Ma. del Rosario Pérez Bernal Secretaria de Investigación y Estudios Avanzados Dr. en D. José Benjamín Bernal Suárez Secretario de Rectoría Mtra. en E. P. D. Ivett Tinoco García Secretaria de Difusión Cultural Mtro. en C. I. Ricardo Joya Cepeda Secretario de Extensión Vinculación Mtro. en E. Javier González Martínez Secretario de Administración Dr. en C. Pol. Manuel Hernández Luna Secretario de Planeación y Desarrollo Institucional Mtra. en A. Ed. Yolanda E. Ballesteros Sentíes Secretaria de Cooperación Internacional Dr. en. D Hiram Raúl Piña Libien Abogado General Lic. en Com. Juan Portilla Estrada Director General de Comunicación Universitaria Lic. Jorge Bernaldez García Secretario Técnico de la Rectoría Mtro. en A. Emilio Tovar Pérez Director General de Centros Universitarios y Unidades Académicas Profesionales Mtro. en A. Ignacio Gutiérrez Padilla Contralor DIRECTORIO DE LA UAP-NEZAHUALCÓYOTL Dr. en C.E. Luis Ramón López Gutiérrez Coordinador Dr. en F.M. Israel Gutiérrez González Subdirector Académico Lic. en E. Alfredo Ríos Flores Subdirector Administrativo Dra. en C. S. María Luisa Quintero Soto Coordinadora de Investigación y Estudios Avanzados Lic. en A. E. Víctor Manuel Durán López Coordinador de Planeación y Desarrollo Institucional Dr. en E. Selene Jiménez Bautista Coordinadora de la Licenciatura en Comercio Internacional Dra. en C. Georgina Contreras Landgrave Coordinadora de la Licenciatura en Educación para la Salud Dra. en C. Dora María Calderón Nepamuceno Coordinadora de Ingeniería en Sistemas Inteligentes Mtro. en C. Juan Antonio Jiménez García Coordinador de Ingeniería en Transporte

3 Ubicación de la asignatura Data Warehouse I dentro del programa de la Lic. en Ingeniería en Sistemas Inteligentes

4 DATA WAREHOUSE I Unidad I. INTRODUCCIÓN 1.1. Introducción 1.2. Antecedentes 1.3. Definición según (INMON Y KIMBALL) 1.4 Enfoque Kimball 1.5. Proceso transaccional vs proceso analítico 1.6 ¿Por qué es necesario un data? 1.7. Ciclo de vida Kimball Contenido Sintético

5 Data Warehouse es un almacén con todos los datos que son necesarios o útiles en una organización, es decir, es una base de datos, en un sentido amplio, que se transforma en información útil para el usuario. En los periodo de crisis tener un buen data WareHouse es importantísimo, ya que se dispone de la información óptima. Esto nos permite generar un conocimiento que será útil en la toma de decisiones. Cuanto mejor es la información, mejor será el resultado y, por tanto, la rentabilidad. Presentación

6 Data Warehouse I El propósito del presente material tiene como objetivo cubrir la presentación y primera unidad del programa de estudios de Data warehouse I; correspondiente a la Unidad I. Conocer las etapas y procesos de la extracción de conocimiento en base de datos, la preparación de los datos como la recopilación, limpieza, transformación, exploración y selección de datos.

7 7 Metodo y estilo de enseñanza Exposición en clase por parte del profesor, mesas de discusión, investigación documental y aplicación de los temas vistos en clase con una aplicación real, y exposición de temas relacionados a Data Warehouse.

8 8 Tener un mínimo de asistencia del 80% a las clases impartidas durante el semestre. El tiempo límite de entrada, cualquiera que fuese la hora o días es de 15min. Previo acuerdo con el grupo. Los alumnos que no presente la revisión el día que se aplica no tendrán derecho a presentarlo después. La entrega de trabajos solamente será el día y la hora marcados, sin excepción alguna (salvo casos de fuerza mayor con su justificante). La entrega de trabajos será impresos, por computadora y con la mejor presentación, de lo contrario no se aceptará. Lineamientos del curso (académicos)

9 9 Comprometerse a investigar y analizar los temas encomendados. Mantener la disciplina adecuada en el desarrollo de la clase. Mantener en buen estado (limpio) las aulas y laboratorios. Evitar interrupciones en la clase por aspectos personales (ventas de dulces, helados u otros, celular en silencio). Durante la clase que prohibido realizar trabajos ajenos a la misma. Lineamientos del curso (personales)

10 10 Comprometerse a investigar y analizar los temas encomendados. Mantener la disciplina adecuada en el desarrollo de la clase. Mantener en buen estado (limpio) las aulas y laboratorios. Evitar interrupciones en la clase por aspectos personales (ventas de dulces, helados u otros, celular en silencio). Durante la clase que prohibido realizar trabajos ajenos a la misma. Lineamientos del curso (personales)

11 11 Comprometerse a investigar y analizar los temas encomendados. Mantener la disciplina adecuada en el desarrollo de la clase. Mantener en buen estado (limpio) las aulas y laboratorios. Evitar interrupciones en la clase por aspectos personales (ventas de dulces, helados u otros, celular en silencio). Durante la clase que prohibido realizar trabajos ajenos a la misma. Lineamientos del curso (personales)

12 Antecedentes sobre el concepto de DW  El concepto no es nuevo ( a principios de los ochenta)  Esfuerzo iniciales se deben a: – Devlin and Murphy (1997) – IBM  Definición de Inmon (1990)  Múltiples definiciones

13 13 Evaluación Y acreditación PRIMER PARCIAL: Evaluación escrita 50% Fecha de aplicación 30-09-2015 8:00 a.m. SEGUNDO PARCIAL: Evaluación escrita 50% Fecha de aplicación 24-11-2015 8:00 a.m. Participación en clase 10% Trabajos 40% Calificación final: 100%

14 14 Evaluación y acreditación Ordinario Examen escrito 70% Proyecto 30% Fecha y hora de aplicación: 11/12/2015 – 08:00 a.m. Tener mínimo de asistencia de 80% a las clases y cubrir con una media de 8.0 para exentar (Art. 108). Extraordinario Examen escrito 80% Proyecto 20% Fecha y hora de aplicación : 18/12/2015 – 08:00 a.m. Tener mínimo de asistencia al 60% de las clases No haber presentado evaluación ordinaria o haber reprobado ésta. Pagar los derechos correspondientes (Art. 110)

15 15 Evaluación y acreditación Título de suficiencia Examen escrito 90% Proyecto 10% Fecha y hora de aplicación : 15/01/2016 – 08:00 a.m. Tener mínimo de asistencia del 30% a las clases No haber presentado extraordinario o haber reprobado ésta. Pagar los derechos correspondientes (Art. 111).

16 Antecedentes sobre el concepto de DW  Es un término confuso?  Almacenamiento/acumulación  Distribución /diseminación  Data warehouse Vs data warehousing

17 Definición (Inmon) Un Data Warehouse o depósito o almacén de datos es una colección de datos: orientado a temas, integrado, no volátil, de tiempo variante, que se usa de soporte al proceso de toma de decisiones. William Inmon

18 Qué es un Data Warehouse? Según Inmon es: Orientado a sujetos Integrado Variante en el tiempo No volátil

19 Definición (Inmon) Orientado a temas (aislado): un DW es orientado a temas, ya que la información se clasifica alrededor de sujetos, que son de interés para la empresa, por ejemplo: Operacional: apoya a ventas, compras, prestamos, etc. Para u fabricante: cliente, productos, proveedores, vendedores. Universidad: alumnos, clases y profesores. Hospital: pacientes, médicos, medicamentos, etc.

20 Definición (Inmon) Integrado: la integración de datos se muestra en muchas maneras: en convenciones de nombres consistentes, en la medida uniforme de variables; en la codificación de estructuras consistentes, etc. Ej: ¿Ventas – Compras? Como homogenizar (capa intermedia) Convenciones de nombres. Se acuerda una convención de nombres cuando el mismo elemento es referido por nombres diferentes en las diversas aplicaciones.

21 Definición (Inmon) Medida de atributos. Por ejemplo si en los datos almacenados están en centímetros o pulgadas, cuando la información llegue al DW se habrá transformado previamente a la misma unidad de medida Codificación: suponiendo que el genero de una persona se codifica de diferente forma en un sistema A que en un sistema B; de cualquier fuente de donde venga, el genero debe llegar al DW en un estado integrado.

22

23 Definición (Inmon) No volátil: la información es útil, sólo cuando es estable. En un ambiente operacional los datos se insertan, borran y modifican; pero un DW la manipulación de los datos es mucho mas simple, ya que solo hay dos únicos tipos de operaciones: la carga inicial de datos y el acceso a los mismos. Dicho de otra manera, cuando un dato tenga un valor, generalmente no se actualizará el valor anterior, sino que se introducirá un nuevo registro con el valor actual. Como regla general, una vez incorporada la información en el DW debe mantenerse en él invariable.

24 Definición (Inmon) De tiempo variante: un factor clave en la toma de decisiones es poder contar con información histórica para comparar datos en distintos periodos y poder identificar tendencias, por esto cada registro del DW contiene, implícita o explícitamente, un elemento de tiempo como día, semana, mes, etc.

25 Definición (Kimball) “Un Data Warehouse es una copia de datos transaccionales, específicamente diseñada para realizar consultas y análisis” Ralph Kimball

26 Enfoque Kimball

27 El modelo se inicia con tablas: De hechos De dimensiones Los hechos contienen métricas Las dimensiones contienen atributos Enfoque Kimball

28 El modelo se inicia con tablas: De hechos De dimensiones Los hechos contienen métricas Las dimensiones contienen atributos Enfoque Kimball

29 Proceso transaccional vs proceso analítico Proceso transaccional Captura y almacenamiento de datos de la operación. Básico para operar el negocio. Proceso analítico Extracción del significado de las transacciones. La clave para mejorar el negocio.

30 Análisis del concepto de Data Warehouse El Data warehouse es una colección de datos que están almacenados en un lugar diferente a donde se almacenas los datos de las aplicaciones.

31 ¿Por qué es necesario un data Warehouse? Sistemas no integrados Múltiples e incompatibles estructuras de datos Muchos puntos de entrada a los datos Algunos datos inaccesibles Datos no siempre actualizados Formatos de datos no siempre consistentes Reportes de usuarios difíciles de obtener.

32 ¿Por qué es necesario un data Warehouse? Provee una vista única del negocio Asegura un modelo corporativo integrado Incrementa el rendimiento de los activos de información de la empresa Consolida datos de fuentes diferentes

33 Ciclo de vida kimball

34 Planificación del proyecto Requerimientos del negocio Línea tecnológica: Arquitectura Sección e instalación de productos: Línea de datos Modelo dimensional Modelo físico ETL Línea de aplicación de BI: Diseño del BI Desarrollo del BI Despliegue Crecimient

35 Resumen Un Data Warehouse permite obtener respuestas a preguntas clave del negocio. La calidad de los datos en un DW, conducirá a una reingeniería de las aplicaciones del negocio. Ilustra el flujo general de implementación de un DW. Identifica secuencia de tareas ordenadas y actividades principales. No todos los detalles de las tareas del ciclo deben ser ejecutados en todos los proyectos

36 Resumen Un Data Warehouse. Es un sistema que recupera y consolida información periódica obtenida de diferentes orígenes de datos con el fin de almacenarlo en otros nuevos almacenes que son de tipo dimensionales o normalizados. Contiene información histórica Puede ser utilizado con acciones de business intelligence. Se actualiza en forma batch, que participa en un sistema transaccional de datos.

37 Elaboro: Doricela Gutierrez Cruz37 REFERENCIAS Reporte técnico: Diseño e implantación de sistemas de bases de datos para el apoyo de toma de decisiones. Caso Data Warehousing, maestría en Ciencias en Ingeniería de Sistemas, SEPI, ESIME, IPN, Mexico, 2008, Galindo L. Data Warehousing: A methodology of the construction of stores of infromation, Advance in artificial Inteligence and Computer Science Vo 14, Research n Computing Sciencia, Eds. Gelbkh A., Yañez C., Camacho O., ISSN: 1665- 9899. Galindo, 2005. The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling. Ralph Kimball and Margy Ross (Apr 26, 2002). Data Warehouse Design: Modern Principles and Methodologies, Matteo Golfarelli and Stefano Rizzi. The Data Warehouse Lifecycle Toolkit, Ralph Kimball, Margy Ross, Warren Thornthwaite and Joy Mundy. The Microsoft Data Warehouse Toolkit: With SQL Server 2008 R2 and the Microsoft Business Intelligence Toolset, Joy Mundy, Warren Thornthwaite and Ralph Kimball. Building a Data Warehouse: With Examples in SQL Server (Expert's Voice) Vincent Rainardi. Kimball's Data Warehouse Toolkit Classics: The Data Warehouse Toolkit, 2nd Edition; The Data Warehouse Lifecycle, 2nd Edition. The Data Warehouse ETL Toolk, Ralph Kimball, Margy Ross, Bob Becker and Joy Mundy. Mastering Data Warehouse Aggregates: Solutions for Star Schema Performance, Christopher Adamson. Data Modeling Techniques for Data Warehousing SG24-2238-00, Chuck Ballard, Dirk Herreman, Don Schau, Rhonda Bell, Eunsaeng Kim, Ann Valencic. International Business Machines Corporation 1998, ISBN 0738402451. Dimensional Modeling:In a Business Intelligence Environment, Chuck Ballard, Daniel M. Farrell, Amit Gupta, Carlos Mazuela, Stanislav Vohnik. International Business Machines Corporation 2006, ISBN 0738496448.


Descargar ppt "Unidad de Aprendizaje DATA WAREHOUSE I Tema: PRESENTACIÓN E INTRODUCCIÓN Dra. Carmen Liliana Rodríguez Páez Ingenieriera en Sistemas Inteligentes Universidad."

Presentaciones similares


Anuncios Google