TEMA - 4 BASE DE DATOS SICI-3211 MIS TEMA - 4 BASE DE DATOS SICI-3211 Dr. Nelliud D. Torres Batista http://classes.uleth.ca/201401/mgt3061a/ 14/04/2017
Objetivos del Capítulo Definición de Base de Datos Componentes de un Sistema Manejador de Bases de Datos (DBMS) Modelos de Bases de Datos Diseño de Base de Datos Data Warehouse / Data Mart / Data Minning 14/04/2017
Definición de Base de Datos 14/04/2017 Pag: 43
Managing data and information MBNA Usualmente las organizaciones generan muchos datos constantemente ¿Cómo una organización organiza todos sus datos y la información que genera? Base de Datos – Una Colección de archivos integrados y relacionados entre si. Ejemplos: Ebay Proquest Facebook Gmail
What is Database Technology ? Una colección de datos relacionados organizado de tal forma que los hace valioso y útil. Permite a las organizaciones recuperar (retrieve), almacenar (store) y analizar la información fácilmente. Es vital para el éxito de una organización para ejecutar operación es y tomar decisiones. Database Collection of related data that can be stored in a central location or in multiple locations Usually a group of files File Group of related records All files are integrated Record Group of related fields Data hierarchy
The Hierarchy of Data Bit (a binary digit): a circuit that is either on or off Byte: 8 bits Character: each byte represents a character; the basic building block of information Field --- Individual characteristics about an ENTITY. Fields are also called attributes or columns depending on the type of DBMS Record: A group of fields or attributes to describe a single instance of an ENTITY. These are also called rows depending on the DBMS File: A collection of records or instances for a given ENTITY. These are also called tables, depending on the DBMS Database: A collection of files or entities containing information to support a given system or a particular topic area Hierarchy of data Bits, characters, fields, records, files, and databases
Types of Data in a Database Datos Internos (Internal data) Son los datos que se colectan (generan) dentro de la misma organización Datos Externos (External data) Posibles fuentes de datos externos: Competitors, customers, and suppliers Distribution networks Economic Government regulations Labor and population statistics Tax records functional information systems Internal data is collected from within an organization and can be transaction records, sales records, personnel records, and so forth. An organization might use internal data on customers’ past purchases to generate BI about future buying patterns, for example. Internal data is usually stored in the organization’s internal databases and can be used b examples of sources for external data: • Competitors, customers, and suppliers • Distribution networks • Economic indicators ( for example, the consumer price index) • Government regulations • Labor and population statistics • Tax records functional information systems.
Databases Las Bases de Datos son componentes críticos de los Sistemas de Información. Cualquier tipo de análisis que se hace en una organización, se basa en datos disponibles de la base de datos. Database Management System (DBMS) Conjunto de programas que permiten crear, almacenar, mantener y acceder archivos de la base de datos Esto ofrece una ventaja sobre los antiguos sistemas de archivos (flat files). Enfoque Tradicional Vs Enfoque de Base de Datos
The Traditional Approach Payroll Grades Grades Student Tuition Student Tuition Traditional approach: separate data files are created for each application Results in data redundancy (duplication) Data redundancy conflicts with data integrity For now, take a look at Exhibit 3.2, which shows how users, the DBMS, and the database interact. The user issues a request, and the DBMS searches the data-base and returns the information to the user. In the past, data was stored in a series of fi les called “ fl at files,” because they weren’t arranged in a hierarchy and there was no relation among these fi les. The problem with this fl at fi le organization was that the same data could be stored in more than one fi le, creating data redundancy. For example, in a customer database, a customer’s name might be stored in more than one table. This duplication takes up unnecessary storage space and can make retrieving data inefficient. In addition, in a fl at fi le system, data might not be updated in all fi les consistently, resulting in conflicting reports generated from these fi les. Updating a fl at file system can also be time consuming. Parking Parking The Traditional Approach to Data Management - Archivos Secuenciales, Relativos e Indexados
Database management system The Database Approach Payroll Grades Payroll Grades Tuition Parking Database management system Tuition Database approach: pool of related data is shared by multiple applications Significant advantages over traditional approach The database approach to data management provides significant advantages over the traditional file-based approach. Define general data management concepts and terms, highlighting the advantages of the database approach to data management. Describe the relational database model and outline its basic features. Parking The Database Approach to Data Management - Combina automáticamente el uso de los archivos secuenciales, indexados y relativos.
Advantages of the Database Approach
Advantages of the Database Approach (Cont.)
Componentes de un Sistema Manejador de Bases de Datos (DBMS) 14/04/2017 Pag: 50
Exhibit 3.2 Interaction between the user, DBMC, and Database The major components of a DBMS are discussed in “ Components of a DBMS” later in the chapter. If you’re familiar with Microsoft Offi ce soft-ware, you know that you use Word to create a docu-ment and Excel to create a spreadsheet. You can also use Access to create and modify a database, although it doesn’t have as many features as other DBMSs. For now, take a look at Exhibit 3.2, which shows how users, the DBMS, and the database interact. The user issues a request, and the DBMS searches the data-base and returns the information to the user.
Components of a DBMS Database engine Data definition Data manipulation Application generation Data administration En los próximos slides explicamos cada uno de estos conceptos. A database engine, the heart of DBMS software, is responsible for data storage, manipulation, and retrieval. It converts logical requests from users into their physical equivalents.
Database Engine Es el corazón del software del DBMS Responsable del almacenamiento , manipulación y recuperación de los datos Convierte consultas (requests) de los usuarios en su equivalente físico. En otra palabras capacita al os usuarios a poder examinar los datos de una forma fácil y rápida. A database engine, the heart of DBMS software, is responsible for data storage, manipulation, and retrieval. It converts logical requests from users into their physical equivalents ( reports, for example) by interacting with other components of the DBMS ( usually the data manipulation component). For example, a marketing manager wants to see a list of the top three salespeople in the Southeast re-gion ( a logical request). The database engine interacts with the data manipulation component to fi nd where these three names are stored and displays them on screen or in a printout ( the physical equivalent). Because more than one logical view of data is possible, the database engine can retrieve and return data to users in many different ways.
Data Definition Crea y mantiene el diccionario de datos de la base de datos Define la estructura de archivos en una base de datos Adding fields Deleting fields Changing field size Changing data type The data definition component is used to create and maintain the data dictionary and define the structure of files in a database. Any changes to a database’s structure, such as adding fields, deleting fields, changing a field’s size, and changing the data type stored in a field, are made with this component.
Data Manipulation Es el encargado de añadir, eliminar, modificar y recuperar records de una Base de Datos. Query language Structured Query Language (SQL) Standard fourth-generation query language Se utiliza en muchos DBMS packages Utiliza un enunciado (statement) SELECT Query by example (QBE) Construye enunciados a través de una forma Utiliza una interfaz gráfica The data manipulation component is used to add, delete, modify, and retrieve records from a database. Typically, a query language is used for this component. Many query languages are available, but Structured Query Language ( SQL) and Query By Example ( QBE) are two of the most widely used. Structured Query Language ( SQL) is a standard fourth- generation query language used by many DBMS packages, such as Oracle 11g and Microsoft SQL Server. With query by example ( QBE), you request data from a database by constructing a statement made up of query forms. With current graphical databases, you simply click to select query forms instead of having to remember keywords, as you do with SQL.
Application Generation Herramienta que permite diseñar elementos de una aplicación basándose en una Base de Datos Data entry screens Interactive menus Interfaces with other programming languages Muchas de estas aplicaciones son fáciles y rápidas para el diseño y creación de aplicaciones. Se utilizan mucho para crear prototipos. The application generation component is used to design elements of an application using a database, such as data entry screens, interactive menus, and interfaces with other programming languages. These applications might be used to create a form or generate a report, for example. If you’re designing an order entry application for users, you could use the application generation component to create a menu system that makes the application easier to use. Typically, IT professionals and database administrators use this component.
Data Administration Se utiliza para: Backup and recovery (resguardo y recuperación) Security Change management Create, read, update, and delete (CRUD) Tablas y atributos Database administrator (DBA) Posición que se responsabiliza en administrar la base de datos. Esto incluye crear cuentas, accesos a la base de datos, modificar las tablas y/o atributos, etc. Se puede administrar a nivel Individual o por departamento The data administration component, also used by IT professionals and database administrators, is used for tasks such as backup and recovery, security, and change management. In addition, this component is used to determine who has permission to perform certain functions, often summarized as create, read, update, and delete ( CRUD). In large organizations, database design and management is handled by the database administrator ( DBA), although with complex databases, this task is sometimes handled by an entire department.
Modelos de Base de Datos 14/04/2017 Pag: 47
GENERACIONES First-generation Second generation Third generation Hierarchical and Network Second generation Relational Third generation Object-Relational Object-Oriented
Modelo Jerárquico (Hierarchical) Las Bases de Datos tienen sus raíces en los años 60. En aquel tiempo no había un sistema capaz de manejar grandes cantidades de datos que el proyecto iba a generar. Su estructura lógica básica se visualiza como un árbol (tree) al revés. A D E C B F G H
Modelo Jerárquico La estructura del modelo jerárquico contiene niveles o segmentos. Mantiene un conjunto de relaciones de uno a muchos entre un segmento padre y sus segmentos hijos. Cada padre puede tener muchos hijos. Cada hijo sólo puede tener un padre.
Modelo Jerárquico (Diagrama)
Modelo de Red (NetWork) Creado para: Representar relaciones de datos complejas más efectivamente que puedan manejar diseñados en estructuras jerárquicas. Mejora el rendimiento de la Base de Datos. Impuso un estándar. A D E C B F G H
Modelo de Red (Diagrama)
Modelo Relacional Desarrollado por E. F. Codd (IBM) en 1970. Departamento Desarrollado por E. F. Codd (IBM) en 1970. Se consideró ingenioso, pero poco práctico en el 1970. Conceptualmente es un modelo simple. Las computadoras de esa época carecían de la capacidad para poder implementar ese modelo. Hoy día no aplican estas limitaciones. Numero Descripción Edificio Tipo Empleado Clasificación Descripción Status Asalariado Id Nombre Depto Tipo
El Modelo Entidad-Relación Herramienta ampliamente aceptada y adaptada a formato gráfico para el diseño de la Base de Datos. Fue introducido por Chen en 1976 Representación gráfica de entidades y sus relaciones en una estructura de Base de Datos. Esto simplifica el diseño de la Base de Datos. Este sigue siendo el estándar en el Diseño y manejo de las Bases de Datos actuales.
Modelo Relacional (Diagrama) Primary Key (PK) La relación se establece relacionando el campo clave (PK) de una tabla con el campo foráneo (FK) en la otra tabla. Foreing Key (FK)
The Relational Model Relational model Data dictionary Uses a two-dimensional table of rows and columns of data Data dictionary Field name Field data type Default value Validation rule A relational model uses a two- dimensional table of rows and columns of data. Rows are records ( also called “ tuples”), and columns are fi elds ( also referred to as “ attributes”). To begin designing a relational database, you must defi ne the logical structure by defi ning each table and the fi elds in it. For example, the Students table has fi elds for StudentID, StudentFirstName, StudentLast- Name, and so forth. The collection of these defi nitions is stored in the data dictionary. The data dictionary can also store other defi nitions, such as data types for fi elds, default values for fi elds, and validation rules for data in each fi eld, as described in the following list:
The Relational Model - Example Primary key Unique identifier Foreign key Establishes relationships between tables Normalization Improves database efficiency Eliminates redundant data To improve database effi ciency, a process called normalization is used, which eliminates redundant data ( storing customer names in only one table, for example) and ensures that only related data is stored in a table.
The Relational Model Data retrieval Select Project Join Intersection Union Difference A select operation searches data in a table and retrieves records based on certain criteria Table 3.1 shows data stored in the Stu-dents table. Using the select operation you can generate a list of only the students majoring in MIS, as Table 3.2 shows. A project operation pares down a table by eliminating columns ( fi elds) according to certain criteria. For example, you need a list of students but don’t want to include their ages. Using the project operation you can retrieve the data shown in Table 3- 3. The “( Table 3.1)” in this statement means to use the data in Table 3.1. A join operation combines two tables based on a common field ( for example, the primary key in the first table and the foreign key in the second table). Table 3.4 shows data in the Customers table, and Table 3.5 shows data in the Invoices table. The Customer# is the primary key for the Customers tables and a foreign key in the Invoices table; the Invoice# is the primary key for the Invoices table. Table 3.6 shows the table resulting from joining these two tables.
The Relational Model A select operation searches data in a table and retrieves records based on certain criteria Table 3.1 shows data stored in the Stu-dents table. Using the select operation you can generate a list of only the students majoring in MIS, as Table 3.2 shows. A project operation pares down a table by eliminating columns ( fi elds) according to certain criteria. For example, you need a list of students but don’t want to include their ages. Using the project operation you can retrieve the data shown in Table 3- 3. The “( Table 3.1)” in this statement means to use the data in Table 3.1. A join operation combines two tables based on a common field ( for example, the primary key in the first table and the foreign key in the second table). Table 3.4 shows data in the Customers table, and Table 3.5 shows data in the Invoices table. The Customer# is the primary key for the Customers tables and a foreign key in the Invoices table; the Invoice# is the primary key for the Invoices table. Table 3.6 shows the table resulting from joining these two tables.
Modelo Orientado a Objetos Se modela tanto los datos como sus relaciones en una estructura sencilla conocida como objeto. Object-Oriented data model (OODM) es la base para el object-oriented database management system (OODBMS) OODM se conoce como el modelo de datos semántico (semantic data model)
OTROS MODELOS Extended Relational Data Model (ERDM) Modelos de datos semánticos desarrollados en respuesta a la creciente complejidad de las aplicaciones. Con frecuencia se les conoce como (Object/relational database management system ORDBMS) Su principal propósito es para aplicaciones de negocios.
RESUMEN DE LOS MODELOS
Bases de Datos Orientados al Web Proveen una ventaja competitiva a la compañía y la expone a nivel global. Se utilizan en el comercio electrónico. Algunos ejemplos de compañías que trabajan electrónicamente por Internet son Ebay y Amazon, etc. Las redes sociales no podrían existir sin el componente de las Bases de Datos. Las aplicaciones Web tienen mucho auge y es un tema importante que no se puede ignorar dentro del campo de las Bases de Datos.
EVOLUCIÓN DE LAS BASES DE DATOS
Diseño de Base de Datos 14/04/2017 Pag: 46
Logical Database Design Physical view Detalla cómo los datos se almacenan y se recuperan de una medio físico Logical view Muestra la forma en que la información se le muestra a los usuarios Enfoca en cómo los datos están organizados y como se recuperan Puede haber más de una forma lógica de ver los datos Before designing a database, you need to know the two ways information is viewed in a database. two ways information is viewed in a database. The physical view involves how data is stored on and retrieved from storage media, such as hard disks, magnetic tapes, or CDs. For each data-base, there’s only one physical view of data. The logical view involves how information appears to users and how it can be organized and retrieved. There can be more than one logical view of data, depend-ng on the user.
Logical Database Design (cont’d.) Data model Determina como los datos se crean, representan y organizan. Incluye: Data structure Operations Integrity rules Data structure— Describes how data is organized and the relationship between records • Operations— Describe methods, calculations, and so forth that can be performed on data, such as updating and querying data • Integrity rules— Defines the boundaries of a database, such as maximum and minimum values allowed for a field, constraints ( limits on what type of data can be stored in a field), and access methods
Recent Trends in Database Design and Use Algunas tendencias nuevas en el uso de las bases de datos son: Data-driven Web sites – Son páginas que pueden cambiar su contenido a solicitud del usuario (Ej. Amazon). Distributed databases – Los datos de una sola base de datos, se almacena en diferentes servidores. Esto porvee ventajas y desventajas. Client/server databases – La base de datos reside a nivel del servidor y el cliente los puede acceder. Object-oriented databases – Diseño moderno de las bases de datos. Se basa en clases, objetos y métodos. Data-driven Web site Interface to a database Retrieves data and allows users to enter data Improves access to information Useful for: E-commerce sites that need frequent updates News sites that need regular updating of content Forums and discussion groups Subscription services, such as newsletters Distributed database Data is stored on multiple servers placed throughout an organization Reasons for choosing Approaches for setup Fragmentation Replication Allocation Security issues
BASE DE DATOS - Componentes Entidades – Algo importante que deseamos almacenar. Por ejemplo: Una persona, evento, lugar, categoría o cualquier otra cosa que se le pueda nombrar. Atributos – Datos que describen a la entidad y por lo tanto necesitamos almacenarlas. Relaciones – Define como las entidades se relacionan entre si.
ENTIDADES
ENTIDADES Una ENTIDAD representa una persona, lugar, objeto , evento o concepto dentro del ambiente de Sistemas de información. Por lo tanto a cada entidad se le asigna un nombre propio. Deseamos guardar datos dentro de una entidad. A continuación mostramos ejemplos de entidades.
EJEMPLO DE ENTIDADES PERSONA: ESTUDIANTE, EMPLEADO, PACIENTE LUGAR: ALMACEN, WAREHOUSE, ESTADO, PUEBLO OBJETO: MAQUINA, EDIFICIO, AUTOMOVIL, LIBRO EVENTO: VENTA, MATRICULA, RENOVACION, QUEJA, COBRO, PAGO, TRASLADO, TAREA, TRANSFERENCIA, ASIGNACION, CONTACTO CONCEPTO: CUENTA, CURSO, CENTRO DE TRABAJO
UNA ENTIDAD DEBE SER: NO DEBE SER: Un objeto que tenga muchas instancias en la Base de Datos. Un objeto que se componga de múltiples atributos. Un objeto que se pueda diseñar y representar (model). NO DEBE SER: Un usuario del sistema de Base de Datos Un resultado (output) de la Base de Datos (ejemplo: un reporte)
ATRIBUTOS
ATRIBUTOS Attribute – Propiedad o característica de una entidad o de un tipo de relación. El conjunto de atributos de una entidad se le conoce también como una instancia. Tipos de atributos: (se discuten más adelante) Required versus Optional Attributes Simple versus Composite Attribute Single-Valued versus Multivalued Attribute Stored versus Derived Attributes Identifier Attributes
EJEMPLOS DE ATRIBUTOS ENTIDAD CLIENTE número nombre dirección teléfono crédito e-mail ENTIDAD ESTUDIANTE número nombre edad genero departamento igs escuela procedencia
ATRIBUTOS - Required versus Optional Required attribute - Necesita tener un valor por cada instancia que tenga la entidad. Ej: nombre, género, seguro social, etc. Optional attribute - No es necesario que toda instancia de una entidad tenga un valor en ese atributo en particular. Ej: teléfono, celular, etc. 5
ATRIBUTOS - Identifier Attributes Identifier - Atributo (o combinación de atributos) que distingue cada instancia de la entidad haciéndola única. Debe ser un atributo cuyo valor nunca se repita. Simple identifier - Su valor no está sub-dividido en más de un atributo. Ej: Seguro social, número de empleado Composite identifier - Un identifier que tiene valores de más de un atributo. Ej: numero de cliente + número de orden
Características de los Identifiers (Primary Key) No cambia de valor. No puede ser Nulo (null). No pueden ser “inteligentes”. Por ejemplo no pueden tener valores que puedan cambiar como una dirección, nombre, edad o algún código que represente un valor que sea variable. Se debe tratar de utilizar identifiers simples (de un solo atributo) siempre que se pueda. A los identifiers se les conoce también como UID (Unique Identifier) o Primary Key. 7
Ejemplos de UID CLIENTE numero nombre seguro social direccion teléfono credito e-mail El número del cliente es muy buen candidato para un UID ya que su valor es único. El seguro social también podría ser un buen candidato para un UID. (ojo ) ESTADIO (PARQUE) id nombre direccion telefono capacidad sillas capacidad carros En el caso de un estadio, necesitamos crear un atributo artificial que posea un valor único para que identifique cada instancia de la entidad.
RELACIONES
LAS RELACIONES Son asociaciones bidireccionales (en ambas direcciones) e imprescindibles entre dos o tres entidades o entre una entidad y ella misma. La relación entre las entidades tiene lo que se conoce como grado o Degree.
DEGREE OF RELATIONSHIPS Indica el número de tipos de entidades que participan en la relación Unary Relationship - Entre la misma entidad. Binary Relationship - Entre dos entidades. Ternary Relationship - Entre tres entidades. 16
DEGREE OF RELATIONSHIPS One entity related to another of the same entity type Entities of two different types related to each other Entities of three different types related to each other 8
OTRO EJEMPLO DEL GRADO DE RELACIONES
TIPOS DE RELACIONES One-to-One (uno a uno) One-to-Many (uno a muchos) Cada entidad en la relación va a tener exactamente una relación en sus instancias. One-to-Many (uno a muchos) La entidad de una parte tiene relación con muchas instancias de la otra entidad, pero cada instancia de la otra entidad sólo puede tener relación con una instancia de la primera entidad. Many-to-Many (muchos a muchos) En ambas entidades en la relación, existen relaciones de muchos a muchos.
UNO A UNO - EJEMPLOS 1 EMPLEADO emp_numero_pk emp_nombre emp_fecha_nacimiento ESTACIONAMIENTO est_numero est_descripcion emp_numero_fk posee estár asignado
UNO A MUCHOS - EJEMPLOS M∞ 1 habitado por EMPLEADO dep_id_pk DEPARTAMENTO dep_id_pk dep_localización dep_descripción EMPLEADO emp_numero_pk emp_nombre emp_seguro social habitado por estar asignado M∞ 1
MUCHOS A MUCHOS - EJEMPLOS ESTUDIANTE est_numero_pk est_nombre est_seguro_social tomar CURSO cur_código_pk cur_semestre cur_descripción M ∞ tomado por M ∞
Ejemplo Diseño de una Base de Datos Utilizando ACCESS
Data Warehouse / Data Mart / Data Minning 14/04/2017 Pag: 54
Data Warehouses, Data Marts, and Data Mining Data warehouse: Colecciona información de los negocios utilizando muchas fuentes de la empresa, no solamente la base de datos. Data mart: Un subconjunto (subset) de un data warehouse Data mining: Una herramienta para analizar la información con el propósito de buscar patrones en los datos que pueda servir a la empresa a obtener ventaja competitiva. Utiliza datos de un data warehouse o de un data mart. Online Analytical Processing – Herramientas gráficas hechas por sofware que proveen un análisis complejo de los datos que se almacenan en una base de datos. Data warehouse supports different types of analysis Generates reports for decision making Data-mining analysis Discover patterns and relationships Reports Cross-reference segments of an organization’s operations for comparison purposes Find patterns and trends that can’t be found with databases Analyze large amounts of historical data quickly Online analytical processing (OLAP) Generates business intelligence Uses multiple sources of information and provides multidimensional analysis Hypercube Drill down and drill up Data mart Smaller version of data warehouse Used by single department or function Advantages over data warehouses More limited scope than data warehouses
Data Warehouses Data warehouse Colección de datos que se utiliza para dar apoyo a la toma de decisiones gerenciales y para generar BI (business intelligence). Los datos en un DW (Data Warehouse) se almacena utilizando la misma tecnología del modelo relacional de bases de datos. Un DW puede almacenar y comparar multidimensional data. De ahí viene el concepto de hypercubers que permite analizar tres tipos de datos. Ejemplo: Ventas, Tiendas, Meses (Dinero vs Lugar demográfico vs Tiempo) data warehouse is a collection of data from a variety of sources used to support decision- making applications and generate business intelligence. 8 Data warehouses store multidimensional data, so they’re sometimes called “ hypercubes.” Typically, data in a data warehouse is described as having the following characteristics in contrast to data in a database: • Subject oriented— Focused on a specific area, such as the home- improvement business or a university, whereas data in a database is transaction/ function oriented. • Integrated— Comes from a variety of sources, whereas data in a database usually doesn’t. • Time variant— Categorized based on time, such as historical information, whereas data in a database only keeps recent activity in memory. • Type of data— Captures aggregated data, whereas data in a database captures raw transaction data. • Purpose— Used for analytical purposes, whereas data in a database is used for capturing and managing transactions.
A Data Warehouse Configuration Exhibit 3.9 A Data Warehouse Configuration INPUT Variety of sources External Databases Transaction files ERP systems CRM systems Extraction, transformation, and loading (ETL) Extraction Collecting data from a variety of sources Converting data into a format that can be used in transformation processing Transformation processing Make sure data meets the data warehouse’s needs Loading Process of transferring data to the data warehouse
Exhibit 3.10 Slicing and Dicing Data Data warehouses are not transaction-oriented. Data warehouses support online analytical processing (OLAP).
Business Intelligence Business Intelligence (BI) Colección de Herramientas que le permite a la gerencia tomar las mejores decisiones en la toma de decisiones. Utiliza los Data warehouse, Data minning, Base de datos, Programación Web, interfaces gráficas y otras herramientas que facilitan mostrar datos y conceptos complejos de una forma simple a la gerencia. Más adelante se va a explicar este concepto con más detalles data warehouse is a collection of data from a variety of sources used to support decision- making applications and generate business intelligence. 8 Data warehouses store multidimensional data, so they’re sometimes called “ hypercubes.” Typically, data in a data warehouse is described as having the following characteristics in contrast to data in a database: • Subject oriented— Focused on a specific area, such as the home- improvement business or a university, whereas data in a database is transaction/ function oriented. • Integrated— Comes from a variety of sources, whereas data in a database usually doesn’t. • Time variant— Categorized based on time, such as historical information, whereas data in a database only keeps recent activity in memory. • Type of data— Captures aggregated data, whereas data in a database captures raw transaction data. • Purpose— Used for analytical purposes, whereas data in a database is used for capturing and managing transactions.
BI in Action: Law Enforcement Ejemplo de un uso actual de Business intelligence (BI) Used in law enforcement as well as in the business world Richmond, Virginia System generates BI reports that help pinpoint crime patterns Allocate manpower to days and locations where crime likely to occur BI in Action: Law Enforcement Business intelligence ( BI) is used in law enforcement as well as in the busi-ness world. In Richmond, Virginia, data entered into the information sys-tem includes crime reports from the past 5 years, records of 911 phone calls, details about weather patterns, and information about special events. The system generates BI reports that help pinpoint crime patterns and are useful for personnel deployment, among other purposes. The sys-tem has increased public safety, reduced 911 calls, and helped manage-ment make better use of Richmond’s 750 offi cers. Recently, the department refi ned its reports by separating violent crimes into robberies, rapes, and homicides to help them discover patterns for certain types of crime. For example, the department discovered that His-panic workers were often robbed on paydays. By entering workers’ pay-days into the system and looking at robbery patterns, law enforcement offi cers were able to identify days and locations where these incidents were likely to occur. Moving additional offi cers into those areas on pay-days has reduced the number of robberies.
A not so perfect match A not so perfect match With the increasing power of Data mining techniques, comes ever increasing and reaching uses of this powerful technology. 1. What are the benefits of DNA databases? 2. What problems do DNA databases pose? 3. Who should be included in a national DNA database? Should it be limited to convicted felons? 4. Who should be able to use DNA databases? What are the benefits of DNA databases? • DNA databases have become a very powerful crime-fighting tool. Law enforcement agencies are now able to identify criminals by their own genetics. • DNA identification can also prove the innocence of an individual and thus avoid the potential act of wrongfully convicting them of a crime they did not commit. • In Canada, the National DNA Data Bank allows local law enforcement agencies to share DNA profiles. • DNA analysis is used to solve “cold cases” many years after the crime. 2. What problems do DNA databases pose? • Privacy advocates and defense lawyers believe genetic databases pose risks to the innocent if they contain data on people who are not convicted criminals. • Individuals changed with misdemeanors could also be included in the DNA database. • People who collect and analyze DNA can make mistakes.
FIN 14/04/2017