SISTEMAS DE INFORMACIÓN

Slides:



Advertisements
Presentaciones similares
SISTEMAS DE GESTIÓN DE BASES DE DATOS
Advertisements

También conocido como Diseño Lógico Rodrigo Salvatierra Alberú.
Control Interno Informático. Concepto
DATA WAREHOUSE Presentador Por: Andrés Fabián Cortes Solano.
Arquitecturas de BD Modelo ANSI/SPARC
Introducción a LAS Bases de Datos
Base de Datos Distribuidas FUNDAMENTOS DE BASES DE DATOS DISTRIBUIDAS
1 ESTRATEGIA DE IMPLEMENTACION DE MEDIDAS DE GOBIERNO DE LAS TECNOLOGIAS DE LA INFORMACION La Antigua, Guatemala 23 de Septiembre de 2008.
UNIDAD IV Funcionamiento de la Base de Datos.
¿QUÉ SON LAS BASES DE DATOS?
Software La buena programación no se aprende de generalidades, sino viendo cómo los programas significativos pueden hacerse claros, “fáciles” de leer,
1.1.2 Sistemas de información para la gestión y para la ayuda en la toma de decisiones. Los SI contribuyen activamente a la consecución de los objetivos.
Características de un Data Warehouse
UNIDAD I Conceptos Básicos.
Viviana Poblete López Módulo: Modelo de Datos
Sistemas de Información IS95872
Bases de Datos Relacionales.  Responsable Cátedra: Silvina Migani  JTP: Liliana Romera  Ayudante:
Introducción A Las Bases De Datos
DATA WAREHOUSE Equipo 9.
BASE DE DATOS BY: Julián Villar Vázquez.
Análisis y Diseño Orientado a Objetos utilizando UML
Introducción a las Bases de Datos Relacionales Juan Alberto Sigüenza Escuela Técnica Superior de Informática Universidad Autónoma de Madrid.
Página 1 20/03/2005 Materia: Tecnología de la Información Curso: Profesora Ariana Rosenthal Tecnología de la Información Profesora Ariana Rosenthal Administración.
Análisis de Sistemas.
Por: Jhon Eduar Durán García. No había ningún sistema que permitiera gestionar la inmensa cantidad de información que requería el proyecto. La primera.
Página 1 19/04/2005 Materia: Tecnología de la Información Curso: Profesora Ariana Rosenthal Tecnología de la Información Profesora Ariana Rosenthal Repaso.
CICLO DE VIDA Y NORMAALIZACION DE UN SISTEMA DE BASE DE DATOS
Trainning DFD.
Métrica v2.1 Técnicas: Modelado de datos (Parte 1)
1 FUNDAMENTOS DE BASES DE DATOS SISTEMA GESTOR DE BASES DE DATOS (SGBD) Consiste en una colección de datos interrelacionados y un conjunto de programas.
Ingeniería de Requisitos
Leidy Constanza Bermeo Roa. La encuesta está conformada por un grupo de preguntas que se dirigen a personas específicas que nos permitirán.
Análisis y Diseño de Aplicaciones
BASE DE DATOS DISTRIBUIDAS
Bases de Datos y Sistemas de Gestión de Bases Relacionales.
DISEÑO DE BASES DE DATOS (modelos para el diseño)
VI. EVALUACIÓN DE LOS RECURSOS
El administrador de los formatos de bases de datos Es el profesional que administra las tecnologías de la información y la comunicación, siendo responsable.
USO DE LAS HERRAMIENTAS CASE MARIA VERA ANGEL CEDEÑO.
Base de Datos Auditoría – Orientación II Cr. Oscar Nielsen
INTRODUCCIÓN A LAS BASES DE DATOS Revisión de Conceptos.
OFICINA DE CONTROL INTERNO Jornada de Inducción y Reinducción (Bogotá, Septiembre 3 de 2015 )
Diccionario/Directorio de Datos
BASES DE DATOS CONCEPTOS BASICOS Elizabeth Maite Zarate Machaca “El tratamiento eficiente de la información al servicio del usuario”
UNIVERSIDAD NACIONAL DE LOJA ÁREA DE LA EDUCACIÓN, EL ARTE Y LA COMUNICACIÓN CARRERA DE INFORMÁTICA EDUCATIVA MODULO IV DOCENTE Ing. : Lena Ruiz Rojas.
Base de Datos I – Ing. Mary Carlota Bernal J. BASE DE DATOS I Diseño conceptual de Base de Datos Modelo Entidad - Relación.
BASES DE DATOS DISTRIBUIDAS M.C.C. María Guadalupe Villanueva Carrasco INGENIERIA EN SISTEMAS COMPUTACIONALES.
 Modelo de Datos MD  Conjunto de conceptos que permiten describir, a distintos niveles de abstracción, la estructura de una B.D. Que llamaremos ESQUEMA.
1 Conferencia 5 OLAP. 2 Contenido Definición OLAP. Reglas de Codd. Gestores que dan soporte OLAP y los diferentes modos de Almacenamiento.
Introducción a Bases de Datos Universidad de Managua.
TEMA 8 Introducción a Windows 2008 Server Msc. Rina Arauz.
METODOLOGÍA CUALITATIVA Licenciatura en Comunicación Social, U. del Pacífico Cuarta semana de clases El proceso de construcción de un marco teórico Prof.
Auditoría de la Adquisición del Software Cr. Luis Elissondo Facultad de Ciencias Económicas Universidad Nacional del Centro de la Provincia de Bs. As.
Control, Controles y Administración
 Los servidores Microsoft salen al mercado en 1993 con el Windows NT avance server 3.1 el cual se convierte en el primer sistema operativo para redes.
Una base de datos, a fin de ordenar la información de manera lógica, posee un orden que debe ser cumplido para acceder a la información de manera coherente.
Procesamiento de Datos Cód.: 330 Facilitadora: Beatriz González Profesor: Oscar Núñez Universidad Nacional Abierta Vicerrectorado Académico Área: Ingeniería.
Clase 1.  Un programador es aquella persona que escribe, depura y mantiene el código fuente de un programa informático, es decir, del conjunto de instrucciones.
Conceptos de sistemas de información 4 Sistema de información formal –Es un medio informativo organizacionalmente eficaz, que es diseñado con la finalidad.
MARTIN JESUS MEJIA SANDOVAL. 1: Cuál es el nombre del programa de formación en que se encuentra matriculado? R R EEEE SSSS PPPP UUUU EEEE SSSS TTTT AAAA.
13/11/14. UNIDADES DEL SEMESTRE Este trabajo esta diseñado para saber los propósitos de los sistemas de información, así como el buen desempeño que le.
Concurso 2010 de premiación a la innovación en la Administración Tributaria.
Administración de la Producción Administración de la Producción
UNA APROXIMACIÓN A INTERNET Y A SUS HERRAMIENTAS DE BÚSQUEDA.
¿POR QUÉ LA ARQUITECTURA DE LA EMPRESA ES IMPORTANTE? Si una empresa elige para automatizar un servicio de negocio como un servicio sistemas de información,
Asignaturas: Informática/Electiva I. Definición de Sistema operativo Conceptos Básicos Funciones de los Sistemas Operativos Clasificación Componentes.
Modelo del Proceso de Negocio Francisco Valdés Souto 2 al 6 de marzo 2009 © Avantare Consultores S. A. de C. V. – Derechos.
SISTEMAS DE INFORMACIÓN MÓDULO DE TECNOLOGÍA DE INFORMACIÓN.
3. Organización de proyectos. Estructura y cultura.
Introducción a la Ingeniería del Software 1 El Diseño de Software Caracteristicas: Proceso Creativo Requiere de experiencia e ingenio Necesita del aprendizaje.
Transcripción de la presentación:

SISTEMAS DE INFORMACIÓN MÓDULO DE TECNOLOGÍA DE INFORMACIÓN (TI)

SISTEMAS DE INFORMACION TECNOLOGIA DE INFORMACION BASES DE DATOS TECNOLOGIA DE INFORMACION ( TI ) HARDWARE SOFTWARE COMUNICACIONES

Tecnología de Información CAPITULO 6°: ADMINISTRACIÓN DE DATOS MBA SERGIO ORTEGA Material revisado para la cursada 2009

CAPITULO 6°: ADMINISTRACIÓN DE DATOS 6.1. Almacenamientos externos en general: conceptos básicos; técnicas de organización; aspectos físicos y lógicos. 6.2. Bases de datos: conceptos básicos; clasificaciones; aspectos físicos y lógicos; principales componentes. Ventajas y aportes a las necesidades de los procesos de negocios. 6.3. Nuevas arquitecturas de bases de datos. Evolución. Bases multidimensionales. De Objetos. Bases de datos en la web. 6.4. Manejo de datos. Lenguajes de definición y consulta. 6.5. Estructuras lógicas de datos. Técnicas de formalización: diagramas de entidad relación (DER); esquemas; diccionarios de datos. 6.6. Aportes a la administración del conocimiento. Tendencias. 6.7. Técnicas de resguardo y seguridad en archivos tradicionales y en bases de datos.

BIBLIOGRAFIA Básica: Laudon & Laudon, Sistemas de Información Gerencial. Organización y tecnología de la empresa conectada en red. Sexta Edición. Prentice Hall, México 2002. Capítulo 8: pág. 226/256 Laudon & Laudon, Sistemas de Información Gerencial. Administración de la Empresa Digital. Octava Edición. Prentice Hall, México 2004. Capítulo 7: pág. 218/247 Apunte de Cátedra: .  

Conceptos 6

Dato e Información Dato: Codificación cualitativa y/o cuantitativa de un hecho. Información: Resultado de procesar datos mediante algoritmos lógico-matemáticos. Proceso de Datos: Secuencia de operaciones matemáticas (algoritmo) a la que se someten los datos para transformarlos en información. Algoritmo: Secuencia definida, ordenada y finita de operaciones que permite hallar la solución a un problema.

Dato: La presencia o ausencia de un alumno en la clase(i) Ej. de Dato Dato: La presencia o ausencia de un alumno en la clase(i)

Información: Porcentaje de asistencia de cada alumno(i) Ej. de Información Información: Porcentaje de asistencia de cada alumno(i) Algoritmo: Tomar un alumno y contar las clases en que estuvo presente y dividir el resultado por la cantidad de clases dictadas y multiplicar el resultado por 100

Información: Porcentaje de asistencia de en clase(i) Ej. de Información Información: Porcentaje de asistencia de en clase(i) Algoritmo: Tomar alumno por alumno y contar clase por clase si estuvo presente. Luego dividir el resultado de cada clase por la cantidad de alumnos del curso y multiplicar ese resultado por 100

Proceso administrativo de tratamiento de datos Captura de datos: Medición del hecho, evento o transacción Codificación cualitativa y*o cuantitativa Registración (analógica o digital) Almacenamiento en soportes primarios o secundarios Recuperación de información: Selección de un conjunto de datos almacenados Procesamiento bajo la lógica de algún algoritmo Presentación (reporte gráfico y/o escrito)

Soportes de almacenamiento de datos Primarios: Medios naturales de registro escrito manual o mecanizado en: comprobantes, documentos, planillas, etc. Secundarios: Medios artificiales de registro mediante dispositivos tecnológicos especializados (hardware) discos magnéticos u ópticos, cintas magnéticas memorias, etc. organizados en forma de archivos o bases de datos

Archivos de almacenamiento de datos Agrupación de registros homogéneos, dónde: Registro: es una agrupación de campos Campo: es una agrupación de caracteres (también conocido como ficheros) Los que pueden ser accedidos de forma: Secuencial: Recorrido de los registros uno tras otro y en el orden físico en el que están guardados, hasta encontrar el buscado. Secuencial indizado: Recorrido secuencial de un índice que almacena la dirección (o una sección) en la que se encuentra el registro buscado. Ej: en una guía telefónica, índice de localidad y apellidos desde/hasta Directo: acceso a un registro determinado sin necesidad de recorridos.

Archivos de almacenamiento de datos Archivo o Fichero: Conjunto de registros Registro: Conjunto de campos Campo: Conjunto de caracteres

Archivos de almacenamiento de datos Ambiente Tradicional Software SIST. APLICACION SIST. OPERATIVO Hardware ARCH. DE DATOS

Archivos de almacenamiento de datos Organización Tradicional Sistema de Ventas Sistema de Producción Sistema de Administr. Sistema de Almacenes Arch. de Ventas Arch. de Producción Arch. de Administr. Arch. de Almacenes

Archivos de almacenamiento de datos Problemas Redundancia: Datos repetidos en diferentes ficheros Inconsistencia: Datos incoherentes con su significado (por ej. Fecha) Incongruencia: Datos relacionados incompletos (registrar asistencia de alumnos no matriculados) Inaccesibilidad: Construcción de programas para visualizar datos Fragmentación: Almacenamiento datos relacionados en múltiples ficheros (ej: cabecera de factura y renglones) Atomicidad de actualización: Ficheros parcialmente actualizados ante fallos (ej cabecera de factura y renglones) Concurrencia: Accesos simultáneos de varios usuarios requiere implementar bloqueos frente a acciones de grabación y borrado Seguridad: No provee un esquema de perfiles de usuarios en el que pueda predefinirse los permisos de acción sobre los ficheros.

Bases de Datos 18

Definición de James Martin Base de Datos Definición de James Martin Colección de datos interrelacionados almacenados sin redundancias perjudiciales o innecesarias, su finalidad es servir a una aplicación o más, de la mejor manera posible; los datos se almacenan de modo que resulten independientes de los programas que los usan; se emplean métodos bien determinados para incluir datos nuevos y para modificar o extraer los datos almacenados

Base de Datos BASE DE DATOS Ambiente Actual Software SIST. APLICACION D B M S SIST. OPERATIVO Hardware BASE DE DATOS

Sistema de Administración de Bases de Datos (DBMS) Base de Datos Organización Actual Sistema de Ventas Sistema de Producción Sistema de Administr. Sistema de Almacenes Sistema de Administración de Bases de Datos (DBMS) BASE DE DATOS

Problemas que intenta solucionar Base de Datos Problemas que intenta solucionar Almacenar datos y las relaciones de estos con otros datos Almacenar los datos una sola vez de forma independiente a su tratamiento Ofrecer recursos para mantener la integridad de los datos que se almacenan

Sistema de Administración de Bases de Datos Base de Datos Sistema de Administración de Bases de Datos Es una colección de programas que facilitan los procesos de definición (arquitectura) y manipulación de archivos (tablas) relacionados, grabando, eliminando, modificando, visualizando y extrayendo datos de ellos.

Historia de Bases de Datos A comienzos del 60 se observan los primeros intentos de construir un Sistema de Administración de Almacenamiento de Datos con el propósito de que los maneje de manera clara, sencilla y ordenada, para que posteriormente se conviertan en información relevante. Para poder construir un Sistema de Administración de Bases de Datos se necesita primero concebir un Modelo. La evolución de los modelos iniciales son: Jerárquico Red Relacional 24

Modelos de Base de Datos Modelo Jerárquico: Se dice que comienza a mediados de los 60 con el proyecto Apolo (hombre a la luna), para gestionar la inmensa cantidad de datos que requería el mismo. La encargada NAA (North American Aviation), desarrolló el software GUAM (General Update Access Method) basado en el concepto árbol, para poder unir varias piezas pequeñas en una pieza más grande, y así sucesivamente hasta ensamblar el producto final. A mediados de los 60, NAA se une con IBM para perfeccionar a GUAM en el conocido software IMS (Information Management System). Almacena datos enlazando (con direcciones físicas) los registros (nodos) en forma de árbol donde un nodo padre de datos puede tener varios nodos hijos. 25

Modelos de Base de Datos Modelo Red: A mediados de los 60 General Electric desarrolló IDS (Integrated Data Store, dirigido por uno de los pioneros en los sistemas de bases de datos, Charles Bachmann, para satisfacer la necesidad de representar relaciones entre datos, más complejas de las que se podían modelar con los sistemas jerárquicos y en parte, para imponer un estándar de bases de datos. A tal fin CODASYL (Conference on Data Systems Languages), integrado por representantes del gobierno de EEUU y de las empresas, formaron al grupo DBTG (Data Base Task Group), con el objetivo de definir las especificaciones estándar que permitieran la creación de bases de datos y el manejo de los mismos. En 1971 se presentó el informe final, aunque éste no fue formalmente aceptado por ANSI (American National Standards Institute). Almacena datos enlazando (con direcciones físicas) los registros (nodos) en forma de árbol donde un nodo padre de datos puede tener varios nodos hijos y un nodo hijo puede tener varios nodos padres. 26

Modelos de Base de Datos Modelo Relacional: Desarrollo de comienzos del 70 por Edgar F. Codd para IBM, que concitó rápidamente la atención de los medios académicos, basado en la teoría matemática de conjuntos y consta de las siguientes características: Representación tabular: simple y fácil de implementar. Normalización: conjunto de restricciones evitan almacenar datos redundantes. Operadores poderosos: Manipulación de datos con el concepto del Algebra y Cálculo Relacional. Almacena datos en tablas enlazando (lógicamente) los registros entre tablas a través de un mismo atributo de enlace que se repiten en ambas tablas 27

Modelo Relacional 28

Modelo Relacional de Base de Datos Tabla Tabla (Relación): Conjunto de objetos, hechos o conceptos almacenados en filas (Tuplas) Fila (Tupla): Conjunto de columnas (atributos) de un objeto, hecho o concepto Columna (Atributo): Característica de un objeto, hecho o concepto. Se clasifican en: Identificativos (clave única que no se repite nunca. Ej: DNI) Descriptivos (Ej: Apellido y Nombre, Dirección, … ect.) Dominio: Universo de posibles valores que puede adoptar un atributo (Ej: Estado Civil: {Soltero, Casado, Viudo, Separado, Divorciado}) Estructura de Tabla: Conjunto de descripciones que definen los tipos de datos en el que se almacenaran los valores heterogéneos de atributos 29

Modelo Relacional de Base de Datos Estructura de Tabla 30

Modelo Relacional de Base de Datos Normalización: Proceso de análisis de la naturaleza de los atributos y de las relaciones entre ellos para determinar en que tabla se almacena cada uno de ellos para evitar redundancias. Codd propuso 3 reglas iniciales Luego distintos investigadores del modelo aportaron 4reglas más Arquitectura de Base de Datos (Esquema): Conjunto de tablas (relaciones) resultantes de aplicar las reglas del análisis de normalización Vista: Tabla virtual que se genera con la extracción de atributos de varias tablas 31

Modelo Relacional de Base de Datos Normalización Primera Regla Normal: Identifica la existencia de atributos para los diferentes objetos, hechos o conceptos desde 0 a n y se los separa en otra tabla (EJ: Objeto Empleado con Atributos Hijos se crean dos tablas Empleados e Hijos de Empleados) 32

Modelo Relacional de Base de Datos Normalización Segunda Regla Normal: Identifica la existencia de atributos de un objeto, hecho o concepto que se asocian a otros que a su vez están relacionados entre sí. (EJ: Hecho Factura y Atributos Productos se crean dos tablas Renglones de Facturas y Lista de Productos) 33

Modelo Relacional de Base de Datos Normalización Tercera Regla Normal: Identifica existencia de atributos de un objeto, hecho o concepto que se referencian con otros que a su vez están relacionados entre sí. (EJ: Objeto Empleado y Atributos Localidad se crean dos tablas Empleados y Localidades) 34

Modelo Relacional de Base de Datos Los desarrollos de DBMS´s con los modelo Jerárquico y Red provocaban errores de funcionamiento frente a la necesidad de empleo de mecanismos complejos para vincular registros mediante direcciones físicas. El modelo Relacional permitió desarrollar DBMS´s exitosos porque se vinculaban lógicamente registros de diferentes tablas, mediante la utilización de los mecanismos de almacenamientos conocidos. Estas vinculaciones lógicas, permiten estructurar datos tanto en jerarquías como en redes. 35

Modelo Relacional de Base de Datos Ventajas: Facilidad con el que se pueden diseñar Tablas para almacenar datos eliminando redundancias Desventajas: Complicación en la manipulación de Tablas cuando una aplicación posee demasiadas de ellas 36

DBMS 37

Sistema de Administración de Bases de Datos (DBMS) Colección de programas que facilitan los procesos de definición (arquitectura) y manipulación de archivos (tablas) relacionados, grabando, eliminando, modificando, visualizando y extrayendo datos de ellos. 38

Estructura de un DBMS Relacional Software Hardware DBMS SISTEMA OPERATIVO Administrador de Base de Datos Interprete DDL Desarrollador de Aplicaciones Interprete PL Archivos de Datos Gestor de BD Administrador de Archivos Trigger Usuario de Aplicaciones Archivos de Diccionario de Datos Procesador PL Usuario Casual Interprete SQL 39

Servicios de un DBMS Relacional PL: Lenguaje de Procedimientos DDL: Lenguaje de Descripción de Datos SQL: Lenguaje de Consultas Trigger: Procedimientos Almacenados ODBC: Conexión Abierta a Bases de Datos Arquitectura Cliente – Servidor 40

Servicios de un DBMS Relacional PL: Lenguaje de Procedimientos Se utiliza para redactar la lógica de los procesos a ejecutarse (interfaces de aplicaciones): para almacenar datos en la base de datos a partir de las entradas de datos para extraer los datos de las mismas, procesarlos y generar reportes. 41

Servicios de un DBMS Relacional DDL: Lenguaje de descripción de datos Se utiliza para definir todos los atributos y las propiedades de cada tabla, especialmente: diseños de fila, definiciones de columna, columnas de clave (y, a veces, metodología de claves), ubicaciones de archivos y estrategia de almacenamiento. 42

Servicios de un DBMS Relacional SQL: Lenguaje Estructurado de Consultas Se utiliza para efectuar y programar consultas a las bases de datos combinando los datos de las diferentes tablas. Es una evolución del lenguaje SEQUEL de D.D. Chamberlin y R.F. Boyce (1974) implementado por primera vez por IBM en su Base de Datos Relacional System R. Versiones: SQL1 o SQL86: Estandarizada en 1986 por ISO (International Standards Organization) y ANSI (American National Standards Institute). SQL2 o SQL–92 SQL3: Incluye conceptos de orientación a objetos. 43

Servicios de un DBMS Relacional Trigger: Disparador de procedimientos almacenados Conjunto de comandos y o funciones permitidas que el usuario define para que éstas se ejecuten cuando se cumpla una condición establecida al realizar una operación de inserción, actualización o borrado de datos. 44

Servicios de un DBMS Relacional ODBC: Conectividad Abierta de Bases de Datos Interfaz de programación de aplicaciones (API) de Microsoft. Define un conjunto estándar de rutinas con las que una aplicación puede tener acceso a datos de orígenes remotos. Drivers intermediario que facilita la comunicación entre DBMS de diseño y de gestión de recursos de forma diferente. 45

Servicios de un DBMS Relacional Arquitectura Cliente – Servidor Sistema de dos estratos dónde: el puesto cliente ejecuta una aplicación en un equipo local que envía peticiones de acciones sobre datos a un puesto servidor el puesto servidor ejecuta un DBMS que recibe peticiones sobre datos de varios puestos clientes y las procesa 46

Actores con los DBMS Relacional Administradores de Bases de Datos: Tiene conocimiento de las necesidades de información de la organización, para lo que: Diseña una Arquitectura de Base de Datos apropiada Asigna derechos de acceso a los usuarios Realiza especificaciones de integridad de datos Planifica las modificaciones y/o cambios a la Arquitectura Usuarios de Bases de Datos Programadores de Aplicaciones: Construyen interfaces para almacenar datos y para generar informes rutinarios Usuarios de las Aplicaciones: Utilizan interfaces programadas para ingresar datos y generar reportes de rutina Usuarios Especiales: Realizan consultas no previstas mediante una interfaz especial que provee el DBMS 47

Tendencias de los DBMS 48

Fortalezas generadoras de ventajas competitivas de los DBMS Seguridad y Auditoría Confiabilidad Distribución Performance Datos Distribuídos Tecnología de Objetos Backups Data Warehousing Bases Documentales Consultas Difusas 49

DBMS: Seguridad y Auditoría Seguridad: privilegios a nivel usuario y grupo Facilidades de Auditoria: Registro de las acciones realizadas por los usuarios sobre los objetos para realizar seguimiento Máscaras de auditoría (generales o por usuario) que definen los eventos a auditar Separación de roles de administración _require _exclude _default _user masks usuario Registros de Audit Audit File o Event Log 50

DBMS: Confiabilidad Alta Disponibilidad Espejado (mirroring) / Replicación Tecnología que permite configurar dos servidores de Bases de Datos uno principal en servicio y otro secundario de resguardo en espera (stand by). Ambos actualizan los datos simultáneamente, y en caso de que el principal falle (failover) se produce una permutación automática asumiendo la responsabilidad de servicio el segundo servidor, quedando el primero fuera de servicio hasta su reparación. En servicio En espera Motor 2 Motor 1 mirroring Data Set 1,2 Data Set 3,4 Log 1 Log 2 FAIL OVER Fuera de servicio En servicio Motor 1 Motor 2 Data Set 3,4 Log 1 Data Set 1,2 Log 2 51

Administración centralizada y automatizada DBMS: Distribución Servicio de administración de envíos de datos mediante una arquitectura publicación – suscripción, a través de definiciones de publicitantes y suscriptores. Casa Central Administración centralizada y automatizada ACA Enterprise Replication With DSA available everywhere you are able to have transparent replication and a powerful, automated system management environment that allows for a scalable, remote , distributed system management environment. A number of major retailers are using Informix solutions to manage the day to day transactions at the store level -- and then transfer that information to regional and a central database. Management information is then summarized, analyzed and replicated to each level to maximize control and spot trends. 14 52 27 14

DBMS: Performance Escalabilidad Capacidad desarrollada a un mismo motor de base de datos para que funcione y se conecte con distintas configuraciones de sistemas operativos y plataformas de hardware Massively Parallel Cluster SMP Workgroups Desktops Advance Decision Support Extended Parallel Advance Decision Support Universal Data Workgroup Developer 53

DBMS: Bases de Datos Distribuidas (BDD) Sucursal 1 Conjunto de múltiples bases de datos lógicamente relacionadas las cuales se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones. RED Sucursal 2 Sucursal N Sucursal 3 54

DBMS: Objetos Ofrece facilidades para que el usuario pueda crear sus propios tipos de datos y los métodos de tratamiento de los mismos Pueden existir dos tipos de DBMS Relacional con Orientación a Objetos Orientado a Objeto Puro 55

DBMS: Data Warehouse Almacén de datos donde se copian las transacciones de la Base de Datos Transaccional, con una estructura orientada a la toma de decisiones o para el análisis de datos According to Bill Inmon’s definition of a data warehouse, it is a subject-oriented, integrated, time-variant, nonvolatile collection of data in support of management decisions. We, at Informix, have adapted Bill’s definition. In simpler terms, a data warehouse is an integrated set of data accessible by empowered end users to support analysis and decisions. Historically, OLTP systems are transaction-driven instead of subject-oriented. For example, in a bank, applications might be separate by loans, savings, bank credit card while in a subject-oriented system customer, accounts and activities might be the subject categories. Customer profiling is a popular application of a data warehouse environment. Integrated data refers to bringing data together from a number of disparate sources and in the process, scrubbing the data to deliver consistent formats and naming conventions. Time variance refers to the length of time that data is maintained in a database. Typically, in operational systems, the data is 30 to 90 days old while in a data warehouse the data might go back 5-10 years. Since the data warehouse is a non-volatile environment, the data is a snapshot in time and does not get updated in real-time. The data warehouse gets refreshed on a periodic basis (daily, weekly, monthly, etc.). Let’s take a look at the bank example on the next slide. 56

DBMS: Duplicaciones y Restauraciones Componentes de duplicación preventiva de datos a otros medios de resguardo; y restauración de los mismos ante fallas o destrucción del soporte de almacenamiento principal en línea. Tipos de duplicaciones: COMPLETO: Copia todos las tablas seleccionados. INCREMENTAL: Copia sólo las tablas que han cambiado desde la primer copia COMPLETA realizada. DIFERENCIAL: Copia sólo las tablas que han cambiado desde la última copia DIFERENCIAL realizada. 57

DBMS: Duplicaciones y Restauraciones COMPLETO 58

DBMS: Duplicaciones y Restauraciones DIFERENCIAL 59

DBMS: Duplicaciones y Restauraciones INCREMENTAL 60

DBMS: Documentales Según el contenido se clasifican: Texto completo: permiten el acceso al propio documento en formato electrónico Referenciales: Sólo contienen la información fundamental para describir y permitir la localización de los documentos, impresos o electrónicos Según la cobertura temática se clasifican: Multidisciplinares: cobertura temática amplia, abarcan varias disciplinas o áreas temáticas. Especializadas: recogen información de un área temática concreta. 61

DBMS: Consultas Difusas Fuzzy SQL: Extensión del SQL que permite el tratamiento difuso usando la lógica creada por Lofti A. Zadeh. Las ventajas más importantes son las de: Realizar consultas con Condiciones Difusas: Provee más respuestas que las consultas clásicas, puesto que éstas suelen ser demasiado restrictivas. Obtener Resultados Difusos: Por cada elemento recuperado, se consigue una medida de cumplimiento sobre las condiciones establecidas, como: no cumple estrictamente las condiciones impuestas en la consulta cumple dichas condiciones de forma parcial 62

Desarrollo de Software Sistemas de Aplicación

¿Comprar o Desarrollar? PROYECTO Analisis de Necesidades Diseño del Requerimiento ¿Comprar o Desarrollar? Construcción del Sistema Adquisición del Sistema Prueba Instalación Entrega 64

Actividades en el Desarrollo de Sistemas del Negocio Externas: Clientes y Proveedores De Transición: Nuevos Procedimientos Beneficios para la Empresa Instalación Física Internas: Roles y Responsabilidades Personas y Habilidades Entorno, Cultura y Estilo Empresa en Marcha Especificación “del negocio” Inicio del Proyecto Análisis de las Necesidades Revisiones Pruebas de Validez Entrega del Sistema Actividades Técnicas Especificación “del sistema” Trabajos Técnicos Diseño técnico Construcción del Sistema Integración y verificación Sistema Probado 65

Desarrollo de Software Sistemas de Aplicación Para producir Sistemas de Aplicación hay que tener: Metodología: Secuencia de etapas y actividades que a llevar a delante por uno o varios actores. Herramientas y Técnicas: Recursos reales o conceptuales para desarrollar las tareas de cada etapa y obtener el resultado esperado Existen varias metodologías como resultado de la evolución de la experiencia

Desarrollo de Software Sistemas de Aplicación Metodología clásica o tradicional Etapa Herramientas / Técnicas Estudio de Sistemas Entrevistas - Cuestionarios Análisis de Sistemas Diagrama de Flujo de Datos Diseño de Sistemas Modelo Entidad-Relación Producción Prueba Puesta en marcha Mantenimiento 67

Análisis de Sistemas Análisis: Distinción y separación de las partes de un todo hasta llegar a conocer sus principios o elementos. Puede representase mediante un Modelo. Modelo: Esquema teórico que representa los aspectos esenciales de una realidad compleja para facilitar su comprensión y estudio de acuerdo a ciertos criterios. Es necesariamente una simplificación de la realidad.

Modelo de Comportamiento Análisis de Sistemas Modelo Contextual Ambiente Modelo de Comportamiento Sistema

Análisis Estructurado de Sistemas Técnica de modelación gráfica que describe una visión lógica de un Sistema para que el usuario pueda conocer las características antes de su implementación. Utiliza un método efectivo de partición (división – separación). Una herramienta conocida (entre otras) es el Diagrama de Flujo de Datos (versión de Chris Gane y Chris Searson, versión de Yourdon y versión de De Marco)

Diagramas de Flujo de Datos (DFD) Técnica de Análisis Estructurado. Grafica el flujo de datos que ocurre dentro de un Sistema, sin considerar aspectos físicos ni flujos de control (no hay iteraciones) Se centra en el estudio de los procesos de transformación de datos que realizan los sistemas.

Diagramas de Flujo de Datos (DFD) Símbolos Entidad Externa Flujo de datos Proceso Almacén de datos Versión de Chris Gane & Chris Searson

Convenciones en los DFD Entidad Externa Representa un conjunto de actores del medio ambiente a los que se le dan y/o de los que se recibe (fuente o destino de datos). Debe nombrarse con una descripción de sujeto que la identifique. Por Ej.: Banco, Proveedor, Estado, Cliente, Alumno, etc. Entidad: Colectividad considerada como unidad que se trata de la misma manera

Convenciones en los DFD Flujo de datos Entre una Entidad y un Proceso: Representa el movimiento de datos de un punto (origen) hacia otro (destino). Debe nombrarse en singular representando al conjunto de datos que fluye (nunca nombres iguales) Entre un Proceso y un Archivo: Representa el conjunto de datos que debe almacenarse o que debe recuperarse. No se los nombra

Convenciones en los DFD Proceso Representa una transformación de flujos de datos entrantes en flujos de datos salientes Debe existir al menos una entrada y una salida Debe nombrarse representativamente a las tareas a realizar Por Ej.: Para el proceso de emisión de nómina de alumnos inscritos en un curso Nombre bueno: Emitir nómina de inscritos del curso Nombre malo: Generación de listado alumnos

Convenciones en los DFD Almacén de datos Indica un depósito de datos en el que se agregan y se acceden Debe nombrarse de forma representativa al conjunto de datos o clase, y debe estar en plural y no estar codificado No contiene ninguna especificación física de la implementación del almacenamiento

Descomposición Jerárquica en DFD Cada DFD se puede descomponerse a su vez en varios DFDs uno por cada proceso Según el grado de detalle se definen DFD de contexto DFD de descomposición

DFD de Contexto Flujo Datos 1 Flujo Datos 2 SI Entidad A Entidad B Flujo Datos 4 Flujo Datos 3 Es la primera aproximación al análisis de un sistema, nos entrega una visión general y básica del SI (como caja negra) y sus interrelaciones con el contexto. Consiste en: Identificar entidades externas Identificar hechos, eventos, transacciones, peticiones/respuestas por cada entidad

DFD 1º descomposición SI Proceso 1 Proceso 2 Flujo Datos 1 Flujo Datos 2 Tabla 1 Entidad B Entidad A Tabla 2 Proceso 4 Tabla 3 Proceso 3 Flujo Datos 4 Flujo Datos 3 Cada proceso debe ser analizado para determinar los datos que transforma

Diccionario de Datos (DD) Describe la composición de los paquetes de datos a almacenar. Especifica los valores de las unidades de información en los flujos de datos y en los almacenes de datos. Se implementa por una notación específica universal (metadato). Metadato: No tiene definición única. La más difundida de es que son «datos sobre los datos».

Desarrollo de Software Metodología clásica o tradicional Etapa Herramientas / Técnicas Estudio de Sistemas Entrevistas - Cuestionarios Análisis de Sistemas Diagrama de Flujo de Datos Diseño de Sistemas Modelo Entidad-Relación Producción Prueba Puesta en marcha Mantenimiento 81

Diseño de Sistemas Diseño de Arquitectura de Base de Datos Diseño de Arquitectura de Software de Aplicación y de las interfaces en función de los roles de los usuarios

Diseño de Bases de Datos Se descompone en tres Modelos: diseño lógico (externo): Vista parcial de datos de interés para un sector a través de las aplicaciones. diseño conceptual: Arquitectura de toda la base de datos para una comunidad de usuarios, en la que se ocultan los detalles físicos de almacenamiento. diseño físico (interno): Estructura física de almacenamiento de la base de datos. Vista 1 Vista 2 Vista n Nivel conceptual Nivel físico Propuesta del comité ANSI-SPARC en 1975 ANSI (American National Standard Institute) SPARC (Standards Planning and Requirements Committee)

Diseño de Bases de Datos Vista 1 Interfaz 1 Nivel Conceptual Objetivo: Separar los programas de aplicación de la base de datos física. Nivel Físico Almacenamiento Físico Vista 2 Interfaz 2 Vista n Interfaz n Definen dos tipos de independencia: Lógica: Capacidad de modificar el esquema conceptual sin tener que alterar los esquemas externo e interno. Física: Capacidad de modificar el esquema interno sin tener que alterar los esquemas conceptual y externo. 84

Diseño Conceptual Proceso para construir el modelo de la información utilizada en una organización Es el primer paso en el diseño de una base de datos. El método más utilizado es el conocido como Modelo Entidad-Relación

Modelo Entidad-Relación Es el modelo más utilizado para el diseño conceptual de bases de datos. Introducido por Peter Chen en 1976. Está formado por un conjunto de conceptos que permiten describir la realidad mediante un conjunto de representaciones gráficas y lingüísticas.

Modelo Entidad-Relación Cualquier tipo de cosa, persona, concepto abstracto o suceso sobre el que se recoge información Ej.: empleados, clientes, empresas, productos, plan de cuentas, etc. Entidad: Colectividad considerada como unidad que se trata de la misma manera

Modelo Entidad-Relación Asociación entre dos o más entidades. Nombrar descriptivamente la función. Tipos: Relaciones 1-1: Ej: MATRIMONIO es relación entre (1) integrante de la entidad HOMBRE con (1) de la entidad MUJER. Relaciones 1-n: Ej: TRABAJAR-EN es la relación de (1) integrante de la entidad EMPERSA y (n) de la entidad TRABAJADOR. Relaciones n-n: Ej: MATRICULACION es la relación entre (n) integrantes de la entidad ALUMNO y (n) de la entidad MATERIA.

Modelo Entidad-Relación Atributo Características de una entidad o relación. Pueden ser: Simple (Ej: Documento) o Compuesto (Ej: Dirección: Calle, Nro, Piso) Se distinguen 2 tipos: Desciptivo: de las carácterísticas de un objeto, cosa, concepto o suceso dentro de una entidad o relación. Identificativo (o clave): Su valor no se repite dentro de la entidad o relación por lo que sirve para recuperar los atributos desciptivos Dominio: todos los valores posibles que puede tomar un atributo

Modelo Entidad-Relación Atributos

Modelo Entidad-Relación Entidades

Modelo Entidad-Relación Relaciones

Metodología de diseño conceptual Tareas a realizar examinando los DFD´s previos: Identificar las entidades. Identificar las relaciones. Identificar los atributos y asociarlos a entidades y relaciones. Determinar los dominios de los atributos. Determinar los identificadores. Dibujar el diagrama entidad-relación. Revisar el esquema conceptual local con el usuario.

Inteligencia de Negocios

¿ Cuál es el Contexto de los Negocios Actuales ? Competencia total Necesidad de conocer al cliente Importancia de las alianzas estratégicas Mercado exigente de lo mejor, más barato y más rápido Reacción a los cambios del negocio Ahogados en Datos y sedientos de Información

¿ Cuales son las necesidades del hombre de negocios ? Disponer de la correcta información para la persona adecuada en el momento justo y en forma correcta, para tomar el conjunto de decisiones que permitan adquirir ventajas competitivas.

¿ Cuales son las necesidades del hombre de negocios ? INFORMACIÓN TÁCTICA ESTRATÉGICA ANÁLISIS DINÁMICO ESTÁTICO ¿POR QUE HA PASADO? ¿PORQUE PUEDE PASAR? No considera el tiempo ¿QUE HA PASADO? ¿QUE PUEDE PASAR? 97

¿Qué es Inteligencia de Negocios? Utilización de herramientas de manipulación de datos con facilidades de: Extracción automatizada de un conjunto específico de datos almacenados en el sistema transaccional. Depuración de los datos extraídos ante las inconsistencias detectadas sobre reglas de negocio. Transformación de los datos depurados en las fuentes oficiales de información para toma de decisiones o para obtener indicadores. Extructuración de la información generada en bases de datos especiales. Explotación de las bases de datos generadas con herramientas Generadores de Reportes Sistemas de Análisis Multidimensional Sistemas de Apoyo a la Toma de Decisiones Sistemas de Información Ejecutiva 98

Concepto de Data Warehouse Colección o depósito de datos actuales e históricos, montados sobre una plataforma sólida, que facilita su integración para el procesamiento analítico sobre una amplia perspectiva de tiempo.

Concepto de Data Warehouse Base de Datos Operacional Data Warehouse Datos Operacionales Datos del negocio para Información Orientado a la aplicación Orientado al sujeto Actual Actual + histórico Detallada Detallada + más resumida Cambia continuamente Estable

Alcance del Data Warehouse Éxito táctico: Brindar un rápido beneficio al negocio Éxito estratégico: Expandir permanentemente el Data Warehouse

Principales características de un DW Orientado a temas Integrado De tiempo variante No volátil

Principales características de un DW Orientado a Temas La información se organiza alrededor de sujetos tales como cliente, vendedor, producto y actividad. Por ejemplo: para un fabricante: clientes, productos, proveedores y vendedores; para una universidad: estudiantes, clases y profesores; para un hospital: pacientes, personal médico, medicamentos. Influye en el diseño de la estructura clave de las bases de datos.

Principales características de un DW De Tiempo Variante La información representa a los datos sobre un horizonte largo de tiempo (5 a 10 años). La estructura clave contiene implícita o explícitamente un elemento de tiempo (día, semana, mes, trimestre, semestre, año, etc). Una vez registradas correctamente las vistas instantáneas, no pueden ser actualizados.

Principales características de un DW Integrado Se expresa de varias formas: convenciones de nombres consistentes medida uniforme de variables codificación de estructuras consistentes atributos físicos de los datos consistentes, fuentes múltiples, etc.

Principales características de un DW No Volátil La información es útil sólo cuando es estable a través del tiempo. Hay dos operaciones básicas luego de la carga inicial de datos en el momento de creación de la base de datos de información: Agregado periódico de datos desde la base de datos transaccional, aumentado su horizonte de tiempo Acceso a los mismos

¿ Qué es la Arquitectura de un DW ? Es la representación de: la estructura total de datos; Detalle de datos actuales Detalle de datos antiguos Datos ligeramente resumidos Datos completamente resumidos Metadatos los proceso de transformación de la fuente de datos desde la base de datos transaccional a la base de datos informacional la estructura de la presentación de informes y los algoritmos para calcular los indicadores,

Uso de Base de Datos Operacionales Usos del DW Uso de Base de Datos Operacionales Uso de Data Warehouse Muchos usuarios concurrentes Pocos usuarios concurrentes Consultas predefinidas y actualizables Consultas complejas, frecuentemente no anticipadas. Cantidades pequeñas de datos detallados Cantidades grandes de datos detallados Requerimientos de respuesta inmediata Requerimientos de respuesta no críticos

Aplicaciones de DW Análisis de ventas Marketing Control de calidad y Performance de ventas Seguimiento de garantías Administración de riesgo crediticio Análisis de tendencias Rentabilidad de líneas de productos

Pasos para la Construcción de un DW Definir el alcance: Identificar las características del negocio y los requerimientos de información Identificar los departamentos importantes y obtener soporte de los integrantes Desarrollar las preguntas del alto nivel del negocio y priorizarlas Modelar la arquitectura sólida de la Base de Datos Informacional Ensamblar los datos Transformar la fuente de datos Distribuir los datos donde y cuando se necesiten

Software de Bases de Datos para DW Funciones adicionales de los DBMS: OLAP: Procesamiento para Análisis de Datos en Línea Extraer datos Rotar y pivotear resultados Calcular y comparar Cambiar la visión Maximizar o minimizar detalles Observar rankings y excepciones Mutidimensionalidad: Modelo orientado al soporte en la toma de decisiones, con eficiente almacenamiento de datos que supera al relacional con: Funciones de serie de tiempo Comparación de períodos Análisis de excepciones Comparaciones y rankings Pronósticos basados en modelos

DW

Data Marts Son DWs de alcance limitados, construidos rápidamente para soportar líneas de negocio simple o pequeños reservorios de datos específicos para distintos departamentos de la empresa: RRHH Finanzas Atención a clientes Producción Representan una estrategia que es particularmente apropiada cuando el Data Warehouse central crece muy rápidamente y los distintos departamentos requieren sólo una pequeña porción de los datos contenidos en él.

De Data Warehouse a Data Marts Fuente 1 Datos Warehouse Fuente 2 Fuente 3 Servicio al Cliente Mart Ventas Mart Finanzas Mart

De Data Marts a Data Warehouse Ventas Mart Fuente 1 Finanzas Mart Fuente 2 Data Warehouse Fuente 3 Servicio al Cliente Mart

Esquema de Inteligencia de Negocios

Herramienta para Inteligencia de Negocios

Herramienta para Inteligencia de Negocios

Data Mining (Minería) Actividad: Dedicada a la búsqueda de correlaciones entre datos y a la construcción de modelos predictivos a partir de ellos. Realizada en base a técnicas de: análisis estadístico, análisis clúster, análisis discriminante, etc. Con metodología estructurada de: Muestreo Exploración Manipulación Modelización Valoración

Big Data - Concepto Tratamiento y análisis de enormes repositorios de datos, desproporcionadamente grandes, con variados formatos, estructurados, medianamente estructurados y desestructurados, que resulta imposible tratarlos con las herramientas de bases de datos y analíticas convencionales

Infraestructura Big Data

Herramientas de Big Data

Data