La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

SISTEMAS DE INFORMACIÓN

Presentaciones similares


Presentación del tema: "SISTEMAS DE INFORMACIÓN"— Transcripción de la presentación:

1 SISTEMAS DE INFORMACIÓN
MÓDULO DE TECNOLOGÍA DE INFORMACIÓN (TI)

2 SISTEMAS DE INFORMACION TECNOLOGIA DE INFORMACION
BASES DE DATOS TECNOLOGIA DE INFORMACION ( TI ) HARDWARE SOFTWARE COMUNICACIONES

3 Tecnología de Información
CAPITULO 6°: ADMINISTRACIÓN DE DATOS MBA SERGIO ORTEGA Material revisado para la cursada 2009

4 CAPITULO 6°: ADMINISTRACIÓN DE DATOS
6.1. Almacenamientos externos en general: conceptos básicos; técnicas de organización; aspectos físicos y lógicos. 6.2. Bases de datos: conceptos básicos; clasificaciones; aspectos físicos y lógicos; principales componentes. Ventajas y aportes a las necesidades de los procesos de negocios. 6.3. Nuevas arquitecturas de bases de datos. Evolución. Bases multidimensionales. De Objetos. Bases de datos en la web. 6.4. Manejo de datos. Lenguajes de definición y consulta. 6.5. Estructuras lógicas de datos. Técnicas de formalización: diagramas de entidad relación (DER); esquemas; diccionarios de datos. 6.6. Aportes a la administración del conocimiento. Tendencias. 6.7. Técnicas de resguardo y seguridad en archivos tradicionales y en bases de datos.

5 BIBLIOGRAFIA Básica: Laudon & Laudon, Sistemas de Información Gerencial. Organización y tecnología de la empresa conectada en red. Sexta Edición. Prentice Hall, México 2002. Capítulo 8: pág. 226/256 Laudon & Laudon, Sistemas de Información Gerencial. Administración de la Empresa Digital. Octava Edición. Prentice Hall, México 2004. Capítulo 7: pág. 218/247 Apunte de Cátedra: .

6 Conceptos 6

7 Dato e Información Dato: Codificación cualitativa y/o cuantitativa de un hecho. Información: Resultado de procesar datos mediante algoritmos lógico-matemáticos. Proceso de Datos: Secuencia de operaciones matemáticas (algoritmo) a la que se someten los datos para transformarlos en información. Algoritmo: Secuencia definida, ordenada y finita de operaciones que permite hallar la solución a un problema.

8 Dato: La presencia o ausencia de un alumno en la clase(i)
Ej. de Dato Dato: La presencia o ausencia de un alumno en la clase(i)

9 Información: Porcentaje de asistencia de cada alumno(i)
Ej. de Información Información: Porcentaje de asistencia de cada alumno(i) Algoritmo: Tomar un alumno y contar las clases en que estuvo presente y dividir el resultado por la cantidad de clases dictadas y multiplicar el resultado por 100

10 Información: Porcentaje de asistencia de en clase(i)
Ej. de Información Información: Porcentaje de asistencia de en clase(i) Algoritmo: Tomar alumno por alumno y contar clase por clase si estuvo presente. Luego dividir el resultado de cada clase por la cantidad de alumnos del curso y multiplicar ese resultado por 100

11 Proceso administrativo de tratamiento de datos
Captura de datos: Medición del hecho, evento o transacción Codificación cualitativa y*o cuantitativa Registración (analógica o digital) Almacenamiento en soportes primarios o secundarios Recuperación de información: Selección de un conjunto de datos almacenados Procesamiento bajo la lógica de algún algoritmo Presentación (reporte gráfico y/o escrito)

12 Soportes de almacenamiento de datos
Primarios: Medios naturales de registro escrito manual o mecanizado en: comprobantes, documentos, planillas, etc. Secundarios: Medios artificiales de registro mediante dispositivos tecnológicos especializados (hardware) discos magnéticos u ópticos, cintas magnéticas memorias, etc. organizados en forma de archivos o bases de datos

13 Archivos de almacenamiento de datos
Agrupación de registros homogéneos, dónde: Registro: es una agrupación de campos Campo: es una agrupación de caracteres (también conocido como ficheros) Los que pueden ser accedidos de forma: Secuencial: Recorrido de los registros uno tras otro y en el orden físico en el que están guardados, hasta encontrar el buscado. Secuencial indizado: Recorrido secuencial de un índice que almacena la dirección (o una sección) en la que se encuentra el registro buscado. Ej: en una guía telefónica, índice de localidad y apellidos desde/hasta Directo: acceso a un registro determinado sin necesidad de recorridos.

14 Archivos de almacenamiento de datos
Archivo o Fichero: Conjunto de registros Registro: Conjunto de campos Campo: Conjunto de caracteres

15 Archivos de almacenamiento de datos
Ambiente Tradicional Software SIST. APLICACION SIST. OPERATIVO Hardware ARCH. DE DATOS

16 Archivos de almacenamiento de datos
Organización Tradicional Sistema de Ventas Sistema de Producción Sistema de Administr. Sistema de Almacenes Arch. de Ventas Arch. de Producción Arch. de Administr. Arch. de Almacenes

17 Archivos de almacenamiento de datos
Problemas Redundancia: Datos repetidos en diferentes ficheros Inconsistencia: Datos incoherentes con su significado (por ej. Fecha) Incongruencia: Datos relacionados incompletos (registrar asistencia de alumnos no matriculados) Inaccesibilidad: Construcción de programas para visualizar datos Fragmentación: Almacenamiento datos relacionados en múltiples ficheros (ej: cabecera de factura y renglones) Atomicidad de actualización: Ficheros parcialmente actualizados ante fallos (ej cabecera de factura y renglones) Concurrencia: Accesos simultáneos de varios usuarios requiere implementar bloqueos frente a acciones de grabación y borrado Seguridad: No provee un esquema de perfiles de usuarios en el que pueda predefinirse los permisos de acción sobre los ficheros.

18 Bases de Datos 18

19 Definición de James Martin
Base de Datos Definición de James Martin Colección de datos interrelacionados almacenados sin redundancias perjudiciales o innecesarias, su finalidad es servir a una aplicación o más, de la mejor manera posible; los datos se almacenan de modo que resulten independientes de los programas que los usan; se emplean métodos bien determinados para incluir datos nuevos y para modificar o extraer los datos almacenados

20 Base de Datos BASE DE DATOS Ambiente Actual Software SIST. APLICACION
D B M S SIST. OPERATIVO Hardware BASE DE DATOS

21 Sistema de Administración de Bases de Datos (DBMS)
Base de Datos Organización Actual Sistema de Ventas Sistema de Producción Sistema de Administr. Sistema de Almacenes Sistema de Administración de Bases de Datos (DBMS) BASE DE DATOS

22 Problemas que intenta solucionar
Base de Datos Problemas que intenta solucionar Almacenar datos y las relaciones de estos con otros datos Almacenar los datos una sola vez de forma independiente a su tratamiento Ofrecer recursos para mantener la integridad de los datos que se almacenan

23 Sistema de Administración de Bases de Datos
Base de Datos Sistema de Administración de Bases de Datos Es una colección de programas que facilitan los procesos de definición (arquitectura) y manipulación de archivos (tablas) relacionados, grabando, eliminando, modificando, visualizando y extrayendo datos de ellos.

24 Historia de Bases de Datos
A comienzos del 60 se observan los primeros intentos de construir un Sistema de Administración de Almacenamiento de Datos con el propósito de que los maneje de manera clara, sencilla y ordenada, para que posteriormente se conviertan en información relevante. Para poder construir un Sistema de Administración de Bases de Datos se necesita primero concebir un Modelo. La evolución de los modelos iniciales son: Jerárquico Red Relacional 24

25 Modelos de Base de Datos
Modelo Jerárquico: Se dice que comienza a mediados de los 60 con el proyecto Apolo (hombre a la luna), para gestionar la inmensa cantidad de datos que requería el mismo. La encargada NAA (North American Aviation), desarrolló el software GUAM (General Update Access Method) basado en el concepto árbol, para poder unir varias piezas pequeñas en una pieza más grande, y así sucesivamente hasta ensamblar el producto final. A mediados de los 60, NAA se une con IBM para perfeccionar a GUAM en el conocido software IMS (Information Management System). Almacena datos enlazando (con direcciones físicas) los registros (nodos) en forma de árbol donde un nodo padre de datos puede tener varios nodos hijos. 25

26 Modelos de Base de Datos
Modelo Red: A mediados de los 60 General Electric desarrolló IDS (Integrated Data Store, dirigido por uno de los pioneros en los sistemas de bases de datos, Charles Bachmann, para satisfacer la necesidad de representar relaciones entre datos, más complejas de las que se podían modelar con los sistemas jerárquicos y en parte, para imponer un estándar de bases de datos. A tal fin CODASYL (Conference on Data Systems Languages), integrado por representantes del gobierno de EEUU y de las empresas, formaron al grupo DBTG (Data Base Task Group), con el objetivo de definir las especificaciones estándar que permitieran la creación de bases de datos y el manejo de los mismos. En 1971 se presentó el informe final, aunque éste no fue formalmente aceptado por ANSI (American National Standards Institute). Almacena datos enlazando (con direcciones físicas) los registros (nodos) en forma de árbol donde un nodo padre de datos puede tener varios nodos hijos y un nodo hijo puede tener varios nodos padres. 26

27 Modelos de Base de Datos
Modelo Relacional: Desarrollo de comienzos del 70 por Edgar F. Codd para IBM, que concitó rápidamente la atención de los medios académicos, basado en la teoría matemática de conjuntos y consta de las siguientes características: Representación tabular: simple y fácil de implementar. Normalización: conjunto de restricciones evitan almacenar datos redundantes. Operadores poderosos: Manipulación de datos con el concepto del Algebra y Cálculo Relacional. Almacena datos en tablas enlazando (lógicamente) los registros entre tablas a través de un mismo atributo de enlace que se repiten en ambas tablas 27

28 Modelo Relacional 28

29 Modelo Relacional de Base de Datos
Tabla Tabla (Relación): Conjunto de objetos, hechos o conceptos almacenados en filas (Tuplas) Fila (Tupla): Conjunto de columnas (atributos) de un objeto, hecho o concepto Columna (Atributo): Característica de un objeto, hecho o concepto. Se clasifican en: Identificativos (clave única que no se repite nunca. Ej: DNI) Descriptivos (Ej: Apellido y Nombre, Dirección, … ect.) Dominio: Universo de posibles valores que puede adoptar un atributo (Ej: Estado Civil: {Soltero, Casado, Viudo, Separado, Divorciado}) Estructura de Tabla: Conjunto de descripciones que definen los tipos de datos en el que se almacenaran los valores heterogéneos de atributos 29

30 Modelo Relacional de Base de Datos
Estructura de Tabla 30

31 Modelo Relacional de Base de Datos
Normalización: Proceso de análisis de la naturaleza de los atributos y de las relaciones entre ellos para determinar en que tabla se almacena cada uno de ellos para evitar redundancias. Codd propuso 3 reglas iniciales Luego distintos investigadores del modelo aportaron 4reglas más Arquitectura de Base de Datos (Esquema): Conjunto de tablas (relaciones) resultantes de aplicar las reglas del análisis de normalización Vista: Tabla virtual que se genera con la extracción de atributos de varias tablas 31

32 Modelo Relacional de Base de Datos
Normalización Primera Regla Normal: Identifica la existencia de atributos para los diferentes objetos, hechos o conceptos desde 0 a n y se los separa en otra tabla (EJ: Objeto Empleado con Atributos Hijos se crean dos tablas Empleados e Hijos de Empleados) 32

33 Modelo Relacional de Base de Datos
Normalización Segunda Regla Normal: Identifica la existencia de atributos de un objeto, hecho o concepto que se asocian a otros que a su vez están relacionados entre sí. (EJ: Hecho Factura y Atributos Productos se crean dos tablas Renglones de Facturas y Lista de Productos) 33

34 Modelo Relacional de Base de Datos
Normalización Tercera Regla Normal: Identifica existencia de atributos de un objeto, hecho o concepto que se referencian con otros que a su vez están relacionados entre sí. (EJ: Objeto Empleado y Atributos Localidad se crean dos tablas Empleados y Localidades) 34

35 Modelo Relacional de Base de Datos
Los desarrollos de DBMS´s con los modelo Jerárquico y Red provocaban errores de funcionamiento frente a la necesidad de empleo de mecanismos complejos para vincular registros mediante direcciones físicas. El modelo Relacional permitió desarrollar DBMS´s exitosos porque se vinculaban lógicamente registros de diferentes tablas, mediante la utilización de los mecanismos de almacenamientos conocidos. Estas vinculaciones lógicas, permiten estructurar datos tanto en jerarquías como en redes. 35

36 Modelo Relacional de Base de Datos
Ventajas: Facilidad con el que se pueden diseñar Tablas para almacenar datos eliminando redundancias Desventajas: Complicación en la manipulación de Tablas cuando una aplicación posee demasiadas de ellas 36

37 DBMS 37

38 Sistema de Administración de Bases de Datos (DBMS)
Colección de programas que facilitan los procesos de definición (arquitectura) y manipulación de archivos (tablas) relacionados, grabando, eliminando, modificando, visualizando y extrayendo datos de ellos. 38

39 Estructura de un DBMS Relacional
Software Hardware DBMS SISTEMA OPERATIVO Administrador de Base de Datos Interprete DDL Desarrollador de Aplicaciones Interprete PL Archivos de Datos Gestor de BD Administrador de Archivos Trigger Usuario de Aplicaciones Archivos de Diccionario de Datos Procesador PL Usuario Casual Interprete SQL 39

40 Servicios de un DBMS Relacional
PL: Lenguaje de Procedimientos DDL: Lenguaje de Descripción de Datos SQL: Lenguaje de Consultas Trigger: Procedimientos Almacenados ODBC: Conexión Abierta a Bases de Datos Arquitectura Cliente – Servidor 40

41 Servicios de un DBMS Relacional
PL: Lenguaje de Procedimientos Se utiliza para redactar la lógica de los procesos a ejecutarse (interfaces de aplicaciones): para almacenar datos en la base de datos a partir de las entradas de datos para extraer los datos de las mismas, procesarlos y generar reportes. 41

42 Servicios de un DBMS Relacional
DDL: Lenguaje de descripción de datos Se utiliza para definir todos los atributos y las propiedades de cada tabla, especialmente: diseños de fila, definiciones de columna, columnas de clave (y, a veces, metodología de claves), ubicaciones de archivos y estrategia de almacenamiento. 42

43 Servicios de un DBMS Relacional
SQL: Lenguaje Estructurado de Consultas Se utiliza para efectuar y programar consultas a las bases de datos combinando los datos de las diferentes tablas. Es una evolución del lenguaje SEQUEL de D.D. Chamberlin y R.F. Boyce (1974) implementado por primera vez por IBM en su Base de Datos Relacional System R. Versiones: SQL1 o SQL86: Estandarizada en 1986 por ISO (International Standards Organization) y ANSI (American National Standards Institute). SQL2 o SQL–92 SQL3: Incluye conceptos de orientación a objetos. 43

44 Servicios de un DBMS Relacional
Trigger: Disparador de procedimientos almacenados Conjunto de comandos y o funciones permitidas que el usuario define para que éstas se ejecuten cuando se cumpla una condición establecida al realizar una operación de inserción, actualización o borrado de datos. 44

45 Servicios de un DBMS Relacional
ODBC: Conectividad Abierta de Bases de Datos Interfaz de programación de aplicaciones (API) de Microsoft. Define un conjunto estándar de rutinas con las que una aplicación puede tener acceso a datos de orígenes remotos. Drivers intermediario que facilita la comunicación entre DBMS de diseño y de gestión de recursos de forma diferente. 45

46 Servicios de un DBMS Relacional
Arquitectura Cliente – Servidor Sistema de dos estratos dónde: el puesto cliente ejecuta una aplicación en un equipo local que envía peticiones de acciones sobre datos a un puesto servidor el puesto servidor ejecuta un DBMS que recibe peticiones sobre datos de varios puestos clientes y las procesa 46

47 Actores con los DBMS Relacional
Administradores de Bases de Datos: Tiene conocimiento de las necesidades de información de la organización, para lo que: Diseña una Arquitectura de Base de Datos apropiada Asigna derechos de acceso a los usuarios Realiza especificaciones de integridad de datos Planifica las modificaciones y/o cambios a la Arquitectura Usuarios de Bases de Datos Programadores de Aplicaciones: Construyen interfaces para almacenar datos y para generar informes rutinarios Usuarios de las Aplicaciones: Utilizan interfaces programadas para ingresar datos y generar reportes de rutina Usuarios Especiales: Realizan consultas no previstas mediante una interfaz especial que provee el DBMS 47

48 Tendencias de los DBMS 48

49 Fortalezas generadoras de ventajas competitivas de los DBMS
Seguridad y Auditoría Confiabilidad Distribución Performance Datos Distribuídos Tecnología de Objetos Backups Data Warehousing Bases Documentales Consultas Difusas 49

50 DBMS: Seguridad y Auditoría
Seguridad: privilegios a nivel usuario y grupo Facilidades de Auditoria: Registro de las acciones realizadas por los usuarios sobre los objetos para realizar seguimiento Máscaras de auditoría (generales o por usuario) que definen los eventos a auditar Separación de roles de administración _require _exclude _default _user masks usuario Registros de Audit Audit File o Event Log 50

51 DBMS: Confiabilidad Alta Disponibilidad
Espejado (mirroring) / Replicación Tecnología que permite configurar dos servidores de Bases de Datos uno principal en servicio y otro secundario de resguardo en espera (stand by). Ambos actualizan los datos simultáneamente, y en caso de que el principal falle (failover) se produce una permutación automática asumiendo la responsabilidad de servicio el segundo servidor, quedando el primero fuera de servicio hasta su reparación. En servicio En espera Motor 2 Motor 1 mirroring Data Set 1,2 Data Set 3,4 Log 1 Log 2 FAIL OVER Fuera de servicio En servicio Motor 1 Motor 2 Data Set 3,4 Log 1 Data Set 1,2 Log 2 51

52 Administración centralizada y automatizada
DBMS: Distribución Servicio de administración de envíos de datos mediante una arquitectura publicación – suscripción, a través de definiciones de publicitantes y suscriptores. Casa Central Administración centralizada y automatizada ACA Enterprise Replication With DSA available everywhere you are able to have transparent replication and a powerful, automated system management environment that allows for a scalable, remote , distributed system management environment. A number of major retailers are using Informix solutions to manage the day to day transactions at the store level -- and then transfer that information to regional and a central database. Management information is then summarized, analyzed and replicated to each level to maximize control and spot trends. 14 52 27 14

53 DBMS: Performance Escalabilidad
Capacidad desarrollada a un mismo motor de base de datos para que funcione y se conecte con distintas configuraciones de sistemas operativos y plataformas de hardware Massively Parallel Cluster SMP Workgroups Desktops Advance Decision Support Extended Parallel Advance Decision Support Universal Data Workgroup Developer 53

54 DBMS: Bases de Datos Distribuidas (BDD)
Sucursal 1 Conjunto de múltiples bases de datos lógicamente relacionadas las cuales se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones. RED Sucursal 2 Sucursal N Sucursal 3 54

55 DBMS: Objetos Ofrece facilidades para que el usuario pueda crear sus propios tipos de datos y los métodos de tratamiento de los mismos Pueden existir dos tipos de DBMS Relacional con Orientación a Objetos Orientado a Objeto Puro 55

56 DBMS: Data Warehouse Almacén de datos donde se copian las transacciones de la Base de Datos Transaccional, con una estructura orientada a la toma de decisiones o para el análisis de datos According to Bill Inmon’s definition of a data warehouse, it is a subject-oriented, integrated, time-variant, nonvolatile collection of data in support of management decisions. We, at Informix, have adapted Bill’s definition. In simpler terms, a data warehouse is an integrated set of data accessible by empowered end users to support analysis and decisions. Historically, OLTP systems are transaction-driven instead of subject-oriented. For example, in a bank, applications might be separate by loans, savings, bank credit card while in a subject-oriented system customer, accounts and activities might be the subject categories. Customer profiling is a popular application of a data warehouse environment. Integrated data refers to bringing data together from a number of disparate sources and in the process, scrubbing the data to deliver consistent formats and naming conventions. Time variance refers to the length of time that data is maintained in a database. Typically, in operational systems, the data is 30 to 90 days old while in a data warehouse the data might go back 5-10 years. Since the data warehouse is a non-volatile environment, the data is a snapshot in time and does not get updated in real-time. The data warehouse gets refreshed on a periodic basis (daily, weekly, monthly, etc.). Let’s take a look at the bank example on the next slide. 56

57 DBMS: Duplicaciones y Restauraciones
Componentes de duplicación preventiva de datos a otros medios de resguardo; y restauración de los mismos ante fallas o destrucción del soporte de almacenamiento principal en línea. Tipos de duplicaciones: COMPLETO: Copia todos las tablas seleccionados. INCREMENTAL: Copia sólo las tablas que han cambiado desde la primer copia COMPLETA realizada. DIFERENCIAL: Copia sólo las tablas que han cambiado desde la última copia DIFERENCIAL realizada. 57

58 DBMS: Duplicaciones y Restauraciones
COMPLETO 58

59 DBMS: Duplicaciones y Restauraciones
DIFERENCIAL 59

60 DBMS: Duplicaciones y Restauraciones
INCREMENTAL 60

61 DBMS: Documentales Según el contenido se clasifican:
Texto completo: permiten el acceso al propio documento en formato electrónico Referenciales: Sólo contienen la información fundamental para describir y permitir la localización de los documentos, impresos o electrónicos Según la cobertura temática se clasifican: Multidisciplinares: cobertura temática amplia, abarcan varias disciplinas o áreas temáticas. Especializadas: recogen información de un área temática concreta. 61

62 DBMS: Consultas Difusas
Fuzzy SQL: Extensión del SQL que permite el tratamiento difuso usando la lógica creada por Lofti A. Zadeh. Las ventajas más importantes son las de: Realizar consultas con Condiciones Difusas: Provee más respuestas que las consultas clásicas, puesto que éstas suelen ser demasiado restrictivas. Obtener Resultados Difusos: Por cada elemento recuperado, se consigue una medida de cumplimiento sobre las condiciones establecidas, como: no cumple estrictamente las condiciones impuestas en la consulta cumple dichas condiciones de forma parcial 62

63 Desarrollo de Software Sistemas de Aplicación

64 ¿Comprar o Desarrollar?
PROYECTO Analisis de Necesidades Diseño del Requerimiento ¿Comprar o Desarrollar? Construcción del Sistema Adquisición del Sistema Prueba Instalación Entrega 64

65 Actividades en el Desarrollo de Sistemas
del Negocio Externas: Clientes y Proveedores De Transición: Nuevos Procedimientos Beneficios para la Empresa Instalación Física Internas: Roles y Responsabilidades Personas y Habilidades Entorno, Cultura y Estilo Empresa en Marcha Especificación “del negocio” Inicio del Proyecto Análisis de las Necesidades Revisiones Pruebas de Validez Entrega del Sistema Actividades Técnicas Especificación “del sistema” Trabajos Técnicos Diseño técnico Construcción del Sistema Integración y verificación Sistema Probado 65

66 Desarrollo de Software Sistemas de Aplicación
Para producir Sistemas de Aplicación hay que tener: Metodología: Secuencia de etapas y actividades que a llevar a delante por uno o varios actores. Herramientas y Técnicas: Recursos reales o conceptuales para desarrollar las tareas de cada etapa y obtener el resultado esperado Existen varias metodologías como resultado de la evolución de la experiencia

67 Desarrollo de Software Sistemas de Aplicación
Metodología clásica o tradicional Etapa Herramientas / Técnicas Estudio de Sistemas Entrevistas - Cuestionarios Análisis de Sistemas Diagrama de Flujo de Datos Diseño de Sistemas Modelo Entidad-Relación Producción Prueba Puesta en marcha Mantenimiento 67

68 Análisis de Sistemas Análisis: Distinción y separación de las partes de un todo hasta llegar a conocer sus principios o elementos. Puede representase mediante un Modelo. Modelo: Esquema teórico que representa los aspectos esenciales de una realidad compleja para facilitar su comprensión y estudio de acuerdo a ciertos criterios. Es necesariamente una simplificación de la realidad.

69 Modelo de Comportamiento
Análisis de Sistemas Modelo Contextual Ambiente Modelo de Comportamiento Sistema

70 Análisis Estructurado de Sistemas
Técnica de modelación gráfica que describe una visión lógica de un Sistema para que el usuario pueda conocer las características antes de su implementación. Utiliza un método efectivo de partición (división – separación). Una herramienta conocida (entre otras) es el Diagrama de Flujo de Datos (versión de Chris Gane y Chris Searson, versión de Yourdon y versión de De Marco)

71 Diagramas de Flujo de Datos (DFD)
Técnica de Análisis Estructurado. Grafica el flujo de datos que ocurre dentro de un Sistema, sin considerar aspectos físicos ni flujos de control (no hay iteraciones) Se centra en el estudio de los procesos de transformación de datos que realizan los sistemas.

72 Diagramas de Flujo de Datos (DFD)
Símbolos Entidad Externa Flujo de datos Proceso Almacén de datos Versión de Chris Gane & Chris Searson

73 Convenciones en los DFD
Entidad Externa Representa un conjunto de actores del medio ambiente a los que se le dan y/o de los que se recibe (fuente o destino de datos). Debe nombrarse con una descripción de sujeto que la identifique. Por Ej.: Banco, Proveedor, Estado, Cliente, Alumno, etc. Entidad: Colectividad considerada como unidad que se trata de la misma manera

74 Convenciones en los DFD
Flujo de datos Entre una Entidad y un Proceso: Representa el movimiento de datos de un punto (origen) hacia otro (destino). Debe nombrarse en singular representando al conjunto de datos que fluye (nunca nombres iguales) Entre un Proceso y un Archivo: Representa el conjunto de datos que debe almacenarse o que debe recuperarse. No se los nombra

75 Convenciones en los DFD
Proceso Representa una transformación de flujos de datos entrantes en flujos de datos salientes Debe existir al menos una entrada y una salida Debe nombrarse representativamente a las tareas a realizar Por Ej.: Para el proceso de emisión de nómina de alumnos inscritos en un curso Nombre bueno: Emitir nómina de inscritos del curso Nombre malo: Generación de listado alumnos

76 Convenciones en los DFD
Almacén de datos Indica un depósito de datos en el que se agregan y se acceden Debe nombrarse de forma representativa al conjunto de datos o clase, y debe estar en plural y no estar codificado No contiene ninguna especificación física de la implementación del almacenamiento

77 Descomposición Jerárquica en DFD
Cada DFD se puede descomponerse a su vez en varios DFDs uno por cada proceso Según el grado de detalle se definen DFD de contexto DFD de descomposición

78 DFD de Contexto Flujo Datos 1 Flujo Datos 2 SI Entidad A Entidad B Flujo Datos 4 Flujo Datos 3 Es la primera aproximación al análisis de un sistema, nos entrega una visión general y básica del SI (como caja negra) y sus interrelaciones con el contexto. Consiste en: Identificar entidades externas Identificar hechos, eventos, transacciones, peticiones/respuestas por cada entidad

79 DFD 1º descomposición SI Proceso 1 Proceso 2 Flujo Datos 1 Flujo Datos 2 Tabla 1 Entidad B Entidad A Tabla 2 Proceso 4 Tabla 3 Proceso 3 Flujo Datos 4 Flujo Datos 3 Cada proceso debe ser analizado para determinar los datos que transforma

80 Diccionario de Datos (DD)
Describe la composición de los paquetes de datos a almacenar. Especifica los valores de las unidades de información en los flujos de datos y en los almacenes de datos. Se implementa por una notación específica universal (metadato). Metadato: No tiene definición única. La más difundida de es que son «datos sobre los datos».

81 Desarrollo de Software
Metodología clásica o tradicional Etapa Herramientas / Técnicas Estudio de Sistemas Entrevistas - Cuestionarios Análisis de Sistemas Diagrama de Flujo de Datos Diseño de Sistemas Modelo Entidad-Relación Producción Prueba Puesta en marcha Mantenimiento 81

82 Diseño de Sistemas Diseño de Arquitectura de Base de Datos
Diseño de Arquitectura de Software de Aplicación y de las interfaces en función de los roles de los usuarios

83 Diseño de Bases de Datos
Se descompone en tres Modelos: diseño lógico (externo): Vista parcial de datos de interés para un sector a través de las aplicaciones. diseño conceptual: Arquitectura de toda la base de datos para una comunidad de usuarios, en la que se ocultan los detalles físicos de almacenamiento. diseño físico (interno): Estructura física de almacenamiento de la base de datos. Vista 1 Vista 2 Vista n Nivel conceptual Nivel físico Propuesta del comité ANSI-SPARC en 1975 ANSI (American National Standard Institute) SPARC (Standards Planning and Requirements Committee)

84 Diseño de Bases de Datos
Vista 1 Interfaz 1 Nivel Conceptual Objetivo: Separar los programas de aplicación de la base de datos física. Nivel Físico Almacenamiento Físico Vista 2 Interfaz 2 Vista n Interfaz n Definen dos tipos de independencia: Lógica: Capacidad de modificar el esquema conceptual sin tener que alterar los esquemas externo e interno. Física: Capacidad de modificar el esquema interno sin tener que alterar los esquemas conceptual y externo. 84

85 Diseño Conceptual Proceso para construir el modelo de la información utilizada en una organización Es el primer paso en el diseño de una base de datos. El método más utilizado es el conocido como Modelo Entidad-Relación

86 Modelo Entidad-Relación
Es el modelo más utilizado para el diseño conceptual de bases de datos. Introducido por Peter Chen en 1976. Está formado por un conjunto de conceptos que permiten describir la realidad mediante un conjunto de representaciones gráficas y lingüísticas.

87 Modelo Entidad-Relación
Cualquier tipo de cosa, persona, concepto abstracto o suceso sobre el que se recoge información Ej.: empleados, clientes, empresas, productos, plan de cuentas, etc. Entidad: Colectividad considerada como unidad que se trata de la misma manera

88 Modelo Entidad-Relación
Asociación entre dos o más entidades. Nombrar descriptivamente la función. Tipos: Relaciones 1-1: Ej: MATRIMONIO es relación entre (1) integrante de la entidad HOMBRE con (1) de la entidad MUJER. Relaciones 1-n: Ej: TRABAJAR-EN es la relación de (1) integrante de la entidad EMPERSA y (n) de la entidad TRABAJADOR. Relaciones n-n: Ej: MATRICULACION es la relación entre (n) integrantes de la entidad ALUMNO y (n) de la entidad MATERIA.

89 Modelo Entidad-Relación
Atributo Características de una entidad o relación. Pueden ser: Simple (Ej: Documento) o Compuesto (Ej: Dirección: Calle, Nro, Piso) Se distinguen 2 tipos: Desciptivo: de las carácterísticas de un objeto, cosa, concepto o suceso dentro de una entidad o relación. Identificativo (o clave): Su valor no se repite dentro de la entidad o relación por lo que sirve para recuperar los atributos desciptivos Dominio: todos los valores posibles que puede tomar un atributo

90 Modelo Entidad-Relación
Atributos

91 Modelo Entidad-Relación
Entidades

92 Modelo Entidad-Relación
Relaciones

93 Metodología de diseño conceptual
Tareas a realizar examinando los DFD´s previos: Identificar las entidades. Identificar las relaciones. Identificar los atributos y asociarlos a entidades y relaciones. Determinar los dominios de los atributos. Determinar los identificadores. Dibujar el diagrama entidad-relación. Revisar el esquema conceptual local con el usuario.

94 Inteligencia de Negocios

95 ¿ Cuál es el Contexto de los Negocios Actuales ?
Competencia total Necesidad de conocer al cliente Importancia de las alianzas estratégicas Mercado exigente de lo mejor, más barato y más rápido Reacción a los cambios del negocio Ahogados en Datos y sedientos de Información

96 ¿ Cuales son las necesidades del hombre de negocios ?
Disponer de la correcta información para la persona adecuada en el momento justo y en forma correcta, para tomar el conjunto de decisiones que permitan adquirir ventajas competitivas.

97 ¿ Cuales son las necesidades del hombre de negocios ?
INFORMACIÓN TÁCTICA ESTRATÉGICA ANÁLISIS DINÁMICO ESTÁTICO ¿POR QUE HA PASADO? ¿PORQUE PUEDE PASAR? No considera el tiempo ¿QUE HA PASADO? ¿QUE PUEDE PASAR? 97

98 ¿Qué es Inteligencia de Negocios?
Utilización de herramientas de manipulación de datos con facilidades de: Extracción automatizada de un conjunto específico de datos almacenados en el sistema transaccional. Depuración de los datos extraídos ante las inconsistencias detectadas sobre reglas de negocio. Transformación de los datos depurados en las fuentes oficiales de información para toma de decisiones o para obtener indicadores. Extructuración de la información generada en bases de datos especiales. Explotación de las bases de datos generadas con herramientas Generadores de Reportes Sistemas de Análisis Multidimensional Sistemas de Apoyo a la Toma de Decisiones Sistemas de Información Ejecutiva 98

99 Concepto de Data Warehouse
Colección o depósito de datos actuales e históricos, montados sobre una plataforma sólida, que facilita su integración para el procesamiento analítico sobre una amplia perspectiva de tiempo.

100 Concepto de Data Warehouse
Base de Datos Operacional Data Warehouse Datos Operacionales Datos del negocio para Información Orientado a la aplicación Orientado al sujeto Actual Actual + histórico Detallada Detallada + más resumida Cambia continuamente Estable

101 Alcance del Data Warehouse
Éxito táctico: Brindar un rápido beneficio al negocio Éxito estratégico: Expandir permanentemente el Data Warehouse

102 Principales características de un DW
Orientado a temas Integrado De tiempo variante No volátil

103 Principales características de un DW
Orientado a Temas La información se organiza alrededor de sujetos tales como cliente, vendedor, producto y actividad. Por ejemplo: para un fabricante: clientes, productos, proveedores y vendedores; para una universidad: estudiantes, clases y profesores; para un hospital: pacientes, personal médico, medicamentos. Influye en el diseño de la estructura clave de las bases de datos.

104 Principales características de un DW
De Tiempo Variante La información representa a los datos sobre un horizonte largo de tiempo (5 a 10 años). La estructura clave contiene implícita o explícitamente un elemento de tiempo (día, semana, mes, trimestre, semestre, año, etc). Una vez registradas correctamente las vistas instantáneas, no pueden ser actualizados.

105 Principales características de un DW
Integrado Se expresa de varias formas: convenciones de nombres consistentes medida uniforme de variables codificación de estructuras consistentes atributos físicos de los datos consistentes, fuentes múltiples, etc.

106 Principales características de un DW
No Volátil La información es útil sólo cuando es estable a través del tiempo. Hay dos operaciones básicas luego de la carga inicial de datos en el momento de creación de la base de datos de información: Agregado periódico de datos desde la base de datos transaccional, aumentado su horizonte de tiempo Acceso a los mismos

107 ¿ Qué es la Arquitectura de un DW ?
Es la representación de: la estructura total de datos; Detalle de datos actuales Detalle de datos antiguos Datos ligeramente resumidos Datos completamente resumidos Metadatos los proceso de transformación de la fuente de datos desde la base de datos transaccional a la base de datos informacional la estructura de la presentación de informes y los algoritmos para calcular los indicadores,

108 Uso de Base de Datos Operacionales
Usos del DW Uso de Base de Datos Operacionales Uso de Data Warehouse Muchos usuarios concurrentes Pocos usuarios concurrentes Consultas predefinidas y actualizables Consultas complejas, frecuentemente no anticipadas. Cantidades pequeñas de datos detallados Cantidades grandes de datos detallados Requerimientos de respuesta inmediata Requerimientos de respuesta no críticos

109 Aplicaciones de DW Análisis de ventas Marketing
Control de calidad y Performance de ventas Seguimiento de garantías Administración de riesgo crediticio Análisis de tendencias Rentabilidad de líneas de productos

110 Pasos para la Construcción de un DW
Definir el alcance: Identificar las características del negocio y los requerimientos de información Identificar los departamentos importantes y obtener soporte de los integrantes Desarrollar las preguntas del alto nivel del negocio y priorizarlas Modelar la arquitectura sólida de la Base de Datos Informacional Ensamblar los datos Transformar la fuente de datos Distribuir los datos donde y cuando se necesiten

111 Software de Bases de Datos para DW
Funciones adicionales de los DBMS: OLAP: Procesamiento para Análisis de Datos en Línea Extraer datos Rotar y pivotear resultados Calcular y comparar Cambiar la visión Maximizar o minimizar detalles Observar rankings y excepciones Mutidimensionalidad: Modelo orientado al soporte en la toma de decisiones, con eficiente almacenamiento de datos que supera al relacional con: Funciones de serie de tiempo Comparación de períodos Análisis de excepciones Comparaciones y rankings Pronósticos basados en modelos

112 DW

113 Data Marts Son DWs de alcance limitados, construidos rápidamente para soportar líneas de negocio simple o pequeños reservorios de datos específicos para distintos departamentos de la empresa: RRHH Finanzas Atención a clientes Producción Representan una estrategia que es particularmente apropiada cuando el Data Warehouse central crece muy rápidamente y los distintos departamentos requieren sólo una pequeña porción de los datos contenidos en él.

114 De Data Warehouse a Data Marts
Fuente 1 Datos Warehouse Fuente 2 Fuente 3 Servicio al Cliente Mart Ventas Mart Finanzas Mart

115 De Data Marts a Data Warehouse
Ventas Mart Fuente 1 Finanzas Mart Fuente 2 Data Warehouse Fuente 3 Servicio al Cliente Mart

116 Esquema de Inteligencia de Negocios

117 Herramienta para Inteligencia de Negocios

118 Herramienta para Inteligencia de Negocios

119 Data Mining (Minería) Actividad:
Dedicada a la búsqueda de correlaciones entre datos y a la construcción de modelos predictivos a partir de ellos. Realizada en base a técnicas de: análisis estadístico, análisis clúster, análisis discriminante, etc. Con metodología estructurada de: Muestreo Exploración Manipulación Modelización Valoración

120 Big Data - Concepto Tratamiento y análisis de enormes repositorios de datos, desproporcionadamente grandes, con variados formatos, estructurados, medianamente estructurados y desestructurados, que resulta imposible tratarlos con las herramientas de bases de datos y analíticas convencionales

121 Infraestructura Big Data

122 Herramientas de Big Data

123 Data


Descargar ppt "SISTEMAS DE INFORMACIÓN"

Presentaciones similares


Anuncios Google