La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Bases de datos 2011-2012 UNIDAD 1 ANÁLISIS INTRODUCTORIO DE LAS BASES DE DATOS.

Presentaciones similares


Presentación del tema: "Bases de datos 2011-2012 UNIDAD 1 ANÁLISIS INTRODUCTORIO DE LAS BASES DE DATOS."— Transcripción de la presentación:

1 Bases de datos 2011-2012 UNIDAD 1 ANÁLISIS INTRODUCTORIO DE LAS BASES DE DATOS

2 Bases de datos Introducción Información DRAEL: Comunicación o adquisición de conocimientos que permiten ampliar o precisar los conocimientos que se poseen de una materia determinada Clave para el porvenir de la Humanidad e indispensable para poder modelar bien este porvenir.

3 Bases de datos Introducción La información es el principal activo de las empresas La informática se ocupa del tratamiento de la información mediante computadoras

4 Bases de datos Concepto de sistema Conjunto de cosas que ordenadamente relacionadas entre sí contribuyen a un determinado objetivo.

5 Bases de datos Sistema: elementos Componentes: “conjunto de cosas…” Relaciones entre ellos Objetivo del sistema Entorno Límites Relaciones con el entorno: entradas y salidas

6 Bases de datos Sistema Normalmente el sistema interacciona con su entorno, estas relaciones suelen conocerse como Entradas y Salidas del sistema y se dice entonces que el sistema es Abierto.

7 Bases de datos La empresa como sistema

8 Bases de datos La empresa como sistema Funciones a desarrollar por una empresa: Controlar y gestionar el empleo de los recursos financieros. Comercializar de forma óptima los productos o servicios en los que la empresa basa su negocio. Fabricar productos o crear servicios que vender al mercado.

9 Bases de datos Sistema de Información “Un conjunto formal de procesos que, operando sobre una colección de datos estructurada según las necesidades de la empresa, recopilan, elaboran y distribuyen la información (o parte de ella) necesaria para las operaciones de dicha empresa y para las actividades de dirección y control correspondientes (decisiones) para desempeñar su actividad de acuerdo a su estrategia de negocio” (Andreu et al., 1999)

10 Bases de datos SI: Objetivo Ayudar al desempeño de las actividades en todos los niveles de la organización mediante el suministro de la información adecuada, con la calidad suficiente, a la persona apropiada, en el momento y lugar oportunos y con el formato mas útil para el perceptor.

11 Bases de datos Elementos de un SI Procedimientos y prácticas habituales Información Personas o usuarios Equipo de soporte: Fichas de trabajo y sus archivos Albaranes, facturas, … TI (tecnologías de la información, hardware, software,..)

12 Bases de datos Aplicación de las TI a los SI Cuando una empresa decide mejorar el rendimiento de su SI con medios informáticos, la solución óptima es una mezcla de actividades, con algunas partes automatizadas y otras que se realizan manualmente, por lo que puede distinguir de entre un SI total y un SIA (Sistema de Información automatizado). SI = SIA + Tareas manuales

13 Bases de datos Aplicación de las TI a los SI No confundir informática con sistema de información. Los informáticos son técnicos que aportan soluciones a los directivos de la empresa pero no tienen la potestad de decidir.

14 Bases de datos Aplicación de las TI a los SI No confundir el SIA con el soporte físico o sistema informático asociado constituido por el hardware, el software de base y las aplicaciones ya que también hay que incluir la realización de las aplicaciones software que permitan cubrir las necesidades de información de la empresa

15 Bases de datos

16 TI aplicadas a los SI Hasta ahora hemos trabajado con la noción de SI independientemente de la tecnología empleada. Pueden existir sistemas manuales, cuaderno, lapiz,… Las empresas han ido incorporando las TI para mejorar el rendimiento de los SI

17 Bases de datos Tratamiento de la información Manual: cajones, carpetas, fichas, … Informatizada SI Orientados al proceso o sistemas de gestión de ficheros SI orientados a los datos. Bases de datos

18 Bases de datos Tratamiento de la información Hay dos formas de almacenamiento y tratamiento de la información en soporte permanente externa a los programas. Los datos externos a los programas tradicionalmente se organizan en archivos Cuando la información a procesar es compleja (datos interrelacionados de distintos objetos) es más aconsejable la utilización de BD

19 Bases de datos Sistemas de ficheros (orientados a procesos) Un fichero es un conjunto de información sobre un mismo tema tratada como una unidad de almacenamiento y organizada de forma estructurada para la búsqueda de un dato individual. Están compuestos de registros homogéneos

20 Bases de datos Ejemplo Los datos de las nóminas de una empresa se pueden almacenar en un fichero en el que cada registro contiene los datos de la nómina de cada empleado.

21 Bases de datos Sistemas de ficheros Sobre los ficheros se realizan operaciones de recuperación o consulta y mantenimiento. Estas operaciones las realizan programas que actúan a nivel de registro. La mayor parte de las operaciones implican la localización de un registro concreto para luego leerlo, modificarlo, borrarlo,…

22 Bases de datos Organización de archivos Hay distintas formas de organizar la información en archivos según el uso que vaya a darse: Secuencial: los registros se encuentran en un determinado orden y han de ser leidos en este orden Indexada: se utiliza un índice para obtener la ubicación de la zona del archivo donde se encuentra el registro buscado Directa: La ubicación del registro se obtiene a partir del valor de la clave que identifica al registro.

23 Bases de datos Sistemas de ficheros (orientados a procesos) En un sistema de ficheros, los archivos se diseñan de acuerdo con los programas, es decir, una vez planteado el problema se decide si debe haber archivos, cuantos deben ser, qué organización tendrán, información qué contendrá cada uno, qué programas actuarán sobre ellos y como lo harán.

24 Bases de datos Ventajas Los programas son bastante eficientes ya que la estructura del archivo está pensada para el programa que lo va a usar. Cada programa almacena y utiliza sus propios datos. Independencia de procesos, la modificación de uno no afecta al resto

25 Bases de datos Desventajas Los programas que se realizan con posterioridad a la creación de un archivo pueden ser muy lentos al tener que usar una organización pensada a la medida de otro programa previo. Si se toma la decisión de crear nuevos archivos para el nuevo programa se puede entrar en un proceso de degeneración de la aplicación ya que: Gran parte de la información aparecerá duplicada en más de un archivo (redundancias) Al existir la información en varios archivos, los procesos de actualización se complican. Se corre el riesgo de tener datos incongruentes entre los distintos archivos (por ejemplo, dos domicilios diferentes de una misma persona en dos archivos por estar uno actualizado y otro no)

26 Bases de datos Desventajas Alta redundancia: se dice que hay redundancia cuando hay datos cuyo valor se puede obtener del de otros datos. Probabilidad de inconsistencia (datos contradictorios) Coste almacenamiento Difícil acceso a los datos Dependencia entre el programa y estructura física de los datos (la estructura física corresponde a la forma en que están contenidos los datos en la máquina).

27 Bases de datos Desventajas Tiempos de acceso elevados. Difícil acceso concurrente (simultáneo). Difícil administración. Riesgo de pérdida de Confidencialidad: cuando se trabaja con archivos el control de la seguridad y consulta del archivo lo hace el programa. No se puede impedir que alguien construya un programa para ver o modificar el contenido del archivo.

28 Bases de datos Sistemas de ficheros

29 Bases de datos Definición de BD Las BD surgen como alternativa a los y sistemas de ficheros, intentando eliminar o al menos reducir sus inconvenientes. Una BD es un sistema formado por un conjunto de datos y un paquete software para gestión de dicho conjunto de datos de tal modo que se controla el almacenamiento de datos redundantes, los datos resultan independientes de los programas que los usan, se almacenan las relaciones entre los datos y se puede acceder a los datos de diversas formas.

30 Bases de datos Requisitos que debe cumplir un Sistema de Base de datos Acceso múltiple: varios usuarios pueden acceder a la BD sin que se produzcan conflictos. Utilización múltiple: cada usuario podrá tener una imagen o visión particular de la BD Confidencialidad y seguridad: se controlará el acceso a los datos impidiéndoselo a los usuarios no autorizados. Uno concreto puede acceder a unos y a otros no.

31 Bases de datos Requisitos que debe cumplir un Sistema de Base de datos Protección contra fallos: deben existir mecanismos concretos de recuperación en caso de fallo. Independencia física: debe poder cambiarse el soporte físico de la BD sin que esto repercuta en la BD ni en los programas que la usan Independencia lógica: debe poder modificarse los datos contenidos en la BD, sus relaciones e incluir nuevos datos sin afectar a los progamas que la usan.

32 Bases de datos Requisitos que debe cumplir un Sistema de Base de datos Redundancia controlada: los datos se almacenan una sola vez.

33 Bases de datos SI orientados a datos Sistemas orientados a los datos Los datos se centralizan en una BD común a todas las aplicaciones. Colección o depósito de datos integrados, almacenados en soporte secundario, y con redundancia controlada.

34 Bases de datos

35 Bases de datos. Ventajas Independencia de datos y los programas permitiendo modificar datos sin modificar código. Menor redundancia Integridad de los datos: mayor dificultad de realizar incoherencias. Mayor seguridad: hay control de acceso Datos documentados: metadatos, permiten describir la información de la BD Acceso más eficiente Menos espacio de almacenamiento Permiten el acceso simultáneo o concurrente

36 Bases de datos Bases de datos. Desventajas Instalación costosa: software y hardware potentes Requiere personal cualificado Implantación larga y difícil Ausencia de estándares reales: dependencia de sistemas comerciales

37 Bases de datos SGBD Un SGBD es un cjto integrado de programas, procedimientos, lenguajes,… que suministra tanto a los usuarios como al administrador, los medios para describir, recuperar y manipular datos, manteniendo su integridad y confidencialidad...

38 Bases de datos Un SGBD debe contar con herramientas para: Creación y especificación de la estructura lógica (tablas, relaciones,…) Creación y administración de la estructura física (ficheros, espacio en disco, …) Manipulación de datos (altas, bajas, modificaciones) Recuperación en caso de desastre Creación de copias de seguridad Creación de aplicaciones Instalación de la BD Exportación e importación de datos

39 Bases de datos

40 Componentes de un SGBD Gestor de la BD Diccionario de datos Administrador de la BD Lenguajes

41 Bases de datos El gestor de la BD Conjunto de programas que se encargan de garantizar la privacidad, seguridad, integridad de los datos, acceso concurrente a ellos. Proporciona interfaz entre los datos, programas que manejan los datos y los usuarios

42 Bases de datos El diccionario de datos BD donde se almacena toda la descripción de la base de datos, información de la estructura de los datos, relaciones entre ellos, gestión … Debe contener la descripción interna, conceptual y externa de la BD, restricciones, descripción de las cuentas de usuario, autorizaciones de cada usuario,…

43 Bases de datos Administrador de la BD, DBA Persona encargada de la seguridad y control de los datos. Son tareas suyas: Definir el esquema lógico de la BD. Definir el esquema físico, es decir como van a estar almacenados físicamente los datos. Definir vistas de usuario Conceder autorización para el acceso a datos mediante la asignación de privilegios a usuarios Mantener la seguridad de los datos y poner en marcha métodos de recuperación caso de fallos. Mantenimiento del esquema lógico y físico de la BD.

44 Bases de datos Lenguajes El SGDB debe proporcionar lenguajes para definir y manipular datos. Son: Lenguaje de definición de datos DDL: para definir el esquema conceptual y los esquemas externos. Lenguaje de manipulación de datos DML, para manipular los datos, ie, insertar, modificar, eliminar o recuperar datos almacenados Lenguaje de control de datos DCL, para controlar el acceso a la información y la seguridad de los datos. De esto se encarga el administrador.

45 Bases de datos Lenguajes Se trata de lenguajes sencillos. No todos los lenguajes DDL y DML son iguales para todas las BD. Nota: algunos autores consideran el lenguaje DCL como parte del DDL

46 Bases de datos Personas que utilizan una BD

47 Bases de datos Personas que utilizan la BD

48 Bases de datos Estructura multicapa El proceso que realiza un SGBD está formado por varias capas que actúan de interfaces entre el usuario y los datos. Este modelo toma como objeto principal al usuario de la BD y modela el funcionamiento de la BD en una sucesión de capas cuya finalidad es ocultar y proteger la parte interna de las BD.

49 Bases de datos Estructura multicapa Para llegar a los datos hay que pasar por una serie de capas que desde la parte más externa, poco a poco van entrando entrando más en la realidad física de la BD.

50 Bases de datos

51

52 Niveles de abstracción En Bases de datos se utilizan tres esquemas para representar los datos: Esquema físico: cómo están almacenados los datos (unidades de disco, archivos y carpetas del sistema) Le afecta al administrador. Esquema conceptual: esquema teórico de cómo se organizan los datos y se interrelacionan, ie se lleva a cabo el diseño de la BD. Esquema externo. Es cómo se perciben los datos por el usuario final. Es la visión de los datos que poseen los usuarios finales a través de las aplicaciones que manejan la BD.

53 Bases de datos Niveles de abstracción

54 Bases de datos Estándar ANSI/X3/SPARC

55 Bases de datos ANSI/X3/SPARC Es el estándar que ha marcado el desarrollo de SGBD Basado en los tres niveles de abstracción  Tres esquemas de la BD Conceptual: estructura lógica de la base de datos Interno: cómo se guardan los datos en disco Externo: visión que tienen los usuarios de la BD El SGBD es el encargado de realizar las traducciones para pasar del esquema conceptual al físico Ver ejemplo Neptuno

56 Bases de datos Independencia lógico-física ž Independencia física de los datos. Aunque el esquema físico cambie, el esquema conceptual no debe verse afectado. Esto significa que aunque se añadan o cambien discos u otro hardware, o se modifique el SO u otros cambios relacionados con la física de la base de datos, el esquema conceptual permanece invariable. Independencia lógica de los datos. Significa que aunque se modifique el esquema conceptual, la vista que poseen las aplicaciones (los esquemas externos) no serán afectados.

57 Bases de datos Estructuras operacionales Cliente-Servidor: la BD y su SGBD están en un servidor al cual acceden los clientes a través del software cliente (BD centralizadas) Cliente multi-servidor: cuando los clientes acceden a datos situados en más de un servidor (BD distribuida). Hay un servidor de aplicaciones que recibe las peticiones y las traduce a los distintos servidores de datos. Actualmente tenemos la posibilidad Cliente/servidor Web/Servidor de datos, el cliente se conecta a un servidor mediante un navegador web y desde las páginas de este ejecuta las consultas. El servidor web traduce esta consulta al servidor (o servidores) de datos.

58 Bases de datos BD Distribuidas Los computadores de un sistema distribuido se comunican entre sí a través de diversos medios de comunicación, tales como cables de alta velocidad o líneas telefónicas.

59 Bases de datos BD Distribuidas Los procesadores de un sistema distribuido pueden variar en cuanto su tamaño y función. Pueden incluir microcomputadores pequeños, estaciones de trabajo y sistemas de computadores grandes de aplicación general. Estos procesadores reciben diferentes nombres, tales como localidades, nodos o computadores.

60 Bases de datos BD distribuidas Un sistema distribuido de BD consiste en un conjunto de localidades, cada uno de las cuales puede participar en la ejecución de transacciones que accedan a datos de una o varias localidades. La diferencia principal entre los sistemas de BD centralizados y distribuidos es que, en los primeros, los datos residen en una sola localidad, mientras que, en los últimos, se encuentran en varias localidades.

61 Bases de datos Ventajas BD distribuidas Expandibilidad. Al crecer una organización por la adición una nueva unidad, el nuevo nodo o unidad de localización de dato pasa a formar parte de la base de datos distribuida sin reconfigurar la BD completamente – el nuevo nodo casi automáticamente forma parte de la BD global.

62 Bases de datos Ventajas BD distribuidas Confiabilidad o Disponibilidad. Fácil conexión entre los datos de varias localizaciones sin tener en cuenta los SO y/o el hardware y software utilizados. La disponibilidad es fundamental para los sistemas de BD que se utilizan en aplicaciones de tiempo real. Por ejemplo, si una línea aérea no puede tener acceso a la información, es posible que pierda clientes a favor de la competencia.

63 Bases de datos Ventajas BD distribuidas Flexibilidad. Al realizar un movimiento en un dato de un lugar a otro o algún cambio en una localización física de ciertos nodos requeridos no hay que realizar cambios en la BD o su arquitectura.

64 Bases de datos Ventajas BD distribuidas Distribución de la carga de trabajo: La distribución de la carga de trabajo sobre los sitios se hace sobre la base de utilizar la potencia de las computadoras de cada sitio y maximizar paralelismo en la ejecución de las aplicaciones.

65 Bases de datos Ventajas BD distribuidas Sharing o Compartición. Los datos pueden ser compartidos por sucursales o usuarios diferentes de la misma organización u organizaciones diferentes, permitiendo así comunicación eficiente entre usuarios distantes.

66 Bases de datos Ventajas BD distribuidas La ventaja principal de compartir los datos por medio de la distribución es que cada localidad puede tener mejor control de sus datos almacenados localmente. Confiabilidad. La confiabilidad se logra al tener replicas de los datos, pues es posible recuperar una copia dañada o destruida a partir de otra. Razones económicas. Cuando se maximiza el acceso local de las aplicaciones a los datos se disminuye el tráfico en las comunicaciones.

67 Bases de datos Desventajas BD distribuidas Complejidad. Un sistema distribuido, es más complejo que el sistema centralizado. Las consideraciones adicionales tales como el control de concurrencia y la seguridad deberían tenerse en cuenta además las actualizaciones se complican proporcionalmente con el aumento de replicas en el sistema.

68 Bases de datos Desventajas BD distribuidas Mayor tiempo extra de procesamiento. El intercambio de mensajes y los cálculos adicionales que se requieren para coordinar las localidades son una forma de tiempo extra que no existe en los sistemas centralizados

69 Bases de datos Desventajas BD distribuidas Costo. La complejidad aumentada significa que los costos de mantenimiento y adquisición del sistema son mucho más altos que los de un DBMS centralizado.

70 Bases de datos Desventajas BD distribuidas Aumento del tráfico de comunicación. Cuando un sitio accede frecuentemente a los datos de otros sitios, aumenta el tráfico de mensaje y transacciones en la red, y por tanto las comunicaciones, lo que puede convertirse en un cuello de botella. Integridad. Debido a que no todos los datos se ubican en un lugar centralizado – una estación (nodo) - el fracaso podría ocasionar una pérdida de datos para otros nodos.

71 Bases de datos BD centralizadas Es una BD almacenada en su totalidad en un solo lugar físico, es decir, en una sola máquina y una sola CPU, y en donde los usuarios trabajan en terminales “tontas” que sólo muestran resultados.

72 Bases de datos BD centralizadas Los sistemas de BD centralizadas son aquellos que se ejecutan en un único sistema informático sin interaccionar con ninguna otra computadora. Tales sistemas comprenden el rango desde los sistemas de BD monousuario ejecutándose en computadoras personales hasta los sistemas de BD de alto rendimiento ejecutándose en grandes sistemas.

73 Bases de datos Características Se almacena completamente en una localidad central (mainframe o macrocomputadora), es decir, todos los componentes del sistema residen en un solo computador No posee múltiples elementos de procesamiento ni mecanismos de intercomunicación como las Bases de Datos Distribuidas. Los componentes de la Bases de Datos Centralizadas son: los datos, el software del SGBD (Sistema de Gestión de Base de Datos) y los dispositivos de almacenamiento secundario asociados, como disco de almacenamiento en línea de la base de datos y cintas para las copias de seguridad. El problema de seguridad es inherentemente fácil en estos sistemas de bases de datos.

74 Bases de datos Ventajas Se evita la redundancia. En sistemas que no usan Bases de Datos Centralizadas, cada aplicación tiene sus propios archivos privados o se encuentran en diferentes localidades. Esto a menudo origina enorme redundancia en los datos almacenados, así como desperdicio resultante del espacio de almacenamiento Se evita la inconsistencia. Ya que si un hecho específico se representa por una sola entrada (es decir, si la redundancia se elimina), la no- concordancia de datos no puede ocurrir.

75 Bases de datos Ventajas Pueden hacerse cumplir las normas establecidas. Con un control central de la base de datos, el DBA puede garantizar que se cumplan todas las formas aplicables a la representación de los datos. Normas de la compañía, de instalación, departamentales, industriales, nacionales o internacionales.

76 Bases de datos Ventajas Puede conservarse la integridad. El problema de la integridad es garantizar que los datos de la base de datos sean exactos. El control centralizado de la base de datos, ayuda a evitar la inconsistencia de los datos, por el mismo hecho de encontrarse en una sola máquina.

77 Bases de datos Desventajas Los mainframes (computadora central) no ofrecen mejor proporción precio/rendimiento que los microprocesadores de los sistemas distribuidos. Por lo general, cuando un sistema de Base de Datos Centralizada falla, se pierde toda la disponibilidad de procesamiento y sobre todo de la información confiada al sistema. Las cargas de trabajo no se pueden difundir entre diferentes computadoras, ya que los trabajos siempre se ejecutarán en la misma máquina.

78 Bases de datos Otras clasificaciones


Descargar ppt "Bases de datos 2011-2012 UNIDAD 1 ANÁLISIS INTRODUCTORIO DE LAS BASES DE DATOS."

Presentaciones similares


Anuncios Google