La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Base de Datos Distribuidas Bases de Datos II Universidad Argentina J. F. Kennedy - Año 2008 Maletin Yahoo => briefcase.yahoo.com Usuario => bd2_jfk Pssw.

Presentaciones similares


Presentación del tema: "Base de Datos Distribuidas Bases de Datos II Universidad Argentina J. F. Kennedy - Año 2008 Maletin Yahoo => briefcase.yahoo.com Usuario => bd2_jfk Pssw."— Transcripción de la presentación:

1 Base de Datos Distribuidas Bases de Datos II Universidad Argentina J. F. Kennedy - Año 2008 Maletin Yahoo => briefcase.yahoo.com Usuario => bd2_jfk Pssw => kennedy

2 2 Más de un DBMSMás de un DBMS En más de una máquinaEn más de una máquina Distribuidos en más de un sistema operativoDistribuidos en más de un sistema operativo En más de una redEn más de una red En vez de un DBMS en una única máquina, ahora podríamos tener: Base de Datos Distribuida

3 3 Cada sitio (DBMS) es una base de datos completa. Cada sitio (DBMS) es una base de datos completa. Base de Datos Distribuida Los DBMS acuerdan trabajar juntos Los DBMS acuerdan trabajar juntos Cualquier usuario accede como si los datos estuvieran en su SITIO, MAQUINA y DBMS. Cualquier usuario accede como si los datos estuvieran en su SITIO, MAQUINA y DBMS.

4 4 Una DB distribuida es conceptualmente equivalente a una DB virtual cuyas partes están en varia bases de datos REALES distintas Base de Datos Distribuida Para funcionar así se requiere de un componente de SOFT en el DBMS

5 5 Cada DBMS tiene: Sus almacenamientos Sus almacenamientos Sus usuarios Sus usuarios Su sistema de recuperación Su sistema de recuperación Su bitácora o LOG Su bitácora o LOG Su componente de comunicación Su componente de comunicación Sus componentes de funcionalidad de sociedad con otros DBMS Sus componentes de funcionalidad de sociedad con otros DBMS Base de Datos Distribuida

6 6 Los componentes Distribuido contemplan: Misma máquina Misma máquina Distinta maquina (LAN / WAN) Distinta maquina (LAN / WAN) Distintas tipologías de red Distintas tipologías de red Distintos sistemas operativos Distintos sistemas operativos Base de Datos Distribuida

7 7 Ventajas: Los datos LOCALES se almacenan localmente pudiendo atender peticiones locales aun cuando el resto de los DBMS no funcionen Los datos LOCALES se almacenan localmente pudiendo atender peticiones locales aun cuando el resto de los DBMS no funcionen Permite el acceso a datos REMOTOS almacenados en otros DBMS Permite el acceso a datos REMOTOS almacenados en otros DBMS La estructura de la base de datos distribuida refleja la estructura de la empresa. La estructura de la base de datos distribuida refleja la estructura de la empresa. Base de Datos Distribuida

8 8 Desventajas: Los sistemas distribuidos son más complejos. Los sistemas distribuidos son más complejos. Ante el usuario (analista) el sistema distribuido luce (o debería lucir) igual a uno que no es distribuido. Ante el usuario (analista) el sistema distribuido luce (o debería lucir) igual a uno que no es distribuido. Todos los problemas deberían ser a nivel de implementación (DBA). Todos los problemas deberían ser a nivel de implementación (DBA). Base de Datos Distribuida

9 9 ¿Qué requisitos debe cumplir una BD Dist: Regla Cero: Recordemos que desde el punto de vista del usuario un sistema distribuido debería ser idéntico a un sistema no distribuido. Base de Datos Distribuida

10 10 Se definieron las siguientes Reglas: Base de Datos Distribuida

11 11 AUTONOMIA LOCAL AUTONOMIA LOCAL Ninguna DEPENDENCIA de un SITIO CENTRAL Ninguna DEPENDENCIA de un SITIO CENTRAL OPERACIÓN CONTINUA OPERACIÓN CONTINUA INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de REPLICACION INDEPENDENCIA de REPLICACION PROCESAMIENTO de CONSULTAS DISTRIBUIDAS PROCESAMIENTO de CONSULTAS DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS INDEPENDENCIA HARWARD INDEPENDENCIA HARWARD INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA RED INDEPENDENCIA RED INDEPENDENCIA DBMS INDEPENDENCIA DBMS Base de Datos Distribuida

12 12 AUTONOMIA LOCAL AUTONOMIA LOCAL Ninguna DEPENDENCIA de un SITIO CENTRAL Ninguna DEPENDENCIA de un SITIO CENTRAL OPERACIÓN CONTINUA OPERACIÓN CONTINUA INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de REPLICACION INDEPENDENCIA de REPLICACION PROCESAMIENTO de CONSULTAS DISTRIBUIDAS PROCESAMIENTO de CONSULTAS DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS INDEPENDENCIA HARWARD INDEPENDENCIA HARWARD INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA RED INDEPENDENCIA RED INDEPENDENCIA DBMS INDEPENDENCIA DBMS Base de Datos Distribuida Todas las operaciones locales se deben resolver localmente

13 13 AUTONOMIA LOCAL AUTONOMIA LOCAL Ninguna DEPENDENCIA de un SITIO CENTRAL Ninguna DEPENDENCIA de un SITIO CENTRAL OPERACIÓN CONTINUA OPERACIÓN CONTINUA INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de REPLICACION INDEPENDENCIA de REPLICACION PROCESAMIENTO de CONSULTAS DISTRIBUIDAS PROCESAMIENTO de CONSULTAS DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS INDEPENDENCIA HARWARD INDEPENDENCIA HARWARD INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA RED INDEPENDENCIA RED INDEPENDENCIA DBMS INDEPENDENCIA DBMS Base de Datos Distribuida Es como una consecuencia del anterior. Si hubiera un sitio central del que dependieran el resto de los sitios, en caso de que el CENTRAL no funcionara quedarían los sitios LOCALES sin atender, ni siquiera las consultas locales.

14 14 AUTONOMIA LOCAL AUTONOMIA LOCAL Ninguna DEPENDENCIA de un SITIO CENTRAL Ninguna DEPENDENCIA de un SITIO CENTRAL OPERACIÓN CONTINUA OPERACIÓN CONTINUA INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de REPLICACION INDEPENDENCIA de REPLICACION PROCESAMIENTO de CONSULTAS DISTRIBUIDAS PROCESAMIENTO de CONSULTAS DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS INDEPENDENCIA HARWARD INDEPENDENCIA HARWARD INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA RED INDEPENDENCIA RED INDEPENDENCIA DBMS INDEPENDENCIA DBMS Base de Datos Distribuida Se espera que mejore la Operación Continua ya que da mejor: CONFIABILIDAD por que no se rompen todos los componentes juntos.CONFIABILIDAD por que no se rompen todos los componentes juntos. DISPONIBILIDAD por que si se trabaja con replica de datos, si un DBMS no responde, puede hacerlo otro y cuenta con los datos para ello.DISPONIBILIDAD por que si se trabaja con replica de datos, si un DBMS no responde, puede hacerlo otro y cuenta con los datos para ello.

15 15 AUTONOMIA LOCAL AUTONOMIA LOCAL Ninguna DEPENDENCIA de un SITIO CENTRAL Ninguna DEPENDENCIA de un SITIO CENTRAL OPERACIÓN CONTINUA OPERACIÓN CONTINUA INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de REPLICACION INDEPENDENCIA de REPLICACION PROCESAMIENTO de CONSULTAS DISTRIBUIDAS PROCESAMIENTO de CONSULTAS DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS INDEPENDENCIA HARWARD INDEPENDENCIA HARWARD INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA RED INDEPENDENCIA RED INDEPENDENCIA DBMS INDEPENDENCIA DBMS Base de Datos Distribuida El usuario no necesita saber donde están fisicamente los datos

16 16 AUTONOMIA LOCAL AUTONOMIA LOCAL Ninguna DEPENDENCIA de un SITIO CENTRAL Ninguna DEPENDENCIA de un SITIO CENTRAL OPERACIÓN CONTINUA OPERACIÓN CONTINUA INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de REPLICACION INDEPENDENCIA de REPLICACION PROCESAMIENTO de CONSULTAS DISTRIBUIDAS PROCESAMIENTO de CONSULTAS DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS INDEPENDENCIA HARWARD INDEPENDENCIA HARWARD INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA RED INDEPENDENCIA RED INDEPENDENCIA DBMS INDEPENDENCIA DBMS Base de Datos Distribuida El usuario no necesita saber como están fragmentados los datos

17 17 AUTONOMIA LOCAL AUTONOMIA LOCAL Ninguna DEPENDENCIA de un SITIO CENTRAL Ninguna DEPENDENCIA de un SITIO CENTRAL OPERACIÓN CONTINUA OPERACIÓN CONTINUA INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de REPLICACION INDEPENDENCIA de REPLICACION PROCESAMIENTO de CONSULTAS DISTRIBUIDAS PROCESAMIENTO de CONSULTAS DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS INDEPENDENCIA HARWARD INDEPENDENCIA HARWARD INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA RED INDEPENDENCIA RED INDEPENDENCIA DBMS INDEPENDENCIA DBMS Base de Datos Distribuida El usuario no necesita saber cuales datos replicados y cuales no

18 18 AUTONOMIA LOCAL AUTONOMIA LOCAL Ninguna DEPENDENCIA de un SITIO CENTRAL Ninguna DEPENDENCIA de un SITIO CENTRAL OPERACIÓN CONTINUA OPERACIÓN CONTINUA INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de REPLICACION INDEPENDENCIA de REPLICACION PROCESAMIENTO de CONSULTAS DISTRIBUIDAS PROCESAMIENTO de CONSULTAS DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS INDEPENDENCIA HARWARD INDEPENDENCIA HARWARD INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA RED INDEPENDENCIA RED INDEPENDENCIA DBMS INDEPENDENCIA DBMS Base de Datos Distribuida Procesar 2 SQL implica que se deben enviar y recibir 2 msg a 2 DBMS. Fundamental para resolver estos casos el papel que cumple el OPTIMIZADOR

19 19 AUTONOMIA LOCAL AUTONOMIA LOCAL Ninguna DEPENDENCIA de un SITIO CENTRAL Ninguna DEPENDENCIA de un SITIO CENTRAL OPERACIÓN CONTINUA OPERACIÓN CONTINUA INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de REPLICACION INDEPENDENCIA de REPLICACION PROCESAMIENTO de CONSULTAS DISTRIBUIDAS PROCESAMIENTO de CONSULTAS DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS INDEPENDENCIA HARWARD INDEPENDENCIA HARWARD INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA RED INDEPENDENCIA RED INDEPENDENCIA DBMS INDEPENDENCIA DBMS Base de Datos Distribuida Debe manejar la concurrencia (bloqueo) y la confirmación en 2 fases.

20 20 AUTONOMIA LOCAL AUTONOMIA LOCAL Ninguna DEPENDENCIA de un SITIO CENTRAL Ninguna DEPENDENCIA de un SITIO CENTRAL OPERACIÓN CONTINUA OPERACIÓN CONTINUA INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de UBICACIÓN INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de FRAGMENTACION INDEPENDENCIA de REPLICACION INDEPENDENCIA de REPLICACION PROCESAMIENTO de CONSULTAS DISTRIBUIDAS PROCESAMIENTO de CONSULTAS DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS ADMINISTRACION de Transacciones DISTRIBUIDAS INDEPENDENCIA HARWARD INDEPENDENCIA HARWARD INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA SISTEMA OPERATIVO INDEPENDENCIA RED INDEPENDENCIA RED INDEPENDENCIA DBMS INDEPENDENCIA DBMS Base de Datos Distribuida

21 21 Algunos Problemas: El Procesamiento de consulta El Procesamiento de consulta La Administración de catálogo La Administración de catálogo La Propagación de las actualizaciones o Replicas La Propagación de las actualizaciones o Replicas El Control de Recuperabilidad El Control de Recuperabilidad El Control de concurrencia El Control de concurrencia Base de Datos Distribuida

22 22 Algunos Problemas: El procesamiento de consulta El procesamiento de consulta La Administración de catálogo La Administración de catálogo La Propagación de las actualizaciones o Replicas La Propagación de las actualizaciones o Replicas El Control de Recuperabilidad El Control de Recuperabilidad El Control de concurrencia El Control de concurrencia Base de Datos Distribuida –PASO 1: Optimizar consulta GLOBAL. Hay que definir una estrategia para determinar en donde ejecutar la consulta, como distribuira joins, etc –PASO 2: Optimización LOCAL

23 23 Algunos Problemas: El Procesamiento de consulta El Procesamiento de consulta La Administración de catálogo La Administración de catálogo La Propagación de las actualizaciones o Replicas La Propagación de las actualizaciones o Replicas El Control de Recuperabilidad El Control de Recuperabilidad El Control de concurrencia El Control de concurrencia Base de Datos Distribuida CENTRALIZADO (en un solo DBMS)CENTRALIZADO (en un solo DBMS) REPLICADO. En todos los DBMSREPLICADO. En todos los DBMS DIVIDIDO: cada DBMS tiene el suyo. Por lo tanto Catalogo total = UNION de los catálogos.DIVIDIDO: cada DBMS tiene el suyo. Por lo tanto Catalogo total = UNION de los catálogos.

24 24 Algunos Problemas: El Procesamiento de consulta El Procesamiento de consulta La Administración de catálogo La Administración de catálogo El Propagación de las actualizaciones o Replicas El Propagación de las actualizaciones o Replicas El Control de Recuperabilidad El Control de Recuperabilidad El Control de concurrencia El Control de concurrencia Base de Datos Distribuida Una forma es: Existe una copia primaria en cualquier DBMS y toda actualización se hace en la copia primaria y se replica luego al resto.

25 25 Algunos Problemas: El Procesamiento de consulta El Procesamiento de consulta La Administración de catálogo La Administración de catálogo La Propagación de las actualizaciones o Replicas La Propagación de las actualizaciones o Replicas El Control de Recuperabilidad El Control de Recuperabilidad El Control de concurrencia El Control de concurrencia Base de Datos Distribuida Complica la lógica haciendo uso del COMMIT en 2 fases.

26 26 Algunos Problemas: El Procesamiento de consulta El Procesamiento de consulta La Administración de catálogo La Administración de catálogo El Propagación de las actualizaciones o Replicas El Propagación de las actualizaciones o Replicas El Control de Recuperabilidad El Control de Recuperabilidad El Control de concurrencia El Control de concurrencia Base de Datos Distribuida El bloqueo, desbloqueo, liberar tuplas pasan a ser mensajes lo que implica una sobre carga. El bloqueo, desbloqueo, liberar tuplas pasan a ser mensajes lo que implica una sobre carga. En el caso de replica, la copia primaria podría administrar el bloqueo total del objeto En el caso de replica, la copia primaria podría administrar el bloqueo total del objeto

27 27 BD Distribuidas vs Cliente Servidor: Una estructura cliente servidor esta compuesta de muchos clientes (aplicativos) que no tienen datos y que van contra una o más DB. Una estructura cliente servidor esta compuesta de muchos clientes (aplicativos) que no tienen datos y que van contra una o más DB. La diferencia con una DB distribuida es que en una estructura cliente servidor las bases pueden o no estar distribuidas. La diferencia con una DB distribuida es que en una estructura cliente servidor las bases pueden o no estar distribuidas. Base de Datos Distribuida

28 28 Store Procedure: Los Programas se almacenan en el ServerLos Programas se almacenan en el Server Se llaman desde el cliente vía RPCSe llaman desde el cliente vía RPC Mejora el rendimiento al no trabajar registro x registroMejora el rendimiento al no trabajar registro x registro Oculta datos al usuarioOculta datos al usuario Un STORE PROC puede ser compartido por varios clientesUn STORE PROC puede ser compartido por varios clientes Base de Datos Distribuida

29 29 Store Procedure: El PLAN de acceso puede en muchos casos no ser dinámicoEl PLAN de acceso puede en muchos casos no ser dinámico Puede proporcionar más seguridadPuede proporcionar más seguridad Permite ejecutar sin acceso directo a los datos. Funciona como una subroutina sin necesidad de que el usuario arme el acceso a la DBPermite ejecutar sin acceso directo a los datos. Funciona como una subroutina sin necesidad de que el usuario arme el acceso a la DB Base de Datos Distribuida

30 30 Gate Way: Ajusta formatos de mensajesAjusta formatos de mensajes Ejecutar cualquier SQL enviadoEjecutar cualquier SQL enviado Transformación de datos (fecha, hs. reales, etc)Transformación de datos (fecha, hs. reales, etc) Adapa SQLs entre distintos DBMSAdapa SQLs entre distintos DBMS Transformar catálogoTransformar catálogo Administrar Two Phase CommitAdministrar Two Phase Commit Administrar bloqueosAdministrar bloqueos Base de Datos Distribuida

31 31 Fín Base de Datos Distribuida


Descargar ppt "Base de Datos Distribuidas Bases de Datos II Universidad Argentina J. F. Kennedy - Año 2008 Maletin Yahoo => briefcase.yahoo.com Usuario => bd2_jfk Pssw."

Presentaciones similares


Anuncios Google