Ing. Fabián Ruano.  Definición  Diferencias con BD Centralizadas.

Slides:



Advertisements
Presentaciones similares
IBD Plan 90 y 2003 Clase 10.
Advertisements

IBD Clase 16.
Definición En un sistema de base de datos distribuida, los datos se almacenan en varios computadores. Los computadores de un sistema distribuido se comunican.
SISTEMAS DE GESTIÓN DE BASES DE DATOS
DBMS (SGBD) El Sistema de Gestión
Arquitecturas de BD Modelo ANSI/SPARC
Base de Datos Distribuidas PROCESAMIENTO DE CONSULTAS DISTRIBUIDAS
Introducción a LAS Bases de Datos
BASES DE DATOS DISTRIBUIDAS
Bases de datos distribuidas
Base de Datos Distribuidas Bases de Datos II Universidad Argentina J. F. Kennedy - Año 2008 Maletin Yahoo => briefcase.yahoo.com Usuario => bd2_jfk Pssw.
Base de Datos Distribuidas FUNDAMENTOS DE BASES DE DATOS DISTRIBUIDAS
Sistemas de Bases de Datos Distribuidas
Optimización de Consultas Distribuidas
Tecnologías Cliente / Servidor Capitulo III Richard Jiménez V. clienteserver.wordpress.com.
Arquitecturas de las BDD
Confiabilidad en Bases de Datos Distribuidas
Guia Diseño Robert Echeverria
Teórico: Introducción
Ingeniería del Software
BASES DE DATOS DISTRIBUIDAS
Introducción a los Sistemas de Bases de Datos Distribuidos
UNIDAD II Modelo de Datos.
1.1.2 Sistemas de información para la gestión y para la ayuda en la toma de decisiones. Los SI contribuyen activamente a la consecución de los objetivos.
MOTORES DE BASE DE DATOS
BASES DE DATOS DISTRIBUIDAS
Diseño de Bases de Datos Distribuidas (2da Parte)
Bases de Datos Distribuidas Por: Israel Miralles y Vicente Toledo.
INTELIGENCIA DE NEGOCIOS
Diseño de Bases de Datos Distribuidas (1era Parte)
UNIDAD I Conceptos Básicos.
PROGRAMACIÓN PARALELA Tema 4: Metodología de la programación

Ing. Héctor Abraham Hernández Erazo
Instituto Tecnológico de La Paz Ing. Fernando Ortiz Ahumada.
BASES DE DATOS INTRODUCCION
Viviana Poblete López Módulo: Modelo de Datos
Arquitectura de una aplicación
Introducción a la Base de Datos
Introducción A Las Bases De Datos
BASE DE DATOS BY: Julián Villar Vázquez.
Introducción al modelo Cliente-Servidor Carlos Rojas Kramer Universidad Cristóbal Colón.
Página 1 20/03/2005 Materia: Tecnología de la Información Curso: Profesora Ariana Rosenthal Tecnología de la Información Profesora Ariana Rosenthal Administración.
TEMA 10. SISTEMAS OPERATIVOS DISTRIBUIDOS
Bases de Datos Distribuidas
Bases de Datos Distribuidas M. en C. Anastacio Antolino Hernández PROBLEMA DE LOS SISTEMAS DISTRIBUIDOS SISTEMAS MANEJADORES DE BASES DE DATOS DISTRIBUIDAS.
Universidad Central de Venezuela Facultad de Ciencias Postgrado en Ciencias de la Computación Sistemas Distribuidos Albany Márquez.
BASES DE DATOS DISTRIBUIDAS
BASES DE DATOS DISTRIBUIDAS
CICLO DE VIDA Y NORMAALIZACION DE UN SISTEMA DE BASE DE DATOS
PROYECTO EMPRESARIAL Clase # 1.
Departamento de Informática Universidad de Rancagua
Departamento de Informática Universidad de Rancagua
Métrica v2.1 Técnicas: Modelado de datos (Parte 1)
Departamento de Informática Universidad de Rancagua Profesor: Paula Quitral Reglas BDD.
SENA REGIONAL HUILA REGIONAL HUILA CENTRO DE LA INDUSTRIA LA EMPRESA Y LOS SERVICIOS Huila Elementos de sistemas de información.
REQUISITOS.
Introducción al análisis de sistemas
Bases de Datos II BASES DE DATOS DISTRIBUIDAS
BASES DE DATOS DISTRIBUIDAS
Procesador de consultas
Replicación Bases de Datos Distribuidas Ing. Fernando Ortiz Ahumada.
BASE DE DATOS DISTRIBUIDAS
Las doce reglas de las bases de datos distribuidas
PARTICIPANTE: CAMACHO MAITE C.I T-01.
Arquitectura de una aplicación Arquitectur a: desarrolla un plan general del sistema, asegurando que las necesidades de los usuarios sean atendidas. Ingeniería.
Capas de ingeniería del Software. Rosendo Antonio Manuel Ingeniería en Sistemas Computacionales.
1 Unidad I.2.- Objetivos de los Sistemas Distribuidos Ing. Luis Armando García Eliseo © Agosto 2011.
 Definir conceptos fundamentales de las BDD como DTM y DBMS.  Conocer el esquema actual de la Base de datos de la UNACH.  Analizar cuándo utilizar.
BASES DE DATOS DISTRIBUIDAS M.C.C. María Guadalupe Villanueva Carrasco INGENIERIA EN SISTEMAS COMPUTACIONALES.
Transcripción de la presentación:

Ing. Fabián Ruano

 Definición  Diferencias con BD Centralizadas

 Almacenamiento cercano  Procesamiento paralelo  Expansión rápida  Tolerancia a fallos  Autonomía de nodos

 Control y manejo de datos  Seguridad  Complejidad en mantener integridad  Control de concurrencia mas complejo

 Diseño de la base de datos distribuida: distribución de información entre nodos  Procesamiento de consultas: costo de procesamiento y transmisión de datos  Control de concurrencia: coordinación de acceso a la base de datos  Confiabilidad: manejo de transacciones

Independencia de datos: aplicaciones inmunes a cambios en definición y organización de datos y viceversa Lógica: inmunidad a cambios en estructura lógica de la base de datos Física: ocultamiento de detalles sobre estructuras de almacenamiento a las aplicaciones de usuario Transparencia de replicación: replicas controladas por el sistema, no por el usuario.

 Transparencia a nivel de red ◦ Localización de datos: comando usado es independiente de la ubicación de los datos y lugar donde la operación se realice ◦ Esquema de nombramiento: proporcionando nombre único a cada objeto de sistema distribuido.  Transparencia de fragmentación: sistema maneja conversión de consultas definidas sobre relaciones globales a consultas definidas sobre fragmentos

 Mayoría basadas en sistema ANSI-SPARC con tres niveles: interno, conceptual y externo. ◦ Externa: vista por usuario ◦ Conceptual: vista lógica global ◦ Interno: nivel de descripción mas bajo de los datos en una base de datos

Dimensiones Distribución Heterogeneidad Autonomía Diseño: decisión sobre cuestiones de diseño Comunicación: decisión sobre cuestiones de comunicación Ejecución: decisión sobre cuestiones de ejecución de operaciones de manera local

Algoritmos de control de concurrencia: Candado de dos fases Ordenamiento por estampas de tiempo Ordenamiento por estampas de tiempo múltiple Control de concurrencia optimista

 Nivel de distribución ◦ Ninguno ◦ Solo datos (sist. Homogéneo) ◦ Datos mas programas (sist. Heteregéneo)  Comportamiento de patrones de acceso ◦ Estático ◦ Dinámico  Nivel de conocimiento sobre comportamiento de patrones ◦ Sin información / parcial ◦ Información total

 Análisis de requerimientos que define el ambiente del sistema. Determina necesidades de los datos y del proceso. DBMS debe ser definido por: desempeño, confiabilidad, disponibilidad, economía y flexibilidad.  Diseño visual: definir las GUI  Diseño conceptual: examina la empresa para generar diagrama E-R

 Como resultado de los diseños conceptual y visual debe darse un esquema conceptual global y recopilación de los patrones de acceso.  Diseño de distribución: diseñar esquema conceptual local para cada sitio del SD. Fragmentación y asignación.

 Diseño físico: mapear esquemas conceptuales locales con los dispositivos de almacenamiento físicos disponibles en cada sitio.

 Conveniente cuando BD ya existen y tareas de proceso involucran integración.  Punto de inicio son esquemas conceptuales individuales, se integran para obtener esquema conceptual global y posiblemente generar GUI.

 Encontrar unidad de relación apropiada. Diferentes aplicaciones ingresan a diferentes sub-conjuntos de datos.  Replicaciones mas convenientes, solamente de sub-relaciones.  Ejecuciones concurrentes de procesos sobre sub-conjuntos aislados.

 Unión de fragmentos para consultas ◦ Costoso en proceso ◦ Costoso en transferencia de datos  Control de semántica de datos y revisión de integridad

 Fragmentación vertical  Fragmentación horizontal  Fragmentación híbrida

 Afecta desempeño de la ejecución de los Query.  Dependerá de las necesidades de nuestra aplicación.

 Condición de completitud. La descomposición de una relación R en los fragmentos R 1, R 2,..., R n es completa si y solamente si cada elemento de datos en R se encuentra en algún de los R i.  Condición de Reconstrucción. Si la relación R se descompone en los fragmentos R 1, R 2,..., R n, entonces debe existir algún operador relacional Ñ, tal que,R = Ñ 1£ i£ n R i  Condición de Fragmentos Disjuntos. Si la relación R se descompone en los fragmentos R 1, R 2,..., R n, y el dato d i está en R j, entonces, no debe estar en ningún otro fragmento R k (k¹ j).

 Forma para asignación de fragmentos de las relaciones en cada uno de los sitios teniendo ya bien realizada nuestra fragmentación. ◦ Costos mínimos: costos de actualización entre sitios y costos de comunicación de datos ◦ Desempeño: minimizar el tiempo de respuesta y maximizar la salida de información a cada sitio.

 Mejora Querys de sólo lectura  Confiabilidad  Empeora Query de actualización  Estrategias: ◦ No soportar replicación. Cada fragmento reside en un solo sitio. ◦ Soportar replicación completa. Cada fragmento en cada uno de los sitios. ◦ Soportar replicación parcial. Cada fragmento en algunos de los sitios.

En diseño de distribución influyen factores como:  Información sobre el significado de los datos  Información sobre las aplicaciones que los usan  Información acerca de la red de comunicaciones  Información acerca de los sistemas de cómputo

Cada subconjunto puede contener datos que tienen propiedades comunes y se puede definir expresando cada fragmento como una operación de selección sobre la relación global Considere la relación global: SUPPLIER( SNUM, NAME, CITY ) entonces, la fragmentación horizontal puede ser definida como: SUPPLIER1 = SLcity == "SF"SUPPLIER SUPPLIER1 = SLcity == "LA"SUPPLIER  Esta fragmentación satisface la condición de completes si "SF" y "LA" son solamente los únicos valores posibles del atributo CITY.  La condición de reconstrucción se logra con: SUPPLIER = SUPPLIER1 union SUPPLIER2  La condición de disjuntos se cumple claramente en este ejemplo.

La fragmentación derivada horizontal se define partiendo de una fragmentación horizontal. En esta operación se requiere de Semi-junta (Semi-Join) el cual nos sirve para derivar las tuplas o registros de dos relaciones. Las siguientes relaciones definen una fragmentación horizontal derivada de la relación SUPPLY. SUPPLY1 = SUPPLYSJsnum == snumSUPPLIER1 SUPPLY2 = SUPPLYSJsnum == snumSUPPLIER2

 Enfoques ◦ Agrupamiento (Clustering): Inicia asignando cada atributo a un fragmento, y en cada paso, algunos de los fragmentos satisfaciendo algún criterio se unen para formar un solo fragmento. ◦ Division: Inicia con una sola relación realizar un particionamiento basado en el comportamiento de acceso de las consultas sobre los atributos.

Formula general: min( Costo Total ) Dadas: - Restricciones tiempo de rta - Restricciones capacidad de almacenamiento - Restricciones en tiempo de procesamiento Costo total = procesamiento de consultas + almacenamiento Procesamiento de consultas = sumatoria del costo de procesamiento de todas las consultas Almacenamiento = sumatoria de costos de almacenar todos los fragmentos en los correspondientes nodos

Costo de almacenamiento por nodo = costo almacenamiento unitario en el nodo * tamaño del fragmento Costo del procesamiento por consulta = costo de procesamiento + costo de transmision Costo de procesamiento = costo de acceso + costo de mantenimiento de integridad + costo debido a control de concurrencia

Costo de acceso = sumatoria(numero total de actualizaciones y lecturas realizadas por consulta en el fragmento i * costo unitario de procesamiento local en el fragmento i) i = cada fragmento involucrado en la consulta Costos de mantenimiento de integridad y costo de control de concurrencia se calculan similar al costo del control de acceso.

Costo de transmisión - Procesamiento de actualizaciones = costo de envió de mensajes de actualización a los N nodos involucrados + costo de envió de mensaje de confirmación - Procesamiento de consultas = costo de transmitir consulta a N nodos involucrados + costo de transmisión de respuestas de los N nodos a las N consultas

 Tiempo de respuesta Para cada Qi el tiempo de respuesta <= máximo tiempo de respuesta esperado. Almacenamiento Costo de almacenamiento en Nodoi <= capacidad de almacenamiento de dicho nodo Tiempo procesamiento Carga de procesamiento Nodoi <= capacidad de procesamiento de dicho nodo

 008/10/disdabe_design.pdf 008/10/disdabe_design.pdf  0Distribuidas/pdf/Tema%202.pdf 0Distribuidas/pdf/Tema%202.pdf   0/09/base_de_datos_distribuidas.pdf 0/09/base_de_datos_distribuidas.pdf