Consistencia y Replicación

Slides:

Advertisements

Presentaciones similares

Memoria Compartida Distribuida

Advertisements

TEMA 10. SISTEMAS OPERATIVOS DISTRIBUIDOS

Consistencia y Replicación

 Arquitectura  Ventajas y desventajas  Ejemplos.

Proyecto ROOTVE V2: Control de versiones con Subversion Grupo de Investigación y Desarrollo en Seguridad de la Información - GIDSI.

Tema II Unidad de memoria. 2.1 Definiciones y conceptos básicos. 2.2 Jerarquía de memorias. 2.3 Memorias de semiconductor. 2.4 Memorias asociativas. 2.5.

ALGORITMOS DE SUSTITUCIÓN DE PÁGINAS. Idea Cuando ocurre una falla de página, el sistema operativo tiene que escoger la página que sacará de la memoria.

CICLOS CONDICIONALES DINÁMICOS Y CICLOS CONDICIONALES FIJOS Aixa Sosa Colón NE: Programación 2250 – 3240 ONL Profesora. Rebecca Acevedo Rivera.

¿Qué es un Diagrama de Flujo? UN DIAGRAMA DE FLUJO, TAMBIÉN LLAMADO FLUJOGRAMA DE PROCESOS O DIAGRAMA DE PROCESOS, REPRESENTA LA SECUENCIA O LOS PASOS.

¿Que es PHP? PHP Hypertext Preprocessor Y solo porque me quiero hacer el profesor cool y meter un chiste: PHP también significa: Para Hacer Páginas.

Paul Leger Modelo OSI Paul Leger

Conceptos generales de base de datos

Aidan Hogan CC Bases de Datos Primavera 2016 Clase 11: Integridad, Transacciones, ACID (I) Aidan Hogan

Procesadores superescalares

Paul Leger Transacciones Paul Leger

CC Bases de Datos Primavera Clase 12: Implementación de ACID

SISTEMAS OPERATIVOS Sección Crítica.

Legisoffice Versión 1.0..

Procesos Concurrentes

U.T. 11: Introducción A Las Bases De Datos

MANEJO DE ARRELOGS EN C Clase 8: Arreglos.

ADMINISTRACíON DE LA MEMORIA EN SISTEMAS RECIENTES

Exclusión mutua de secciones

TRANSACCIONES ATÓMICAS: ING. WALTER ZULOAGA CONTRERAS ALUMNOS: SHARON Y. CONZA CASTILLO BEKER MONTERROSO VALVERDE.

INTRODUCCIÒN AL SISTEMA GESTOR DE BASE DE DATOS

Unidad 7: Nivel Interno Algunos Conceptos Importantes

UNIVERSIDAD PRIVADA SAN JUAN BAUTISTA ESCUELA PROFESIONAL DE INGENIERIA DE COMPUTACION Y SISTEMAS TRANSACCIONES Integrantes: Cancho Ramirez Kiara Angulo.

SISTEMAS DISTRIBUÍDOS

Transferencias de Zona

Modelo de 3 capas. Qué es la arquitectura de una aplicación? La arquitectura se refiere a la forma en la que es diseñada tanto física como lógicamente.

LÓGICA DE PROGRAMACIÓN

Memoria virtual.

Instituto Tecnológico Superior de la Región Sierra

Exclusión mutua Un Algoritmo Centralizado Algoritmo Descentralizado

Metodología de la programación

Conocer los fundamentos de la programación estructurada

Un sistema distribuido debe permitir el apropiado uso de los recursos, debe encargarse de un buen desempeño y de la consistencia de los datos, además de.

Conceptos Relacionados Unidad I. Parte A.

DISPOSITIVOS DE E/S IU Colegio Mayor del Cauca Sistemas operativos Popayán, mayo de 2015.

Bases de Datos.

Sistemas Operativos Semáforos II.

CASSANDRA y CQL3.1 JUSTINO RAMÍREZ ORTEGÓN

Una transacción corresponde a un grupo de sentencias que representan una unidad de trabajo y deben ejecutarse en su totalidad.

ESTRUCTURA DE S.OPERATIVO

Introducción de Base de Datos

ARQUITECTURA DEL COMPUTADOR Ing. Diana E. López.

CURSO PROGRAMACIÓN BÁSICA SEMANA 3 ¿Qué es un programa?

INSTITUTO TECNOLÓGICO SUPERIOR DE ACAYUCAN

LICENCIATURA EN SISTEMAS COMPUTACIONALES EN ADMINISTRACION

TEMAS *Arboles Binarios *listas Abiertas y Cerradas - Inserción - Recorrido - Eliminación *Pilas - Concepto - Inserción - Recorrido -

Teoría Nº 3 Conceptos Básicos de Algoritmia Estructuras de Control

Estructura de Sistemas Operativos CAMPOS CHACALTANA, ANTHONY.

Estructura de los sistemas Operativos 1. Componentes de un sistema operativo  Administración de procesos  Administración de memoria  Subsistema de Entrada/Salida.

Estructura de los Sistemas Operativos Alumna:Arratea Almeyda Aracelli.

ESTRUCTURA DE SISTEMAS OPERATIVOS Carbajal Rojas karla.

CC Bases de Datos Otoño Clase 10: SQL: Vistas y Disparadores

BASES DE DATOS DISTRIBUIDAS ING. ROSA GRACIELA CASTRO CARRERA.

CONTROLES Y ESTRUCTURAS BÁSICAS DE PROGRAMACIÓN  1. Algoritmos: conjunto de instrucciones programadas para resolver una tarea específica.  2. Datos:

MONITORES INTEGRANTES: Arias Marcelo Tnt. Espín Roberto Tnt. Rosero Santiago.

1 TEMA 10. SISTEMAS OPERATIVOS DISTRIBUIDOS Introducción Hardware Software Aspectos de diseño.

ESTRUCTURA DE LOS SISTEMAS OPERATIVOS

Axcel Sting Anchante Mosayhuate.. Qué aspecto tienen los sistemas operativos por fuera (es decir, la interfaz con el programador), ha llegado el momento.

Ha llegado el momento de dar una mirada al interior de los Sistemas Operativos. En las siguientes secciones examinaremos cuatro estructuras distintas.

Estructura de los Sistemas Operativos

Estructura de los Sistemas Operativos por: Omar Saravia Tasayco

Mg. Jorge Vladimir Pachas Huaytán C.I.P CLAD MODELAMIENTO DE PROCESOS.

INSTITUO TECNOLOGICO SUPERIOR DE CALKINI EN EL ESTADO DE CAMPECHE SISTEMAS OPERATIVOS II Ingeniería En Informática Equipo: «Letras Mayas» 3.3 MODELOS DE.

Exclusión Mutua Repaso Tema relacionado a la sesión anterior: Sincronización del reloj.

Transcripción de la presentación:

Consistencia y Replicación Capítulo 6 Sistemas Distribuidos Andrew Tanenbaum

Javier Bustos Jiménez, Sistemas Distribuidos ¿Por qué replicar? Confiabilidad Continuidad de trabajo ante fallas Mayor cantidad de copias  mejor protección contra corrupción de datos Rendimiento Escalabilidad en número Escalabilidad en área geográfica (menor tiempo de acceso a copias cercanas) Consulta simultánea de datos Javier Bustos Jiménez, Sistemas Distribuidos

Replicación de objetos ¿Cómo proteger el objeto contra el acceso simultáneo de múltiples clientes? Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos … acceso simultaneo Básicamente hay dos soluciones: El mismo objeto maneja las invocaciones concurrentes (a). El objeto está desprotegido y el entorno se preocupa del control de concurrencia (b). En ambos casos, la réplica siempre debe permanecer actualizada Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos … en otras palabras: Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Objetos replicados: La inteligencia de la replicación va en el objeto La inteligencia de la replicación va en el sistema distribuido Javier Bustos Jiménez, Sistemas Distribuidos

¿ReplicaciónEscalabilidad? + escala  - rendimiento Por lo tanto se usa replicación (caching) para reducir el tiempo de acceso en alta escala. Problemas: Actualizar las réplicas consume ancho de banda Mantener la consistencia en las copias es un problema de escalabilidad (¿?) Sincronizar las réplicas Javier Bustos Jiménez, Sistemas Distribuidos

Modelos de Consistencia Contrato entre los procesos y el almacenamiento de datos: Si los procesos acuerdan obedecer ciertas reglas, el almacenamiento promete trabajar correctamente. Normalmente una operación de lectura debiese retornar la última actualización del dato. Los modelos pueden ser: Centrados en los datos Centrados en el cliente Javier Bustos Jiménez, Sistemas Distribuidos

Modelos de Consistencia centrados en los datos. Organización general de un almacenamiento lógico de datos, físicamente distribuidos y replicados a través de múltiples procesos. Javier Bustos Jiménez, Sistemas Distribuidos

Consistencia Estricta El más restrictivo de todos. Cualquier lectura sobre un ítem de dato x retorna un valor correspondiente con la más reciente escritura sobre x (en términos de un hipotético reloj de tiempo global) Javier Bustos Jiménez, Sistemas Distribuidos

Consistencia Secuencial Las escrituras fueron vistas en otro orden, pero por todos igual La consistencia secuencial satisface: El resultado de una ejecución es el mismo si todas las operaciones (lectura y escritura) de todos los procesos sobre el dato fueran ejecutadas en algún orden secuencial y las operaciones de cada proceso individual aparecen en esta secuencia en el orden especificado por su programa. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Linealidad Más débil que la consistencia estricta pero más fuerte que la consistencia secuencial. Se utiliza una marca generada por algún reloj global: Sea tsOP(x) la marca de tiempo asignada a la operación OP realizada sobre el dato x, donde OP puede ser lectura (R) o escritura (W) Una operación es linealizable si y sólo si: Es consistencia secuencial tsOP1(x) < tsOP2(x) si OP1 precede a OP2 en esa secuencia. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Linealidad Se tienen tres procesos que se ejecutan concurrentemente, todos ellos inicializaron sus variables en 0. Proceso P1 Proceso P2 Proceso P3 x = 1; print ( y, z); y = 1; print (x, z); z = 1; print (x, y); ¿Cuáles secuencias de ejecución serán válidas? Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos … secuencias válidas Cuatro secuencias válidas, el eje vertical es el tiempo. Signature = concatenación de la salida en orden P1 P2 P3 Notar que la linealidad (orden en un mismo color) se mantiene. x = 1; print (y, z); y = 1; print (x, z); z = 1; print (x, y); Prints: 001011 Signature: 001011 (a) print (x,z); print(y, z); Prints: 101011 Signature: 101011 (b) Prints: 010111 Signature: 110101 (c) Prints: 111111 111111 (d) Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Consistencia Causal Debilitamiento de la consistencia secuencial Se diferencian eventos que están potencialmente relacionados en forma causal y otros que no, los no relacionados se dicen concurrentes. Los datos son causalmente consistentes si: Todas las escrituras que están parcialmente relacionadas en forma causal son vistas por todos los procesos en el mismo orden. Las concurrentes pueden ser vistas en distinto orden sobre diferentes máquinas. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos … ejemplo Esta secuencia es permitida con un almacenamiento causalmente consistente, pero no con uno del tipo secuencialmente consistente o superior. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos … ejemplo 2 Posible dependencia Si son dependientes, todos deben ver las escrituras en el mismo orden. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Consistencia FIFO Toda escritura realizada por un proceso deben ser vistas por los otros procesos en el orden que fueron realizadas. Escrituras desde diferentes procesos pueden ser vistas en orden distinto por diferentes procesos. Javier Bustos Jiménez, Sistemas Distribuidos

Ejemplo de consistencia FIFO Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos ¿Qué procesos mueren? Process P1 Process P2 x = 1; if (y == 0) kill (P2); y = 1; if (x == 0) kill (P1); Intuitivamente: P1, o P2, o ninguno. Con consistencia FIFO pueden morir ambos: P1 hace R1(y)0 antes de ver el W2(y)1 P2 hace R2(x)0 antes de ver el W1(x)1 ¿Por qué? Porque sólo las escrituras de un mismo proceso se ven en orden Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos … pero! Este esquema es muy restrictivo: no todos los procesos quieren ver todas las escrituras (puede que no estén relacionados). Lo mejor es una vez que se tenga un resultado final, propagarlo. Pero ¿Cómo saber cuando se tiene un resultado final?  Secciones críticas  Variables de sincronización (S) Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Consistencia Débil Propiedades: Los accesos a variables de sincronización asociadas a los datos almacenados son secuencialmente consistentes. No se permite operación sobre una variable de sincronización hasta que todas las escrituras previas se hayan completado. No se permite operaciones de escritura o lectura sobre items de datos hasta que no se hayan completado todas las operaciones previas sobre las variables de sincronización. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Consistencia Débil La sincronización fuerza a que todos los procesos vean la última actualización (escritura) sobre una variable. La consistencia débil asegura consistencia sobre un grupo de operaciones, no sobre lecturas o escrituras aisladas. Útil, por ejemplo, en transacciones distribuidas. Javier Bustos Jiménez, Sistemas Distribuidos

Ejemplo de consistencia débil Como P2 y P3 no han sincronizado, pueden ver las escrituras en cualquier orden Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos … pero Cuando uno accede a la variable de sincronización ¿cómo saber si es para finalizar una escritura o para comenzar una lectura? Se necesitan entonces dos variables de sincronización en vez de una (¿?) O dos tipos de operaciones sobre la variable de sincronización (¿?) Javier Bustos Jiménez, Sistemas Distribuidos

Consistencia relajada Se utilizan dos operaciones: Acquire: avisa la entrada a la sección crítica Release: avisa la salida de la sección crítica También reemplazable por barreras: ningún proceso puede seguir hasta que todos hayan alcanzado el punto de sincronización. Javier Bustos Jiménez, Sistemas Distribuidos

Ejemplo de consistencia relajada P3 no hizo uso de la variable de sincronización, por lo tanto puede leer cualquiera de sus valores en el tiempo Javier Bustos Jiménez, Sistemas Distribuidos

Consistencia relajada Reglas: Antes que una operación de lectura o escritura sobre variables compartidas sea realizada, todos los acquire previos deben haber sido completados. Antes de permitir una liberación, todas las lecturas o escrituras previas por el proceso deben completarse. Los accesos a las variables de sincronización son FIFO consistentes. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos … por lo tanto La consistencia relajada garantiza que: Al hacer un acquire, las copias de los datos protegidos estarán actualizadas. Al hacer un release, las actualizaciones se propagarán a las otras copias. Pero: Hacer un acquire no garantiza que los cambios locales serán propagados inmediatamente. Hacer un release no garantiza que se actualizarán datos desde otras copias inmediatamente. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Consistencia Entry Modelo de consistencia del tipo relajada Cada ítem de dato compartido debe estar asociado a una variable de sincronización Cuando un acquire es hecho sobre una variable de sincronización, sólo los datos asociados a esa variable serán consistentes. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Consistencia Entry Condiciones a cumplir: No se permite realizar un acceso para adquirir una variable de sincronización respecto a un proceso hasta que todas las actualizaciones sobre los datos compartidos han sido realizadas con respecto a ese proceso. Antes de que sea permitido realizar un modo exclusivo de acceso a variables de sincronización por un proceso, otros procesos no pueden retener la variable de sincronización. Ni siquiera en el modo exclusivo. Después que un modo exclusivo de acceso a la variable de sincronización sea realizado, cualquier otro modo acceso no exclusivo de un proceso posterior a la variable de sincronización no se puede realizar hasta que lo haya realizado sobre las propias variables. Javier Bustos Jiménez, Sistemas Distribuidos

Condición 1 quiere decir… Cuando un proceso hace un acquire, éste no será completo hasta que todos los datos compartidos sean actualizados. Es decir, todos los cambios a datos remotos deben ser visibles. Javier Bustos Jiménez, Sistemas Distribuidos

Condición 2 quiere decir… Antes de actualizar un dato compartido, un proceso debe entrar a la región crítica en modo exclusivo para estar seguro que no hay otros procesos tratando de modificar los datos. Javier Bustos Jiménez, Sistemas Distribuidos

Condición 3 quiere decir… Si un proceso quiere entrar a una sección crítica en un modo no exclusivo, primero debe chequear la última actualización de la variable con el dueño de la sección crítica. ? Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos … ejemplo Este pudo llegar antes que el Acq(Ly) Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos En resumen: Consistency Description Estricta Ordenamiento en tiempo absoluto de todos los accesos compartidos. Linealizada Todos los procesos deben ver todos todos los accesos compartidos en el mismo orden. Los accesos son ordenados de acuerdo a una marca de tiempo global. Secuencial Todos los procesos ven todos los accesos compartidos en el mismo orden. Los accesos no están ordenados en el tiempo. Causal Todos los procesos ven los accesos compartidos causalmente relacionados en el mismo orden. FIFO Todos los procesos ven las escrituras de un proceso en el orden que éste las efectuó. Escrituras de diferentes procesos pueden no ser vistas en el mismo orden. (a) Modelos de consistencia que no usan variables de sincronización Débil Los datos compartidos pueden ser considerados consistentes luego de que se haya hecho la sincronización. relajada Los datos compartidos son hechos consistentes cuando la región crítica es abandonada. Entry Los datos compartidos pertenecientes a una región crítica son hechos consistentes cuando se entra a la región crítica. (b) Modelos de consistencia con operaciones de sincronización Javier Bustos Jiménez, Sistemas Distribuidos

Modelos de Consistencia Centrados en el Cliente Bajo número de actualizaciones simultáneas Fácil resolución entre actualizaciones concurrentes. Generalmente son operaciones de lectura. Modelo de consistencia bastante débil (consistencia eventual, o de eventos). Consistencia garantizada para un único cliente, por lo tanto muchas inconsistencias son ocultadas fácilmente. Javier Bustos Jiménez, Sistemas Distribuidos

Consistencia eventual The principle of a mobile user accessing different replicas of a distributed database. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Notación: Sea xi[t] la versión del ítem de dato x en la copia local Li al tiempo t. La versión xi[t] es es el resultado de una serie de operaciones de escritura sobre Li desde la inicialización, denotada WS(xi[t]). Si WS(xi[t1]) fue además realizada sobre lo copia local Lj al tiempo t2 entonces la serie se escribirá WS(xi[t1];xj[t2]). Si el orden de las operaciones o el tiempo son claros por el contexto, el índice del tiempo se omite. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Lecturas Monotónicas Se dice que un dato ofrece consistencia de lecturas monotónicas si y sólo si la siguiente condición se cumple: Si un proceso lee el valor de un ítem de dato x, cualquier operación de lectura sucesiva sobre x por el mismo proceso siempre retornará el mismo valor o un valor más reciente. Javier Bustos Jiménez, Sistemas Distribuidos

Ejemplo de lectura monotónica: Si leí R(x1) desde L1 me debo asegurar que leeré R(x1) en L2. t t Operaciones de lectura realizadas por un único proceso P sobre dos copias locales (L1 y L2) del almacenamiento de datos. Javier Bustos Jiménez, Sistemas Distribuidos

Escrituras monotónicas Las escrituras deben ser propagadas en el orden correcto a todas las copias del almacenamiento de datos. Se debe cumplir que: Una operación de escritura por un proceso sobre un ítem de dato x es completada antes de cualquier otra operación de escritura sobre x por el mismo proceso. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos … ejemplo Operaciones de escritura realizadas por un proceso P en dos copias locales del mismo almacen de datos. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Lea sus escrituras A veces es más importante garantizar que si yo escribo un dato, yo siempre vea el valor actualizado no importa de donde haga la siguiente lectura, por lo tanto, un almacén de datos provee consistencia lea sus escrituras si se cumple que: El efecto de una operación de escritura por un proceso sobre un ítem de dato x será siempre visto por las sucesivas operaciones de lectura sobre x por el mismo proceso. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos … ejemplo Si escribí x1 en L1 me debo asegurar que lo lea desde L2. Similar a lecturas monotónicas, sólo que esta vez la consistencia está garantizada por la última operación de escritura de P, en vez de la última operación de lectura. Javier Bustos Jiménez, Sistemas Distribuidos

Escrituras siguen a Lecturas La idea de este esquema de consistencia es garantizar que si alguien va a modificar el valor de un dato, antes haya leído la última actualización de éste. Un almacén de datos provee consistencia de escrituras siguen lecturas si se cumple que: Una operación de escritura de un proceso sobre un ítem de dato x realizada luego de leer ese dato x, se realizó garantizadamente sobre el valor más reciente de x. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos … ejemplo Si leí x1 en L1 me debo asegurar que toda escritura posterior al menos lleve x1 en cualquier copia. Operaciones de escritura realizadas por un proceso P en dos copias locales del mismo almacen de datos. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Ubicación de réplicas Organización lógica de diferentes clases de copias de datos almacenados en tres anillos concéntricas Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Replicas permanentes Es el primer subconjunto de réplicas. Comúnmente son un número pequeño de réplicas. Ejemplos: Múltiples copias cercanas y los requerimientos son dirigidos a cada una a la vez mediante algún esquema (por ejemplo round-robin). Múltiples copias lejanas a las cuales se elige entrar (mirror). Javier Bustos Jiménez, Sistemas Distribuidos

Replicas iniciadas por el servidor Copias del almacén de datos para mejorar la performance. Réplicas creadas y actualizadas bajo la iniciativa del dueño del almacén de datos (servidor) Problema principal: ¿Dónde poner las réplicas? (cerca/lejos) ¿Cuándo actualizarlas? Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos … una solución Cada servidor cuenta el número de accesos. Cada cliente accede al servidor más cercano. Si C1 y C2 comparten el servidor más cercano (P), y éste no tiene réplica, se toma como si P fuese quien realiza la consulta. Javier Bustos Jiménez, Sistemas Distribuidos

… reevaluación de réplicas Si Q determina que el número de pedidos de F es menor a un cierto límite, se borra F de esa réplica (a menos que sea la última). Si P tiene más de la mitad de los accesos a F, entonces se lleva F de Q a P. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos … pero Si P no puede recibir F (por ejemplo, no tiene espacio de disco suficiente), y el número de accesos es mayor que un cierto límite, F se replica a otros servidores: el más lejano que supere un cierto % de accesos a F. Javier Bustos Jiménez, Sistemas Distribuidos

Réplicas iniciadas por el cliente Más conocidas como caché de cliente. Copia temporal de datos para el uso del cliente. Mejora el tiempo de acceso a datos. Útil si la mayoría de las operaciones son de lectura. Caché puede ser compartido entre un grupo de clientes cercanos. Javier Bustos Jiménez, Sistemas Distribuidos

Propagación de actualizaciones ¿Qué propagar? Básicamente hay 3 opciones: Propagar sólo la notificación de actualización (protocolos de invalidación) Transferir datos completos de una copia a otra (útil cuando hay más lecturas que escrituras) Propagar la operación de actualización (también conocido como active replication), parte de la base que cada almacén es capaz de actualizar sus datos mediante operaciones, lo cual implica mayor procesamiento en las réplicas. Javier Bustos Jiménez, Sistemas Distribuidos

Protocolos tipo Pull v/s Push Asunto Basado en Push Basado en Pull En el servidor Lista de réplicas de clientes y cachés Ninguna Mensajes enviados Actualización (y posiblemente búsqueda de la actualización después) Pull y actualización Tiempo de respuesta al cliente Inmediato (o tiempo de búsqueda y actualización) Tiempo de búsqueda y actualización Comparación entre protocolos basados en push (del servidor a los clientes) y pull (de los clietnes al servidor) Javier Bustos Jiménez, Sistemas Distribuidos

Protocolos de Consistencia Un protocolo de consistencia describe una implementación de un modelo específico de consistencia. Los modelos de consistencia en los cuales las operaciones están globalmente serializadas son los modelos más importantes; y los más ampliamente aplicados incluyen: consistencia secuencial, consistencia débil con variables de sincronización y transacciones atómicas. Los protocolos pueden ser: Basados en el primario De escritura replicada. Javier Bustos Jiménez, Sistemas Distribuidos

Protocolos Basados en el Primario Cada ítem de dato x tiene en el almacenamiento de datos un primario asociado, el cual es responsable de coordinar las operaciones de escritura sobre x. El primario: O bien está fijo en un servidor remoto; O bien se trae el primario a la copia local y las operaciones de escritura se ejecutan localmente. Javier Bustos Jiménez, Sistemas Distribuidos

Servidor fijo y reenvio de requerimientos Javier Bustos Jiménez, Sistemas Distribuidos

Protocolo de respaldo primario Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos … ¿problema? Quien hizo el update (W1) puede demorar mucho en recibir la autorización de continuar (W5), porque usualmente actualizar es bloqueante ¿Soluciones?: Usar un esquema no bloqueante… lo cual genera problemas de tolerancia a fallas (¿cómo saber que hizo lo que dijo que haría?) ¿Mover el primario? Javier Bustos Jiménez, Sistemas Distribuidos

Escrituras Locales: el primario se mueve entre los procesos Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos … pero ¿Cómo saber donde se encuentra el dato actualmente? Exceso de movimientos del dato (se mueve para read y writes)… mejor moverlo sólo para las escrituras. Ventajas: Múltiples escrituras locales mientras los otros leen sus copias locales. Desventajas: Funciona sólo si las actualizaciones son no bloqueantes y propagadas a las réplicas después de actualizar el primario. Javier Bustos Jiménez, Sistemas Distribuidos

Escrituras locales moviendo el primario sólo para actualizar. Javier Bustos Jiménez, Sistemas Distribuidos

Protocolos de Escritura Replicada En los protocolos de escritura replicada, las operaciones de escritura pueden ser ejecutadas en múltiples réplicas en vez de sólo una. Se dividen en: Replicación activa: una operación es llevada a todas las réplicas. Protocolos basados en votación (quorum) Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Replicación Activa Cada replica tiene asociado un proceso que se encarga de las actualizaciones, enviando a las otras réplicas la operación que produjo la actualización, no el valor del dato. Pro: Reducción de ancho de banda para datos grandes Contras: Se debe mantener el orden de las operaciones. ¿Qué pasa si cada réplica debía operar además sobre otra réplica? Javier Bustos Jiménez, Sistemas Distribuidos

Invocaciones replicadas Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos … pero Imaginen que la operación sobre C es transferir $1.000.000. Alguien va a pagar por ese error, y mucho. Solución: replication-awareness: la invocación es asignada a una única réplica mediante la elección de un coordinador. El mismo mecanismo se usa para la respuesta desde las réplicas. Javier Bustos Jiménez, Sistemas Distribuidos

Replication awareness Javier Bustos Jiménez, Sistemas Distribuidos

Protocolos basados en votos La idea es obtener el permiso de múltiples servidores antes de leer o escribir un dato replicado. Por ejemplo: para actualizar, hay que hacerlo en la mitad más uno de los servidores. Para leer, hay que tener al menos la mitad más uno de los datos en la misma versión. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Algoritmo de Gifford Sean N réplicas NR = Quórum de lectura NW = Quórum de escritura Se debe cumplir que: NR + NW > N (previene conflictos de lectura / escritura) NW > N/2 (previene conflictos de escritura) Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos … ejemplos Si un cliente elige {A,B,C,D,F,G} y el otro {D,H,I,J,K,L} para escribir, ambas serán aceptadas y hay conflicto en D. Esto porque NW <= N/2 Todos pueden leer cualquier réplica, el problema es que se debe actualizar todas siempre. Javier Bustos Jiménez, Sistemas Distribuidos

Aplicación: memoria compartida distribuida La memoria se parte en “bloques” fijos El “caching” evita la latencia de acceso Puede soportar: migración y/o replicación Javier Bustos Jiménez, Sistemas Distribuidos

… aspectos a considerar: Granularidad (¿false sharing?) Estructura del espacio de memoria compartida Coherencia de memoria y sincronización de acceso Localización de datos y accesos Estrategias de reemplazo Trashing Heterogeneidad Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Estructura No estructurada: es un arreglo de palabras. Por tipos de datos: colección de objetos (sistemas Clouds y Orca) o colección de variables en lenguaje fuente (sistemas Munin y Midway). Granularidad al nivel de variable u objeto. Como base de datos: implica una memoria asociativa. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Implementación La más común: modelo de consistencia secuencial, porque: Es realizable Soporta semántica más intuitiva para la coherencia de memoria. No impone nada extra al programador Pero: Posee bajo nivel de concurrencia Javier Bustos Jiménez, Sistemas Distribuidos

Estrategias para consistencia secuencial: El protocolo dependerá de la estrategia elegida. Estrategias: No réplica, no migratoria (NRNMB): cliente – servidor. No réplica, migratoria (NRMB): lleva bloques a quien lo usa. Réplica, migratoria (RMB): lleva la réplica más cercana a quien lo usa. Réplica, no migratoria (RNMB): acceso a la réplica más cercana. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Protocolos: Escritura invalidante: El nodo con la última actualización se encarga de invalidar las otras. Escritura actualizada: ordenamiento total de las operaciones de escritura para lograr la consistencia secuencial. Utiliza un secuenciador global. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos Localización: Broadcasting: produce cuello de botella y problemas de latencia. Servidor centralizado: reduce el paralelismo y una falla mata el sistema. Servidor distribuido fijo: Cada nodo posee un subconjunto fijo de los datos, ante falla esa información se pierde. Servidor distribuido dinámico: Cada nodo tiene su propia tabla sobre la ubicación de los bloques, pero no siempre está actualizada. En RNMB las localizaciones no cambian y siempre al escribir se actualiza. Javier Bustos Jiménez, Sistemas Distribuidos

Estrategias de reemplazo ¿Qué bloque debe ser reemplazado? Usado v/s no usado (LRU) En algunos sistemas un bloque es clasificado como: no usado, Nil (invalidado), Read-only (RO), Read-owned (RO y el nodo es dueño), Escribible. Y la prioridad de reemplazo es: No usado y Nil Read-only Read-owned Escribible ¿Donde? Almacenamiento secundario Memoria de otros nodos Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos ¿Trashing? Si hay mirgación y se produce que: Hay datos entrelazados entre distintos nodos Bloques con permiso RO son repetidamente invalidados inmediatamente luego que son replicados … es decir: hay baja localidad de datos Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos ¿Solución? Proveer locks de aplicación controlada: fija el bloque por un tiempo. No permitir que quiten, por un tiempo t, un bloque de nodo (t generado por estadística o accesos) Ajustar el algoritmo de coherencia para usar modelos de datos compartidos. Javier Bustos Jiménez, Sistemas Distribuidos

Javier Bustos Jiménez, Sistemas Distribuidos FIN Javier Bustos Jiménez, Sistemas Distribuidos