Alta Disponibilitat en Linux

Slides:



Advertisements
Presentaciones similares
Activitat CALCULA: ESPORT MASCULÍ I ESPORT FEMENÍ Observatori Crític de l’Esport Autora: Susanna Soler i Prat INEFC Barcelona.
Advertisements

TFG – Àrea Enginyeria del programari
Cambios en el espacio: transformaciones geométricas
ENERGIA Energia és allò capaç de transformar la matèria.
PROJECTE BANDA AMPLA RURAL - SATÈL·LIT
Impress 3... Posa-hi un fons!
PROPORCIONALITAT 1 Funciona amb “clics”.
Campus Virtual.
Campus Virtual.
TEMA3: Gestió de correu i agenda electrònica
L’ordinador i els Sistemes Operatius(S.O)
MANUAL NOMINAPLUS.
UNA TARDA QUALSEVOL D’UN DIA QUALSEVOL
MÚLTIPLES I DIVISORS.
INTERNET i Correu Electrònic
1 u n i t a t Sistemes informàtics. Treball en xarxa.
Disseny de la interfície d’un smartwatch i l’aplicació mòbil
TÍTOLS DOCTOR INTRODUCCIÓ DE SOL·LICITUDS AMB TRASLLAT O CANVI DE PROGRAMES O DEPARTAMENTS NOTES: En la introducció a.
Ciències per al món contemporani
Tema 2. DIVISIBILITAT.
AVALUAR-QUALIFICAR PER COMPETÈNCIES
MESCLES I DISSOLUCIONS
Introducció de TEDIs (COACs) Versió 4.0
Un exemple de Màquina Virtual: el programa VMware
El mercat ELS NENS I NENES DE P-4.
PETITS REPORTERS Títol.
Ens visita el dentista a P3, P4 i P5!!!
Creació d’un mapa personalitzat
Control de Retirada de Vehicles
La Unitat d’Hospitalització d’Aguts de la UIPA (VH - Sant Rafael) es fa càrrec de la hospitalització de salut mental de la Barcelona Nord Anteriorment.
1 u n i t a t La funció comercial de l’empresa.
PERIFÈRICS ... Descobreix el que envolta l’ordinador!
ELS DRETS SOCIALS Rics i pobres
Tutorials Campus Virtual Càrrega automàtica d’alumnes
Com introduir les Guies Docents
III Jornada de transport sanitari
Matemàtiques 3er E.S.O..
WEBQUEST WEB...QUÈ ? Alumnes de l’Escola ESTEL VALLSECA.
QUÍMICA 2 BATXILLERAT Unitat 7 EQUILIBRIS IÒNICS HETEROGENIS.
Problema 1: Trobar la recta que passa pel punts A(2, -3) i B(-1, 3)
Servei d’Assistència en RRHH Aspectes pràctics de la implementació en nòmina del R.D. Llei 8/2010 DOCUMENT INTERN DE TREBALL 3 juny 2010.
Els Políedres.
Ruben Balada Tripiana Informática
Publicació de la recerca al Dipòsit Digital de la UB
L´aprovisionament L´aprovisionament consisteix a comprar els materials necessaris per l´activitat de l´empresa (la majoria matèries primeres), emmagatzemar-los.
Jonathan Ceballos Rodriguez ( ) Zenón Perisé Alía ( )
Projecte: el mercat 2a PART P -4.
L’electricitat i el circuit elèctric
COM NEIX UN PARADIGMA?.
LES XARXES LOCALS i els seus components.
"SENYOR, ENSENYA’M A SER FELIÇ I A DONAR PAU!"
TEMA 2 XARXES LOCALS David Bermúdez 4tC Vanesa Elvira 4tB
Miquel Pratsevall Héctor del Corral
ERIC Manual d’ús.
ESCOLA ANTONI TÀPIES- 5èB
INTERNET XARXA: Quan un conjunt d’ordinadors estan connectats entre si per comunicar-se i compartir informació. TIPUS DE XARXES: LAN: Xarxa d’àrea local,
Passes a seguir per iniciar un nou curs acadèmic en el GestIB
Threads en Java David Gañán Jiménez.
LA NOVA SELECTIVITAT I L’ACCÉS A LA UNIVERSITAT
PROTOCOLS DE XARXA Regles i especificacions tècniques que han de seguir els dispositius connectats a la xarxa per poder comunicar-se El protocol més utilitzat.
Organització i creixement
EL SISTEMA ECONÒMIC.
Sistema de descàrrega d’aplicacions per a mòbils intel·ligents
CAMPANYA DE CONSCIENCIACIÓ PER A LA RECOLLIDA DE RESIDUS D’APARELLS ELECTRÒNICS PROPOSTA PER ALS AMBAIXADORS DE LA CAMPANYA.
La vulneració dels drets socials
E-certificat Bellaterra, 20 de novembre 2015
3. Karl Marx: el materialisme històric 3. 5
6a SETMANA de QUARESMA US PRESENTEM LA JOANA QUE ENS ACOMPANYARÀ EN AQUESTA SISENA SETMANA DE QUARESMA. LA JOANA DE VEGADES ES MOSTRA MOLT RESPONSABLE.
COM NEIX UN PARADIGMA?.
Estils i Plantilles Ms Word.
Transcripción de la presentación:

Alta Disponibilitat en Linux sgi Alta Disponibilitat en Linux amb sgi Linux Failsafe Cristian Varela Ruiz cristian.varela@upcnet.es

Justificació En moltes ocasions la interrupció total o parcial d’un servei pot suposar per a un negoci la pèrdua d’una quantitat important de diners. Diem que la disponibilitat d’un sistema està directament afectada per la quantitat de temps que està indisponible desprès de la fallada d’un dels seus components. Així doncs, podem diferenciar dos grans tipus de disponibilitat: Sistemes Tolerants a Fallades Sistemes ofereixen disponibilitat continua mitjançant software especialitzat i components redundants (tant de software com de hardware). Generalment són sistemes molt costosos. Sistemes Altament Disponibles Són sistemes que no sobreviuen a fallades múltiples però que proporcionen una disponibilitat molt elevada a un cost moltíssim més baix que els sistemes Tolerants a Fallades.

Justificació sgi (Silicon Graphics, Inc.) ha estat treballant durant l’últim any i mig en un projecte Open Source anomenat sgi Linux FailSafe que permet, d’una manera força econòmica, proveir a un sistema, no massa complicat, d’alta disponibilitat. Definicions bàsiques: Node: Entorn d’execució Linux, és a dir, una máquina física o virtual. Cluster: Conjunt de nodes emparellats dos a dos mitjançant una interconnexió, com per exemple una ethernet. Recurs: Unitat física o lógica que proveeix un servei als clients o a altres recursos. Per exemple, un recurs podria ser un volum de disk, un servidor web, una adreça IP, etcétera. Grup de Recursos: Conjunt interdependent de recursos. Per exemple un grup de recursos el podrien formar un servidor web i vàries adreces IP de les quals escolta. Per al bon funcionament del “grup de recursos” cal que tots els recursos que el formen funcionin adequadament. Failover: El Failover es el procés de alocatament d’un grup de recursos d’un node cap a un altre. Un Failover pot ser provocat per una fallada al servei o per una peticio de canvi manual efectuada per l’administrador.

Funcionament de Linux Failsafe 1. Servei normal. 2. Ocorre un error. Per exemple, el Servidor de Web (vermell) cau. 3. El servei migra transparentment a un altre node del cluster per poder seguir oferint el servei. Servidor de Dades Fitxers Web Servidor de Web Servidor de Web

Recursos susceptibles de ser monitoritzats A la distribució original FailSafe porta un conjunt de tipus de recursos per defecte preparats per ser utilitzats. Alguns d’aquests recursos són els següents: Apache Web Server IP Adress Volume Filesystem Oracle Listener Samba Server ... De totes maneres FailSafe ens dóna la possibilitat de crear-ne de nous. El procés de creació d’un nou recurs no és massa complicat, entre d’altres coses, bàsicament es basa en la creació d’un script, dit monitor, que s’ha d’encarregar de saber si el servei en concret està funcionant correctament i passar-li aquesta informació, en un format concret, al FailSafe tal i com s’explica al “Linux FailSafe Programmer’s Guide”.

Components Hardware necessaris Els components hardware necessaris per muntar un sistema d’alta disponibilitat són els següents: Un mínim de 2 nodes i un màxim de 9 (en un mateix cluster) Un mínim de 2 interfícies de xarxa, en cada node, per a la xarxa heartbeat de control. Altres components hardware opcionals són: Un mecanisme per resetejar nodes remotament des de un altre node del cluster. P. Ex: un cable NULL-MODEM entre cada dos màquines. Un dispositiu SCSI d’enmagatzemament compartit entre els nodes del cluster per tal de poder formar un sistema RAID-1 (o de mirroring).

Funcionamet intern de Linux FailSafe Un cop instal·lat tot el sistema Hardware cal muntar la part software. Per posar un exemple real partirem d’una configuració hardware estàndar, en la que dos servidors comparteixen un disc SCSI i a més cadascun d’ells disposa de dues interfícies de xarxa (una per la xarxa públic i una altra per La privada (o xarxa de control heartbeat).

Funcionamet intern de Linux FailSafe El primer pas serà definir el cluster, els nodes i els recursos que formaran part del sistema. Aquesta informació es guardarà en el dispositiu d’enmagatzemament compartit o bé es copiarà a tots el nodes a través de la xarxa de privada de control. Quan el sistema està funcionant, després d’haver activat els serveis d’HA (High Availavility), es posaran en marxa els “scripts monitors” de cada grup de recursos i cada màquina comprovarà que les seves veïnes en el cluster funcionin correctament a traves de la xarxa privada (HeartBeat). Quan falla un script monitor es provoca un Failover per passar el grup de recursos sencer, encara que només hagi fallat un determinat recurs de entre tots els del grup, cap a un altre node segons les polítiques de alocatació de Failover. Aquestes polítiques es defineixen en el mateix moment que es fa la definició del cluster, nodes, ...

Funcionamet intern de Linux FailSafe L’altre cas en el que es provoca un Failover es quan, enlloc de fallar un script de monitorització, una màquina no respon a les peticions que li fan la seva veïna per la xarxa de control HeartBeat. Llavors es procedeix a la migració de tots els recursos que té la màquina que ha fallat distribuint-los d’acord amb la política específica de cada grup de recursos, De la mateixa manera que podíem crear scripts monitors personalitzats podem, també, crear polítiques personalitzades encara que les que es distribueixen per defecte amb el FailSafe són força adequades en la majoria dels casos (Round Robin, Seqüència ordenada de nodes, prioritats, ... ) En quant a manteniment per part dels administradors cal dir que existeixen dues maneres de portar-ho a terme. El més ràpid és accedint-hi a qualsevol màquina del cluster mitjançant SSH, Telnet, Rlogin, ... i entrar en el “Cluster Manager” que disposa en format CLI (Command Line Interface).

Funcionamet intern de Linux FailSafe La alternativa es fer-ho amb una GUI (Graphical User Interface) molt més intuïtiva i lenta, ja que s’hi pot accedir via web amb qualsevol “Borwser” que suporti applets en Java. A més cal afegir l’inconvenient de que el applet en qüestió ocupa gairebé 4MB i s’ha de descarregar, CADA cop que s’hi vulgui accedir per qüestions de seguretat.

Miscelània Finalment cal dir que juntament amb el Linux Failsafe es poden posar altres programes de monitorització com l’ SPONG que ens dona informació, sobre el estat de determinades màquines, via web i que dóna la possibilitat de enviar e-mails i missatges informatius a aparells busca-persones (Només a E.E.U.U. mitjançant el sistema SkyTel) als responsables del sistema.

Recursos i Bibliografia - Homepage de sgi Linux FailSafe: http://oss.sgi.com/projects/failsafe - Altres webs interessants: - http://linux-ha.org - Linux FailSafe Administrator's Guide - Linux FailSafe Programmer's Guide Totes dues guies estan disponibles a http://oss.sgi.com/projects/failsafe/doc0.html - Homepage del Spong: http://spong.sourceforge.net/ - Homepage de la distribució SuSE: http://www.suse.de/es/ - Homepage Linux Kernel’s archive: http://www.kernel.org/