Carlos Herrero Joan Torras BEOWULF vs COW Carlos Herrero Joan Torras
Introducció Concurrència Paral.lelisme Parts d’un programa que poden executar-se independentment Ve donada pel programari Paral.lelisme Execució de parts Concurrents d’un programa, al mateix temps i en processos separats. Ve donada per l’arquitectura del maquinari.
Arquitectures Hardware per Paral.lelisme Shared Memory Processes (SMP) Communicació de processos per compartició de memòria Cluster Of Workstations (COW) Cluster ------> Pool de nodes Beowulf Cluster Node servidor i clients muts connectats amb xarxa Sistemes híbrids SMP/COW SMP/Beowulf NUMA (Non uniform memory access). SMP Transparent a l’usuari
Arquitectura SMP Una sola màquina amb més d’un processador Paral.lelisme El sistema operatiu gestiona la compartició de CPU entre processos L’usuari pot paral.lelitzar les seves aplicacions Threads Concurrència Pas de missatges entre processos Comunicació dolenta
Arquitectura COW Pool ---> Conjunt de màquines independents connectades Capa de software de gestió de recursos (MOSIX - Linux) Arquitectures Single Pool Pool = Servidors + estacions de treball Server Pool Estacions de treball -----> Pool=Servidors Adaptive Pool Pool = Servidors + [Estacions de treball] Half-duplex Pool Estacions de treball ----(jobs)-----> Pool=Servidors
Arquitectura Beowulf Cluster ---> Servidor + nodes muds connectats en xarxa Servidor controla i serveix fitxers als nodes Nodes Controlats i configurats pel node servidor No tenen teclat ni pantalla i poden configurar-se sense disc local S’accedeixen via rlogin o terminal sèrie Sistema Operatiu - Unix (Linux) Comunicació entre nodes i servidor --> Llibreries Pas Missatges Parallel Virtual Machine (PVM) Message Passing Interface (MPI)
Arquitectura Beowulf Una possible configuració Nodes Clients tenen una còpia local del SO /home i /usr/local en el servidor exportats via NFS Cada node té una entrada en /etc/hosts.equiv Permet executar rsh un contra qualsevol Node servidor ---> NIS Server
Comparativa Beowulf-COW Concepcions bàsiques diferents Arquitectures Beowulf - Nodes dedicats COW - Aprofita CPU inactives Paral.lelisme Beowulf - Supercomputació centralitzada COW - Fork and forget Utilització Programes de càlcul intensiu i paral.lelitzables
Arquitectura Software Pas de missatges entre processos Envia copia de les dades a compartir Facilitat per ampliar l’aplicació Threads de sistema Comparteix memòria Pensats per màquines SMP Conjunt màquines SMP amb gestió global de memòrai (NUMA) Ambdós mètodes poden implementar-se en sistemes SMP, NUMA-SMP, i Clusters
Llibreria PVM (Parallel Virtual Machine) Software per interconnectar computadores treballant com una sola màquina. Estructura Daemon de màquina virtual Llibreria PVM - programació aplicacions i gestió del host pool Host Pool - Conjunt de màquines virtuals Heterogeni flexible
Llibreria MPI Interfície de comunicació aplicacions-llibreries de sistema Conceptes fonamentals Procés - Espai d’adreces local, no compartició de dades Missatge - Estructurat Cos - Informació, dades. Envoltura - Metadades, Informació de control Grup de processat Conjunt de processos amb un objectiu comú Número de processos estàtic
Eficàcia Concurrència/Paral.lelisme Programador determina les parts concurrents del programa que s’han d’executar paral.lelament ---> Eficiència. Les aplicacions paral.leles són portables entres sistemes però l’eficiència va lligada a cada plataforma. Limitació Velocitat de comunicació i latència entre nodes Augmentant la velocitat dels processadors del cluster pot decrementar l’eficiència del sistema Compromís entre aplicació paral.lelitzable i sistema
Conclusions No hi ha diferències significatives entre Beowult i COW Els clusters tipus Beowulf i COW tenen una relació Prestacions/Preu millor que no pas un supercomputador equivalent Threads aptes per arquitectura SMP Pas de missatges aptes per Beowulf i COW PVM sembla més adequat per COW Eficàcia en funció de l’aplicació i el sistema paral.lel utilitzat
Bibliografia http://www.beowulf.org/ http://lcdx00.wm.lc.ehu.es/~svet/beowulf/ http://www.mosix.cs.huji.ac.il/ http://www.epm.ornl.gov/pvm/pvm_home.html http://www.mpi-forum.org/