Técnicas de Comunicación Colectiva sobre QsNet

Slides:



Advertisements
Presentaciones similares
 Capas (Layers): Una red está organizada en una serie de capas para asegurar que la estructura sea simple y que el proceso de transferencia de datos.
Advertisements

Arquitecturas AvanzadasASCI QCurso 10/11 Completo => Alpha EV-68 a 1,25GHz => 30TFlops Contrato 22/8/2000 => 200 m$ => 175 m€ => mPts.
Ingenieria de Sistemas Juan Gamboa 10a. Tabla de Contenido Deficion Objetivo Social Perfil Profesional Pensum Universidades Semejanzas y diferencias con.
REIMS LANCHIMBA PAREDES M ODELAMIENTO DEL CANAL DE PROPAGACIÓN EN ENLACES PUNTO A PUNTO PARA LA BANDA DE 2.4 GHz CON TECNOLOGÍA ZIGBEE. DEPARTAMENTO DE.
Desventajas Poco eficiente: lectura y escritura en disco es lenta Necesita otro mecanismo de sincronización para acceder a los datos Son los procesos.
Unidad II *. Objetivo de la unidad El alumno establecerá los estándares para verificar el óptimo funcionamiento de una red Ethernet.
COMPUTACION PARALELA GLORIA PATRICIA FLOREZ ANGIE PAOLA ANCHICO.
Medellín - Bogotá | PBX: (57) | Dirección Medellín: Cr 79# || Todos los derechos reservados 2016 © Diseño Jeduca.
Sistemas Distribuidos Jueves, 19 de enero ● Virtualización de redes ● Comunicación indirecta.
1 Universidad Del Caribe Telemática Sistemas Operativos Distribuidos y de Tiempo Real “Modelos de Sistemas” Profesor: Joel Antonio Trejo Sánchez Integrantes:
OPENMOSIX Camilo Ruiz Méndez Francisco J. Palacios Burgos.
Ing. En sistemas computacionales Materia: Informática II Maestro: Gabriel Orosco Alumno: Alexis Mata.
? INTERRUCCIONES Y BUSES Interrupciones Buses
Identificación de tráfico de red basado en Aprendizaje Automático
LA FIBRA OPTICA.
Estructuras de interconexión de un computador
Conmutación de Ethernet
Rafael Asprilla Universidad de Panamá ,
Prototipado de un MMR Simple en una FPGA
ANÁLISIS DE EFICIENCIA - DEA
CIENCIA TECNOLOGÍA Y SOCIEDADES
INSTITUCION EDUCATIVA SAN ISIDRO DE CHICHIMENE
HILOS EN SISTEMAS DISTRIBUIDOS
Sistema Distribuido para entidad bancaria
arqPar ASCI Q Curso 15/16 ASCI Q-A (1/3) #2 Nov2002 #91 Nov2007
DATA WAREHOUSE Y ALMACENAMIENTO
REDES DE COMPUTADORAS SEGÚN TOPOLOGIAS
Impacto de diferentes estrategias de integración asistencial en el desempeño de las redes de salud en diferentes sistemas salud de Latinoamérica Bogotá,
Presentamos.
Computación Curso 2017.
Universidad manuela beltran - virtual
ALGORTIMO Y PROGRAMA REDES PETRI
Tema 4 Elementos para el Desarrollo de Algoritmos
Díaz Alonso Emmanuel. Ramírez Cortes Caren Marlen.
LA FUNCION INFORMATICA
Las herramientas Case Julian madrigal.
Ruben Calle Gary Medrano
Convergencia Tecnológica.
Vivir en un mundo basado en redes
Capítulo 4: Capa Red - V ELO322: Redes de Computadores
Un sistema distribuido debe permitir el apropiado uso de los recursos, debe encargarse de un buen desempeño y de la consistencia de los datos, además de.
Michelle Vanessa Rojas Torres 1101
Colegio de Bachilleres plantel 4 Alumno: Luis Josue Esteban Trinidad G:202 E:5 Reporte sobre MI BLOG.
Redes.
APLICACIONES.
Diferencias programador vs Ingeniero de software
L.I. Gerardo Ortiz Rivera
Redes I Magistral Nro. 10 Capa 5: Sesión
Modelo de la cascada (cont.)
Área de Matemática.
CONFIGURACIÓN DEL SWITCH
Jornadas de Puertas Abiertas en: Facultad de Informática
Infraestructuras y servicios para la docencia y la investigación
Actividad: Fase de Transferencia
INSTITUTO TECNOLÓGICO SUPERIOR DE ACAYUCAN
Pipelining Peligros de control.
Almacenamiento Cloud Arquitectura del Computador Santiago Vanegas
arqAvaPar ASCI Q Curso 17/18
Clase1: Análisis de Algoritmos, Optimización Clásica, Heurísticas
Agentes: Introducción
Reanudación de Ejecución de Procesos en Metasistemas
PLANIFICACIÓN INTEGRADA DE TAREAS
PLANIFICACIÓN Y GESTIÓN
Rafael Mayo García ISUM 2019, 27 a 29 de marzo de 2019
LCR Conceptos Básico de Redes. FR Es una medida de recursos disponibles para transmitir datos. También es una medida que se usa para definir la velocidad.
Tecnologías y capacidades en Industria 4.0
Pruebas de rendimiento de RedIRIS y su comparativa con la Internet Comercial  
Curso Redes (IS20) -Capítulo 5 1 Redes (IS20) Ingeniería Técnica en Informática de Sistemas Práctica 3- Estudio de tráfico sobre LAN
Equilibrado del tráfico en InfiniBand
Expo Desarrolladores en Tecnologías Multimedia
Transcripción de la presentación:

Técnicas de Comunicación Colectiva sobre QsNet Salvador Coll Francisco J. Mora (DSD), José Duato (GAP) Fabrizio Petrini, Eitan Frachtenberg (LANL) Jornada de Arquitecturas para el Cálculo y Comunicaciones Avanzadas Última Actualización 02/12/2018

Motivación ASCI: Accelerated Strategic Computing Initiative ( ahora Advanced Simulation and Computing Program) LLNL,SNL,LANL Empleo de tecnologías estándar en computación de altas prestaciones Creciente empleo de los clusters como plataformas de computación de altas prestaciones (7 en Top10) QsNet (red de interconexión de Quadrics) es empleada en 4 de los 7 clusters entre los Top10 Jornada de Arquitecturas para el Cálculo y Comunicaciones Avanzadas

QsNet Proporciona una abstracción de memoria virtual compartida y distribuida Basada en dos bloques NIC: Elan Elan3, 64-bit, 66 MHz PCI bus (QsNetI) Elan4, 64-bit, 133MHz PCI-X bus (QsNetII) Switch crossbar (16x8): Elite Elite3, 35ns (QsNetI) Elite4, 21ns (QsNetII) QsNetI: 320MB/s, 2.5μs* QsNetII: 900MB/s, 1.7μs* *Escritura de 8 bytes, 4000 nodos, 50m cable Jornada de Arquitecturas para el Cálculo y Comunicaciones Avanzadas

Trabajos desarrollados QsNet Redes Multirail Asignación dinámica de rails Evaluación de prestaciones de diferentes patrones de comunicación 2001 2002 Entrada/Salida Evaluación de prestaciones Posicionamiento de los nodos de E/S 2003 Ultimos años: evaluación de prestaciones de QsNet Esto permite identificar las limitaciones más importantes: tráfico bidireccional, broadcast en presencia de fallos (nodos no consecutivos) Multirail: aborda dos problemas, el tráfico bidireccional (80% del ancho de banda del unidireccional debido al chipset PCI); conflictos en el nodo destino al emplear división de mensajes largos entre varios rails Entrada/salida: análisis del tráfico de E/S, posición de los nodos de E/S, uso de nodos de E/S dedicados o compartidos, impacto del tráfico de fondo Comunicación Colectiva Desarrollo de nuevas técnicas de comunicación colectiva 2004 Jornada de Arquitecturas para el Cálculo y Comunicaciones Avanzadas

Topología: Fat-tree Escalabilidad Tolerancia a fallos Conectividad uniforme Soporte para operaciones colectivas Jornada de Arquitecturas para el Cálculo y Comunicaciones Avanzadas

Comunicación Colectiva. Mecanismo HW Ejemplo para 16 nodos 6μs para sincronizar 1024 nodos Estas excelentes prestaciones son un factor clave para: Obtener buen rendimiento de las aplicaciones científicas [Petrini et al. SC’03] Mejorar las operaciones de gestión de recursos [Frachtenberg et al. SC’02] Sincronización de 1024 nodos: 6us (LLNL) Broadcast: aproximadamente el ancho de banda de unicast para redes de hasta 64 nodos (140MB/s medidos sobre 1024 nodos) 1) Algunas aplicaciones científicas pasan una considerable parte de su tiempo de ejecución realizando comunicación colectiva (en algunos casos hasta el 70% del tiempo) SAGE dedica el 50% de su tiempo (4096 nodos) para hacer reducciones totales (allreduce) 2) Gestión de recursos: ej. Planificación de un trabajo 2 órdenes de magnitud más rápido que los mejores resultados publicados previamente BLOQUEO Jornada de Arquitecturas para el Cálculo y Comunicaciones Avanzadas

Comunicación Colectiva. Limitaciones Limitado al caso en que los nodos destino son consecutivos. En caso contrario se usa un árbol basado en mensajes punto a punto. Barrera 2 veces más lenta y broadcast 8 veces más lento en un sistema con 32 nodos. Tolerancia a fallos, fragmentación por planificación de trabajos Impacto en los mecanismos de gestión de recursos y en el rendimiento de las aplicaciones Solución: árboles basados en mensajes multicast (HW) Jornada de Arquitecturas para el Cálculo y Comunicaciones Avanzadas

Árboles de Multicast HW EJEMPLO: Fuente: 0 Destinos: [2,4],[6,9],[11,15] Jornada de Arquitecturas para el Cálculo y Comunicaciones Avanzadas

Árboles de Multicast HW. Problemas Múltiples multicasts en paralelo pueden producir bloqueo La red serializa todos lo multicasts a través del “árbol de broadcast” Cálculo del árbol óptimo, en términos de latencia Algoritmo de backtracking: complejidad exponencial, problema NP-Completo Algoritmo voraz: complejidad proporcional a la profundidad del árbol Jornada de Arquitecturas para el Cálculo y Comunicaciones Avanzadas

Árboles de Multicast HW. Resultados Árboles multicast óptimos 2 pasos para grandes sistemas con menos del 0.8% fallos 4 pasos en el caso peor (hasta 4096 nodos, 10% fallos) Comportamiento del algoritmo voraz Obtiene el árbol óptimo en el 99% de los casos (16..4096 nodos, 0.1%..10% fallos) 100% con menos del 1% de fallos Jornada de Arquitecturas para el Cálculo y Comunicaciones Avanzadas

Árboles de Multicast HW. Resultados Jornada de Arquitecturas para el Cálculo y Comunicaciones Avanzadas

Árboles de Multicast HW. Resultados Jornada de Arquitecturas para el Cálculo y Comunicaciones Avanzadas

Árboles de Multicast HW. Resultados Jornada de Arquitecturas para el Cálculo y Comunicaciones Avanzadas

Conclusiones Se ha desarrollado un nuevo mecanismo denominado Árboles Multicast con Soporte Hardware Soluciones óptimas pueden ser calculadas con un algoritmo voraz Cualquier caso práctico requiere solo 2 pasos En una red con 32 nodos, se reduce a la mitad la latencia de la barrera y se duplica el ancho de banda del broadcast Los Árboles Multicast con Soporte Hardware son una alternativa escalable y tolerante a fallos Jornada de Arquitecturas para el Cálculo y Comunicaciones Avanzadas