proPar Multicomputadores comParalelos-57

Slides:



Advertisements
Presentaciones similares
Trabajo Final de Sistema de información Gerencia Integrantes: Tatiana Beltrán Ramón Zambrano Pedro Cabello.
Advertisements

PROCESAMIENTO PARALELO
CONCEPTES AVANÇATS DE SISTEMES OPERATIUS Departament d’Arquitectura de Computadors (apunts de l’assignatura en format transparència) Beowulf Vs Clusters.
Clusters Presentado por : Manuel Alejandro ahumada trochez Yenny carabali.
14 de diciembre de 2005 Universidad de Murcia1 Modelos de computadores paralelos Domingo Giménez Departamento de Informática y Sistemas Universidad de.
Arquitecturas Paralelas
Instalación de Sistemas Microprocesados
CLASIFICACIÓN DE LAS COMPUTADORAS
PROGRAMACIÓN PARALELA Modelos de programación paralela Modelos computacionales Paradigmas de programación paralela Programación en memoria compartida:
Topologías Gabriel Savo. Red en Bus Todas las estaciones están conectadas a un único canal de comunicaciones por medio de unidades de interfaz y derivadores.
Supercomputadoras Division fundamental entre estilos de supercomputadoras: 1100 D-Core PowerPC 4G p/node 5120 procs (5% del uso es pago) 16 Pentium 3 (o.
ProParPresentaciónCurso 14/15 Departamento: Informática Aplicada => Sistemas Informáticos (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417
ArqAvaPresentaciónCurso 10/11 Departamento:Informática Aplicada (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4411
ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417
LeCCI Ó N 8 CPUs Usados en Computadoras Personales.
Saltar a la primera página Esquemas de procesamiento Definen la forma en que se efectúan los procesos dentro de los equipos de cómputo n Esquema centralizado.
ORGANIZACIÓN DE COMPUTADORAS DRA. LETICIA FLORES PULIDO.
PROCESAMIENTO PARALELO SUPERCOMPUTADORAS, MULTIPROCESAMIENTO, BENCHMARKS CRUZ VAZQUEZ MA.ROSAURA CRUZ VAZQUEZ MA.ROSAURA GUERRERO REBOLLO ARTURO GUERRERO.
SISTEMAS OPERATIVOS Son un conjunto de programas destinados a permitir la comunicación entre el usuario y en computador y gestionar sus recursos.
Computadoras de Alto Rendimiento (HPC)
Arquitecturas AvanzadasASCI QCurso 10/11 Completo => Alpha EV-68 a 1,25GHz => 30TFlops Contrato 22/8/2000 => 200 m$ => 175 m€ => mPts.
Clustering Redes II Sobre la base que ya conocen… … los clusters requieren un apilamiento de máquinas de diversa estructura, con el fin de repartirse.
Trabajo practico: Microprocesadores Escuela: Rodolfo Walsh Rodolfo WalshRodolfo Walsh Materia: Tecnologia| Tecnologia Profesor: Gustavo Cucuzza Integrantes:
TEMA 8 Introducción a Windows 2008 Server Msc. Rina Arauz.
COMPUTACION PARALELA GLORIA PATRICIA FLOREZ ANGIE PAOLA ANCHICO.
Nuestro Cyber café, contara con un servidor/administrador que monitoree el funcionamiento y todo lo que se hace en las computadoras clientes. Contara.
Status del site UAM/tier2 Valencia, 22 de Junio del 2009.
ALUMNO: NORMA DOLORES ILLESCAS CANALIZO. GRUPO:503 CECYTEM TEPOTZOTLAN. Procesador de un servidor.
“Alternativa para procesamiento de datos oceanográficos que requieren gran capacidad de cómputo, por medio de programación en paralelo con el programa.
Hardware de Computador
Tipos de Red según el medio
Clusters.
BLOQUE 2 INFORMÁTICA 1 Navegadores. Buscadores. Correo electrónico.
EQUIPO No 3.
arqPar ASCI Q Curso 15/16 ASCI Q-A (1/3) #2 Nov2002 #91 Nov2007
Diferencias entre las arquitecturas de 64 bits de AMD e intel.
Computación Curso 2017.
TIC TECNOLOGIAS DE LA INFORMACION Y LA COMUNICACION
Tema: Redes Grado: 1° Grupo: C Nombre: Lisda Iveth Hernández Velázquez
Conocimientos previos
Generaciones de computadoras
REDES MESH Pedro Moeller Davila Quiropractica Facultad De Medicina.
Almacenamiento El computador tiene 2 aspectos
Daniel Galhardo y Adrian Arrieta
LUZ MERY SILVA BUITRAGO
Herramientas Entorno Web
SISTEMAS OPERATIVOS DISTRIBUIDOS. Es la unión de varios sistemas de computo compuestos posiblemente cada uno de varios CPU's, interconectados mediante.
IV Jornada de Coordinación del SIC
arqAvaPar Necesidades, …….… Introducción-33
INTRODUCCIÓN CONECTIVIDAD COPROCESAMIENTO MÁQUINAS MIMD MÁQUINAS SIMD
Capítulo 5: Ethernet Introducción a redes Capítulo 5: Ethernet
REDES.
arqAvaPar Necesidades, Evolución/Revolución Introducción-60
¿Cómo son nuestros clusters?
arqAvaPar Procesadores Multinúcleo (Intel) MIMD-79
arqAvaPar ASCI Q Curso 17/18
Procesadores El procesador es el elemento vital del PC.
Técnicas de Comunicación Colectiva sobre QsNet
1 Comunicación y representación de la información
proPar Curso 18/19 4 2, 3, 2 2, 4 3 Computadores Paralelos
proPar Necesidades comParalelos-30
proPar Curso 18/ , 3, 2 2, 4 3 Computadores Paralelos
Programa de Prácticas Entorno Las prácticas Planificación
Procesamiento Paralelo Curso 18/19
proPar Curso 18/ , 3, 2 2, 4 3 Computadores Paralelos
Esmeralda, montse, martha, gloria
arqAva Cantidad de paralelismo Introducción-88
arqAva Encaminamiento (Modos) Conectividad-48
1 TEMA 10. SISTEMAS OPERATIVOS DISTRIBUIDOS Introducción Hardware Software Aspectos de diseño.
Informática- R.L.G.1 Computadora: Herramienta electromecánica que facilita diversas y muy variadas tareas dependiendo del programa que se utilice. Se caracteriza.
Transcripción de la presentación:

proPar Multicomputadores comParalelos-57 Pn RED de Comunicación Memoria Privada | Memoria Distribuída MPP COW/NOW Beowulf ASCI Q (#2 Nov02) 8192 Pi 13,88 TF 175 millones € System X (#7 Nov04) 2200 Pi (G5) 10,28 TF 4,5 millones € 12 Pi, 48.000 €

proPar Multicomputadores comParalelos-58 21 servidores Supermicro Intel Core 2 Q6600 2,4GHz + 4GB 84 núcleos + 84GB 20.600€  21 servidores 1.000€  armario Sep/2008

proPar Ejemplos de Jerarquía de Memoria comParalelos-59 1 2002 ASCI Q 22 TB 440 TB 2 2003 Virginia Tech’s X 4 TB 176 TB 7 2004 30 91 108 2007 472 Tianhe-2 1,3 PB 12,4 PB 1 Nov/2013 Summit 10 PB 250 PB 1 Jun/2018 MTBF = 6,16 días* ¡ 3.120.000 núcleos !

proPar Redes Directas comParalelos-60 Switch MultiC más integrado De otros nodos A otros nodos P M IC Red con enlaces directos entre Pi Unas redes directas: Array lineal Anillo Árbol Mallas 2D y 3D Toros 2D y 3D Hipercubo Nodos => PC’s o similares

proPar Redes Directas y... comParalelos-61 Parámetros de interés: Ancho de banda (agregado vs bisección) y x Latencia (Msj[0], Msj[N]) Diámetro Coste (grado: #puertos comunicaciones) Toro 2D ¿ Por qué todo esto ? ¡ Anillo embebido !

proPar Redes Directas comParalelos-62 HIPERCUBO Dim3 Dim1 Dim2 Diámetro = log2 N Grado = log2 N Fácil encaminar Dim4

proPar Redes Directas comParalelos-63 Encaminamiento en HIPERCUBO (Sea N=16) 1 2 3 4 1. Numerar nodos en binario. Nodos adyacentes difieren en un bit (el asociado a la dirección que les une) 0000 4321 1010 1111 0101 0111 0110 0011 Nodo actual 0111 Nodo destino 1010 2. Enviar mensaje por el enlace asociado a la menor dirección donde no coinciden bit del nodo actual y bit del nodo destino 0001 0010 0100 1000 ¿ Realizar ORX ? 0111 ORX 1010 = 1101 0110 1010 0010 1010 1010

proPar Redes de PC’s como ... comParalelos-64 Ventajas del entorno PC, o similar, para Sistemas Paralelos Hardware rápido y barato (cada año | año y medio más) CPU (Core i7, AMD Phenom, IBM PowerPC, …) Memoria P. y Caché (4..8GB.. y 2MB..8MB) Disco (1TB.. 7200rpm RAID) Tecnologías de interconexión Ethernet (Fast, Giga, 10Giga), Infiniband, .... Software Sistema Operativo (Linux, Solaris, Windows, ...) Entorno de programación ( PVM, MPI, ...  C, C++, .... ) Thomas Sterling, “Beowulf Cluster Computing with Linux” | “Windows” , 2002

proPar Redes de PC’s como ... comParalelos-65

proPar Redes de PC’s como ... comParalelos-66 Tecnologías de interconexión Ethernet Más común (barato)  10 4µs GigaEthernet 10GigaEthernet Infiniband Gbps 1 Latencia? 29..120µs 10µs TarjetaRed 10€ 400€.. 500$.. Switch (16) 80€ miles€ 6.000$.. ¡ Ojo, todavía menos ! MsjMin 64B Control Error Datos (variable) 4B 0..1500B Tipo 2B Dirección Origen Destino 6B Preámbulo 8B dirección + COLISIONES

proPar Redes de PC’s como ... comParalelos-67 Nuestro entorno de prácticas Core i7 Pentium Core 2 Quad Q6600 2,4GHz • 8ML2 • 4GB • 500GB Switch GigaEthernet pc1 pc2 pc3 pc5 pc4 pc6 pc7 pc8 Red E.U.I. iaclusters2 iaclusters1

proPar Posibilidades de acelerar ... comParalelos-68 ALGUNAS MEDIDAS DE PARALELISMO GRADO: Número de CPU’s para las que tengo trabajo simultaneo GRANO: Tamaño (# instrucciones) asignado a cada CPU Granularidad gruesa, media, fina Miles I. Cientos I. Varias I. + grado + comunicación Maximizar ratio = Tcómputo / Tcomunicación

proPar Posibilidades de acelerar ... comParalelos-69 GRADO y GRANO: ¡ Pintar 18 habitaciones ! ¿18 pintores => Grado = 18 Grano = 1h? ¿Sólo cuento con 3 pintores? ¿Tengo 7 pintores? ¿Me la pega mi marido | mujer?

proPar Posibilidades de acelerar ... comParalelos-70 ordenarPar: Ordenar un vector en memoria ordenar 3 8 15 2 4 1 7 10 6 14 13 5 11 9 12 16 T1 T2 T3 T4 2 3 8 15 1 4 7 10 5 6 13 14 9 11 12 16 T1 T3 mezclar 1 2 3 4 7 8 10 15 5 6 9 11 12 13 14 16 T1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 mezclar

proPar Posibilidades de acelerar ... comParalelos-71 ACELERACIÓN: “Speedup” Cuántas veces más rápido al contar con “n” CPU’s en vez de una. (Absoluta) Sn = Tsecuencial / Tparalelo = T1 / Tn SI CON UNA CPU SE ORDENA EN 1 MINUTO, ¿CON 4 CPU’s SE ORDENA EN? ===> 15”, 20”, .....??? 1 <= Sn <= n n = Máximo teórico EFICIENCIA: Lo mismo, pero teniendo en cuenta “n”. (Relativa) En = Sn / n = T1 / nTn 1/n <= En <= 1 1 = Máximo teórico

proPar Cantidad de paralelismo comParalelos-72 ACELERACIÓN: ¿Por qué no tanto? t/2 Thread1 Thread2 rec(1, &msj) ? Acceso a datos comunes Sincronismo Comunicación 1 env(2, &msj)

proPar Posibilidades de acelerar ... comParalelos-73

proPar Posibilidades de acelerar ... comParalelos-74 ACELERACIÓN: ¿Por qué no tanto? P0 P1 P2 P3 P4 P5 ? Reparto no equilibrado 2 A unos más trabajo que a otros Unos cores más rápidos que otros Código secuencial puro 3

proPar Cantidad de paralelismo comParalelos-75 ACELERACIÓN: ¿Puede que todavía más? t/2 ? Superaceleración Ficticia Real ? #nodos T 1 2 4 29:381 Ordenar 84.000 int 1000 Sn 3,38 1.000.000 250.000 1.000 8:693 2:181 13,47

proPar Posibilidades de acelerar ... comParalelos-76 16 32 64 128 10 20 30 40 50 60 70 versión 12/94 versión 9/94 versión 8/94 Aceleración en tres versiones de un programa paralelo Pfeiffer et al. 1995 (AMBER en Intel Paragon 128 P)

proPar Posibilidades de acelerar … comParalelos-77 Sn y En resolviendo Sistemas Lineales de 1000 variables (Jack Dongarra, 2004)

proPar Posibilidades de acelerar … comParalelos-78 Sn y En resolviendo Sistemas Lineales de 1000 variables (Jack Dongarra, 2004)

proPar Posibilidades de acelerar … comParalelos-79 ¡ Eficiencia del 96% ! ¡172.032 cores En=82%!

proPar Posibilidades de acelerar ..... comParalelos-80 ¿Máxima Aceleración? – Ley de Amdahl (a) Una CPU T1 200 F T1 (1-F) T1 0,1 20 180 Secuencial Trozos paralelizables n CPU’s 5 (b) Varias CPU’s 36 Sn = T1 / Tn 8 Tn (1-F)T1/n n Sn = 1 + (n-1) F

proPar Posibilidades de acelerar ..... comParalelos-81 Sn Significado F = 0% 20 FIN n Sn = 1 + (n-1) F 16 12 F = 5% 8 ¡ F=5% => Lim Sn = 20 ! 4 F = 20% “Amdahl’s Law in the Multicore Era” Mark D. Hill & Michael R. Marty 2007 n 4 8 12 16 20