Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porDaniel Herrero Valenzuela Modificado hace 10 años
1
A rkitektura P araleloak IF - EHU Arquitecturas paralelas 9. Herramientas para la programación de aplicaciones paralelas: OpenMP y MPI (introducción). Computadores de alta velocidad (la lista top500).
2
A rquitecturas P aralelas FI - EHU 599 Array Vectorial MP P C bus memoria compartida SMP MPP/NUMA Clusters memoria distribuida P C M red general 1 1 N N SIMD MIMD SISD fl. instrucciones flujo datos Arquitectura de los sistemas paralelos
3
A rquitecturas P aralelas FI - EHU 609 Un procesador (vectorial) Sistemas SMP / sistemas SIMD Sistemas masivamente paralelos MPP Las mejores prestaciones (velocidad de cálculo): comunicación de baja latencia y elevado ancho de banda, en algunos casos procesadores con diseño específico, software de control muy optimizado, etc. Pero coste muy elevado. Clusters Evolución de las arquitecturas
4
A rquitecturas P aralelas FI - EHU 619 Lista de los 500 supercomputadores más rápidos del mundo ejecutando el banco de pruebas LINPACK. Se mide el valor de Rmax, Nmax y N 1/2. También se empieza a medir la potencia consumida. Sistemas de ecuaciones lineales densos (cálculo matricial). Permite obtener velocidades muy altas (un máximo virtual). Top500 (www.top500.org)
5
A rquitecturas P aralelas FI - EHU 629 Cada 6 meses desde 1993 (junio/noviembre ) Lista nº 40 - noviembre 2012 Más o menos aceptado por todos los fabricantes. Análisis de tendencias / evolución del mercado. Top500
6
A rquitecturas P aralelas FI - EHU 639 Evolución de la velocidad de cálculo Top5+ Fabricantes Procesador: arquitectura / familia / número Sistema: arquitectura / red / S.O. Utilización Top500
7
A rquitecturas P aralelas FI - EHU 649 ×1,9/año 162,1 PF/s 14.885.800 cores (29.771 c. - 10,9 GF/s) 1 PF/s → 2008 10 PF/s → 2011 100 PF/s → 2015 Top500 Intel ASCI Red SandiA IBM ASCI White LLNL NEC Earth Sim. BlueGene RoadRunne r Jaguar K-computer Titan Sequoia Tianhe- 1A
8
A rquitecturas P aralelas FI - EHU 659 Rank Computer Cores R max R peak (Pflop/s) Power (kW) Installation site Country/year Type Top5 (diciembre 12) 1 mpp Titan, Cray XK7 Opteron 6274, 16 core 2,2 GHz Cray Gemini, NVIDIA K20x 560.640 17,6 27,1 8.209 Oak Ridge N.L. USA / 2012 - 2 mpp Sequoia, BlueGene/Q Power BQC, 16c – 1,60 GHz Custom (torus 5D) 1.572.864 (96x1024x16) 16,3 20,1 7.890 DOE/NNSA/LLNL USA/ 2012 Research 3 cluster K computer, Fujitsu SPARC67 viiifx - 2 GHz Tofu interc., 6D torus/mesh 705.027 10,5 11,3 12.660 RIKEN AICS Japonia/ 2011 Research 6 cluster SuperMUC, IDataPlex DX360M4 Xeon E5-2680 - 2,7 MHz Infiniband FDR 147.456 2,9 3,2 3.433 Leibnitz R. Alemania/ 2012 Academic Más BueGene/Q: (4): Mira, 48x, USA; (5) JUQUEEN, 24x, Juelich; (9) Fermi, 10x, Bologna 8 mpp Tianhe-1A NUDT-MPP Intel EM64T Xeon X5670 - 2,93 GHz Propietary 186.368 2,6 4,7 4.040 Tianjin NSC Txina / 2010 Research
9
A rquitecturas P aralelas FI - EHU 669 Cant.% Rmax (PF/s) Cores IBM 19338,666,26.769.140 HP 14629,218,12.300.904 Cray Inc. 316,228,21.908.880 Appro 244,85,1373.200 SGI 193,85,1434.406 Fujitsu 10213,8921.048 Total (+) 500100162,114.885.800 fabricante del sistema Top500
10
A rquitecturas P aralelas FI - EHU 679 Top500
11
A rquitecturas P aralelas FI - EHU 689 Cant.% Rmax (PF/s) Cores Escalar49999,4162 14.884.520 Vectorial10,20,121.280 Total 500100162,1 14.885.800 arquitectura del procesador Top500 217: Earth Simulator 2, NEC – 0,12 PF/s – 1.280 cores
12
A rquitecturas P aralelas FI - EHU 699 Top500
13
A rquitecturas P aralelas FI - EHU 709 Cant.% Rmax (PF/s) Cores Xeon 38176,270,76.786.414 Opteron 6112,2322.620.330 Power 5310,646,94.606.112 NEC 10,21221.280 Total (+) 500100162,114.885.800 familia de procesadores Top500
14
A rquitecturas P aralelas FI - EHU 719 Top500 Num. cores (mpp / cluster)
15
A rquitecturas P aralelas FI - EHU 729 VP500 Y-MP C90 CM5 Paragon T3D SP2 T3E ASCI Red Sun HPC CM2 Earth Sim. Blue Gene RoadRunner Jaguar Tianhe-1A K computer Top500 Sequoia Titan
16
A rquitecturas P aralelas FI - EHU 739 Cant.% Rmax (PF/s) Cores Clusters41182,283,48.060.460 MPP8917,878,76.825.340 Total 500100162,114.885.800 un año → x 2,20 x 1,6 arquitectura del sistema Top500
17
A rquitecturas P aralelas FI - EHU 749 Top500
18
A rquitecturas P aralelas FI - EHU 759 Cant.% Rmax (PF/s) Cores Infiniband 22444,852,74.284.249 Gigabit Eth. 18937,820.43.161.618 Custom 5310.659,65.228.512 Proprietary 1536,4954.256 Cray 15322,61.206.240 Myrinet 30,60,349.645 Fat tree 10,20,121.280 Total (+) 500100162,114.885.800 Red de conexión Top500
19
A rquitecturas P aralelas FI - EHU 769 Top500
20
A rquitecturas P aralelas FI - EHU 779 Top500
21
A rquitecturas P aralelas FI - EHU 789 Cant.% Rmax (PF/s) Cores Industry24749,4 28,53.933.385 Research12124,2 96,27.837.116 Academic9719,4 29,52.507.471 Government183,6 3,4299.860 Vendor132,6 3,7229.632 Classified40,8 0,978.366 Total 500100162,114.885.800 área de utilización Top500
22
A rquitecturas P aralelas FI - EHU 799 Top500
23
A rquitecturas P aralelas FI - EHU 809 Top500
24
A rquitecturas P aralelas FI - EHU 819 Top500: España/Francia (dic. - 12) 36Mare Nostrum IBM iDataPlex, Xeon E5 (8c), Infiniband FDR 33.664 cores – 637 TF/s 290BSC Bull, cluster (Infin.) – 5.544 cores – 103 TF/s >> 39.208 cores – 0,7 PF/s (0,3%) 11 Curie thin nodes, CEA Bullx B510 Xeon E5 (8c), Infniband, 77.184 c. – 1.359 TF/s 20 Tera-100, CEA Bullx super-node S6010/S6030, Infniband, 138.368 c. – 1.050 TF/s 31/32 BlueGene/Q Power BQC, 65.536 c. - 690 TF/s … Total: 21 sistemas (EDF, Airbus, CINES, Total,…) >> 620.248 c.- 6,5 PF/s (4%) >> Europa: Alemania (19 - 10,2 PF/s), G.B. (24 – 7,3 PF/s), Italia (7 - 2,4 PF/s) Total: 31,2 PF/s (20%)
25
A rquitecturas P aralelas FI - EHU 829 El cluster ARINA de la UPV/EHU Arina, Arinaz (260 núcleos, Itanium2) Guinness (440 núcleos, Xeon) Maiz (40 núcleos, Opteron) Sistema paralelo de ficheros (SFS) 4 servidores 4,7 TB / 7,1 TB Infiniband, 1 GB/s
26
A rquitecturas P aralelas FI - EHU 839 El cluster ARINA de la UPV/EHU
27
A rquitecturas P aralelas FI - EHU 849 Aplicaciones En general, de química, física y biología. Software adquirido: CFX, dinámica de fluidos MOLCAS, estructura molecular ADF, estr. electrónica de las moleculas WIEN2K, estr. electrónica de sólidos Qsite, proteínas NBO5-NBOView, enlaces moleculares El cluster ARINA de la UPV/EHU
28
A rquitecturas P aralelas FI - EHU 859 Cluster del laboratorio 32 + 3×4 procesadores (Pentium IV) Gigabit Ethernet OpenMP, MPI, UPC Laboratorio de Paralelismo
29
A rquitecturas P aralelas FI - EHU 869 Titan
30
A rquitecturas P aralelas FI - EHU 879 Cray Jaguar
31
A rquitecturas P aralelas FI - EHU 889 Cray Jaguar
32
A rquitecturas P aralelas FI - EHU 899 K computer
33
A rquitecturas P aralelas FI - EHU 909 Tianhe-1A
34
A rquitecturas P aralelas FI - EHU 919 Tianhe-1A
35
A rquitecturas P aralelas FI - EHU 929 Nebulae
36
A rquitecturas P aralelas FI - EHU 939 Hopper
37
A rquitecturas P aralelas FI - EHU 949 Tera-100
38
A rquitecturas P aralelas FI - EHU 959 RoadRunner Cell
39
A rquitecturas P aralelas FI - EHU 969 RoadRunner
40
A rquitecturas P aralelas FI - EHU 979 RoadRunner
41
A rquitecturas P aralelas FI - EHU 989 RoadRunner
42
A rquitecturas P aralelas FI - EHU 999 RoadRunner
43
A rquitecturas P aralelas FI - EHU 1009 RoadRunner
44
A rquitecturas P aralelas FI - EHU 1019 RoadRunner
45
A rquitecturas P aralelas FI - EHU 1029 JuGene - BlueGene/P
46
A rquitecturas P aralelas FI - EHU 1039 JuGene - BlueGene/P
47
A rquitecturas P aralelas FI - EHU 1049 5,5 GB/s 11 GB/s 15 way fully assoc. pref. caches 5,5 GB/s 27 GB/s 22 GB/s BlueGene/L
48
A rquitecturas P aralelas FI - EHU 1059 BlueGene/L
49
A rquitecturas P aralelas FI - EHU 1069 32 x 32 x 64 1,4 Gb/s (x2) 5,6 Tb/s bisección tr (max) = 69 ns cut-through adaptativo deadlock-free active messages BlueGene/L
50
A rquitecturas P aralelas FI - EHU 1079 BlueGene/L
51
A rquitecturas P aralelas FI - EHU 1089 JuGene - BlueGene/P
52
A rquitecturas P aralelas FI - EHU 1099 JuGene - BlueGene/P
53
A rquitecturas P aralelas FI - EHU 1109 JuGene - BlueGene/P
54
A rquitecturas P aralelas FI - EHU 1119 JuGene - BlueGene/Q
55
A rquitecturas P aralelas FI - EHU 1129 Earth Simulator 2
56
A rquitecturas P aralelas FI - EHU 1139 Earth Simulator 2 Peak performance:102,4 GF/s × 8 × 160 CPU = 131 TF/s Shared memory:128 GB × 160 = 20 TB ES → ES2: proz: 1/4; mem: x2; perform: ×3,2; sarea: cross → fat tree
57
A rquitecturas P aralelas FI - EHU 1149 Earth Simulator 2 1 Chip LSI : 102,4 Gflops 65 nm CMOS 11 Layers copper interconnection 21,04 mm x 19,84 mm 350 million transistors 8.960 pins Clock Cycle: 3,2 GHz Power Consumption: 240 W (Typ.)
58
A rquitecturas P aralelas FI - EHU 1159 Earth Simulator 2
59
A rquitecturas P aralelas FI - EHU 1169 Earth Simulator 2 Internode Crossbar Switch (IXS)
60
A rquitecturas P aralelas FI - EHU 1179 Earth Simulator 2
61
A rquitecturas P aralelas FI - EHU 1189 Earth Simulator 2
62
A rquitecturas P aralelas FI - EHU 1199 Mare Nostrum (www.bsc.org.es)
63
A rquitecturas P aralelas FI - EHU 1209 Mare Nostrum
64
A rquitecturas P aralelas FI - EHU 1219 Mare Nostrum
65
A rquitecturas P aralelas FI - EHU 1229 Mare Nostrum
66
A rquitecturas P aralelas FI - EHU 1239 Mare Nostrum
67
A rquitecturas P aralelas FI - EHU 1249 Mare Nostrum
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.