La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

A rkitektura P araleloak IF - EHU Arquitecturas paralelas 9. Herramientas para la programación de aplicaciones paralelas: OpenMP y MPI (introducción).

Presentaciones similares


Presentación del tema: "A rkitektura P araleloak IF - EHU Arquitecturas paralelas 9. Herramientas para la programación de aplicaciones paralelas: OpenMP y MPI (introducción)."— Transcripción de la presentación:

1 A rkitektura P araleloak IF - EHU Arquitecturas paralelas 9. Herramientas para la programación de aplicaciones paralelas: OpenMP y MPI (introducción). Computadores de alta velocidad (la lista top500).

2 A rquitecturas P aralelas FI - EHU 599 Array Vectorial MP P C bus memoria compartida SMP MPP/NUMA Clusters memoria distribuida P C M red general 1 1 N N SIMD MIMD SISD fl. instrucciones flujo datos Arquitectura de los sistemas paralelos

3 A rquitecturas P aralelas FI - EHU 609  Un procesador (vectorial)  Sistemas SMP / sistemas SIMD  Sistemas masivamente paralelos MPP Las mejores prestaciones (velocidad de cálculo): comunicación de baja latencia y elevado ancho de banda, en algunos casos procesadores con diseño específico, software de control muy optimizado, etc. Pero coste muy elevado.  Clusters Evolución de las arquitecturas

4 A rquitecturas P aralelas FI - EHU 619  Lista de los 500 supercomputadores más rápidos del mundo ejecutando el banco de pruebas LINPACK.  Se mide el valor de Rmax, Nmax y N 1/2. También se empieza a medir la potencia consumida.  Sistemas de ecuaciones lineales densos (cálculo matricial). Permite obtener velocidades muy altas (un máximo virtual). Top500 (www.top500.org)

5 A rquitecturas P aralelas FI - EHU 629  Cada 6 meses desde 1993 (junio/noviembre )  Lista nº 40 - noviembre 2012  Más o menos aceptado por todos los fabricantes.  Análisis de tendencias / evolución del mercado. Top500

6 A rquitecturas P aralelas FI - EHU 639  Evolución de la velocidad de cálculo  Top5+  Fabricantes  Procesador: arquitectura / familia / número  Sistema: arquitectura / red / S.O.  Utilización Top500

7 A rquitecturas P aralelas FI - EHU 649 ×1,9/año 162,1 PF/s 14.885.800 cores (29.771 c. - 10,9 GF/s) 1 PF/s → 2008 10 PF/s → 2011 100 PF/s → 2015 Top500 Intel ASCI Red SandiA IBM ASCI White LLNL NEC Earth Sim. BlueGene RoadRunne r Jaguar K-computer Titan Sequoia Tianhe- 1A

8 A rquitecturas P aralelas FI - EHU 659 Rank Computer Cores R max R peak (Pflop/s) Power (kW) Installation site Country/year Type Top5 (diciembre 12) 1 mpp Titan, Cray XK7 Opteron 6274, 16 core 2,2 GHz Cray Gemini, NVIDIA K20x 560.640 17,6 27,1 8.209 Oak Ridge N.L. USA / 2012 - 2 mpp Sequoia, BlueGene/Q Power BQC, 16c – 1,60 GHz Custom (torus 5D) 1.572.864 (96x1024x16) 16,3 20,1 7.890 DOE/NNSA/LLNL USA/ 2012 Research 3 cluster K computer, Fujitsu SPARC67 viiifx - 2 GHz Tofu interc., 6D torus/mesh 705.027 10,5 11,3 12.660 RIKEN AICS Japonia/ 2011 Research 6 cluster SuperMUC, IDataPlex DX360M4 Xeon E5-2680 - 2,7 MHz Infiniband FDR 147.456 2,9 3,2 3.433 Leibnitz R. Alemania/ 2012 Academic Más BueGene/Q: (4): Mira, 48x, USA; (5) JUQUEEN, 24x, Juelich; (9) Fermi, 10x, Bologna 8 mpp Tianhe-1A NUDT-MPP Intel EM64T Xeon X5670 - 2,93 GHz Propietary 186.368 2,6 4,7 4.040 Tianjin NSC Txina / 2010 Research

9 A rquitecturas P aralelas FI - EHU 669 Cant.% Rmax (PF/s) Cores IBM 19338,666,26.769.140 HP 14629,218,12.300.904 Cray Inc. 316,228,21.908.880 Appro 244,85,1373.200 SGI 193,85,1434.406 Fujitsu 10213,8921.048 Total (+) 500100162,114.885.800 fabricante del sistema Top500

10 A rquitecturas P aralelas FI - EHU 679 Top500

11 A rquitecturas P aralelas FI - EHU 689 Cant.% Rmax (PF/s) Cores Escalar49999,4162 14.884.520 Vectorial10,20,121.280 Total 500100162,1 14.885.800 arquitectura del procesador Top500 217: Earth Simulator 2, NEC – 0,12 PF/s – 1.280 cores

12 A rquitecturas P aralelas FI - EHU 699 Top500

13 A rquitecturas P aralelas FI - EHU 709 Cant.% Rmax (PF/s) Cores Xeon 38176,270,76.786.414 Opteron 6112,2322.620.330 Power 5310,646,94.606.112 NEC 10,21221.280 Total (+) 500100162,114.885.800 familia de procesadores Top500

14 A rquitecturas P aralelas FI - EHU 719 Top500 Num. cores (mpp / cluster)

15 A rquitecturas P aralelas FI - EHU 729 VP500 Y-MP C90 CM5 Paragon T3D SP2 T3E ASCI Red Sun HPC CM2 Earth Sim. Blue Gene RoadRunner Jaguar Tianhe-1A K computer Top500 Sequoia Titan

16 A rquitecturas P aralelas FI - EHU 739 Cant.% Rmax (PF/s) Cores Clusters41182,283,48.060.460 MPP8917,878,76.825.340 Total 500100162,114.885.800 un año → x 2,20 x 1,6 arquitectura del sistema Top500

17 A rquitecturas P aralelas FI - EHU 749 Top500

18 A rquitecturas P aralelas FI - EHU 759 Cant.% Rmax (PF/s) Cores Infiniband 22444,852,74.284.249 Gigabit Eth. 18937,820.43.161.618 Custom 5310.659,65.228.512 Proprietary 1536,4954.256 Cray 15322,61.206.240 Myrinet 30,60,349.645 Fat tree 10,20,121.280 Total (+) 500100162,114.885.800 Red de conexión Top500

19 A rquitecturas P aralelas FI - EHU 769 Top500

20 A rquitecturas P aralelas FI - EHU 779 Top500

21 A rquitecturas P aralelas FI - EHU 789 Cant.% Rmax (PF/s) Cores Industry24749,4 28,53.933.385 Research12124,2 96,27.837.116 Academic9719,4 29,52.507.471 Government183,6 3,4299.860 Vendor132,6 3,7229.632 Classified40,8 0,978.366 Total 500100162,114.885.800 área de utilización Top500

22 A rquitecturas P aralelas FI - EHU 799 Top500

23 A rquitecturas P aralelas FI - EHU 809 Top500

24 A rquitecturas P aralelas FI - EHU 819 Top500: España/Francia (dic. - 12) 36Mare Nostrum IBM iDataPlex, Xeon E5 (8c), Infiniband FDR 33.664 cores – 637 TF/s 290BSC Bull, cluster (Infin.) – 5.544 cores – 103 TF/s >> 39.208 cores – 0,7 PF/s (0,3%) 11 Curie thin nodes, CEA Bullx B510 Xeon E5 (8c), Infniband, 77.184 c. – 1.359 TF/s 20 Tera-100, CEA Bullx super-node S6010/S6030, Infniband, 138.368 c. – 1.050 TF/s 31/32 BlueGene/Q Power BQC, 65.536 c. - 690 TF/s … Total: 21 sistemas (EDF, Airbus, CINES, Total,…) >> 620.248 c.- 6,5 PF/s (4%) >> Europa: Alemania (19 - 10,2 PF/s), G.B. (24 – 7,3 PF/s), Italia (7 - 2,4 PF/s) Total: 31,2 PF/s (20%)

25 A rquitecturas P aralelas FI - EHU 829 El cluster ARINA de la UPV/EHU  Arina, Arinaz (260 núcleos, Itanium2) Guinness (440 núcleos, Xeon) Maiz (40 núcleos, Opteron)  Sistema paralelo de ficheros (SFS) 4 servidores 4,7 TB / 7,1 TB  Infiniband, 1 GB/s

26 A rquitecturas P aralelas FI - EHU 839 El cluster ARINA de la UPV/EHU

27 A rquitecturas P aralelas FI - EHU 849  Aplicaciones En general, de química, física y biología. Software adquirido: CFX, dinámica de fluidos MOLCAS, estructura molecular ADF, estr. electrónica de las moleculas WIEN2K, estr. electrónica de sólidos Qsite, proteínas NBO5-NBOView, enlaces moleculares El cluster ARINA de la UPV/EHU

28 A rquitecturas P aralelas FI - EHU 859  Cluster del laboratorio 32 + 3×4 procesadores (Pentium IV) Gigabit Ethernet OpenMP, MPI, UPC Laboratorio de Paralelismo

29 A rquitecturas P aralelas FI - EHU 869 Titan

30 A rquitecturas P aralelas FI - EHU 879 Cray Jaguar

31 A rquitecturas P aralelas FI - EHU 889 Cray Jaguar

32 A rquitecturas P aralelas FI - EHU 899 K computer

33 A rquitecturas P aralelas FI - EHU 909 Tianhe-1A

34 A rquitecturas P aralelas FI - EHU 919 Tianhe-1A

35 A rquitecturas P aralelas FI - EHU 929 Nebulae

36 A rquitecturas P aralelas FI - EHU 939 Hopper

37 A rquitecturas P aralelas FI - EHU 949 Tera-100

38 A rquitecturas P aralelas FI - EHU 959 RoadRunner Cell

39 A rquitecturas P aralelas FI - EHU 969 RoadRunner

40 A rquitecturas P aralelas FI - EHU 979 RoadRunner

41 A rquitecturas P aralelas FI - EHU 989 RoadRunner

42 A rquitecturas P aralelas FI - EHU 999 RoadRunner

43 A rquitecturas P aralelas FI - EHU 1009 RoadRunner

44 A rquitecturas P aralelas FI - EHU 1019 RoadRunner

45 A rquitecturas P aralelas FI - EHU 1029 JuGene - BlueGene/P

46 A rquitecturas P aralelas FI - EHU 1039 JuGene - BlueGene/P

47 A rquitecturas P aralelas FI - EHU 1049 5,5 GB/s 11 GB/s 15 way fully assoc. pref. caches 5,5 GB/s 27 GB/s 22 GB/s BlueGene/L

48 A rquitecturas P aralelas FI - EHU 1059 BlueGene/L

49 A rquitecturas P aralelas FI - EHU 1069 32 x 32 x 64 1,4 Gb/s (x2) 5,6 Tb/s bisección tr (max) = 69 ns cut-through adaptativo deadlock-free active messages BlueGene/L

50 A rquitecturas P aralelas FI - EHU 1079 BlueGene/L

51 A rquitecturas P aralelas FI - EHU 1089 JuGene - BlueGene/P

52 A rquitecturas P aralelas FI - EHU 1099 JuGene - BlueGene/P

53 A rquitecturas P aralelas FI - EHU 1109 JuGene - BlueGene/P

54 A rquitecturas P aralelas FI - EHU 1119 JuGene - BlueGene/Q

55 A rquitecturas P aralelas FI - EHU 1129 Earth Simulator 2

56 A rquitecturas P aralelas FI - EHU 1139 Earth Simulator 2 Peak performance:102,4 GF/s × 8 × 160 CPU = 131 TF/s Shared memory:128 GB × 160 = 20 TB ES → ES2: proz: 1/4; mem: x2; perform: ×3,2; sarea: cross → fat tree

57 A rquitecturas P aralelas FI - EHU 1149 Earth Simulator 2 1 Chip LSI : 102,4 Gflops 65 nm CMOS 11 Layers copper interconnection 21,04 mm x 19,84 mm 350 million transistors 8.960 pins Clock Cycle: 3,2 GHz Power Consumption: 240 W (Typ.)

58 A rquitecturas P aralelas FI - EHU 1159 Earth Simulator 2

59 A rquitecturas P aralelas FI - EHU 1169 Earth Simulator 2 Internode Crossbar Switch (IXS)

60 A rquitecturas P aralelas FI - EHU 1179 Earth Simulator 2

61 A rquitecturas P aralelas FI - EHU 1189 Earth Simulator 2

62 A rquitecturas P aralelas FI - EHU 1199 Mare Nostrum (www.bsc.org.es)

63 A rquitecturas P aralelas FI - EHU 1209 Mare Nostrum

64 A rquitecturas P aralelas FI - EHU 1219 Mare Nostrum

65 A rquitecturas P aralelas FI - EHU 1229 Mare Nostrum

66 A rquitecturas P aralelas FI - EHU 1239 Mare Nostrum

67 A rquitecturas P aralelas FI - EHU 1249 Mare Nostrum


Descargar ppt "A rkitektura P araleloak IF - EHU Arquitecturas paralelas 9. Herramientas para la programación de aplicaciones paralelas: OpenMP y MPI (introducción)."

Presentaciones similares


Anuncios Google