A rkitektura P araleloak IF - EHU Arquitecturas paralelas 9. Herramientas para la programación de aplicaciones paralelas: OpenMP y MPI (introducción).

Slides:



Advertisements
Presentaciones similares
Computadores de alta velocidad (la lista top500).
Advertisements

Arquitecturas de Hardware en Sistemas Distribuidos.
TIPOS DE PROCESADORES DE ULTIMA GENERACIÓN.
TIPOS DE PROCESADORES DE ULTIMA GENERACION
EMISION MULTIPLE DE INSTRUCCIONES
Sistemas Distribuidos y Paralelos
Problema Procesador-Memoria
Microprocesadores en Consolas
Departamento de Computación, FACYT, Universidad de Carabobo
PAULA ANDREA CHAVEZ C. GRADO: PROFESOR: JOSE WILSON QUINTERO
Ing. CIP Francisco Mori Quiroz
Arquitecturas Paralelas
Diseño y Mantenimiento de un cluster para la dinámica de fluidos
P rogramación de S istemas P aralelos IF - EHU PROGRAMACIÓN DE SISTEMAS PARALELOS 2010 Agustin Arruabarrena – Javier Muguerza.
Curso de Computación Científica en Clusters
Procesamiento paralelo
Informática- R.L.G.1 Computadora: Herramienta electromecánica que facilita diversas y muy variadas tareas dependiendo del programa que se utilice. Se caracteriza.
INTEGRANTES EFREN PADILLA LICETH BUITRAGO LINA STELLA AGUIRRE
CONCEPTES AVANÇATS DE SISTEMES OPERATIUS Departament d’Arquitectura de Computadors (apunts de l’assignatura en format transparència) Beowulf Vs Clusters.
Contenido Marco de referencia Arquitectura de computadoras paralelas
Clusters Presentado por : Manuel Alejandro ahumada trochez Yenny carabali.
REDES DE ALTAS PRESTACIONES Y SUS APLICACIONES
Tipos de Procesadores AMD y INTEL
Instalación de Computadoras 1 I
14 de diciembre de 2005 Universidad de Murcia1 Modelos de computadores paralelos Domingo Giménez Departamento de Informática y Sistemas Universidad de.
Arquitecturas Paralelas
Instalación de Sistemas Microprocesados
CLASIFICACIÓN DE LAS COMPUTADORAS
PROGRAMACIÓN PARALELA Modelos de programación paralela Modelos computacionales Paradigmas de programación paralela Programación en memoria compartida:
© FCSCCYL. Dirección Científica (2008) PRESENTACIÓN DEL CENTRO DE SUPERCOMPUTACIÓN DE CASTILLA Y LEÓN Parque Tecnológico de León 11 de Noviembre de 2008.
PCs PROCESADORES.
Algo de Sistemas Operativos, Arquitecturas y Paralelismo
Arquitecturas ParalelasIBM Power E880Curso 14/15 CEC 24 POWER7 8cores y 6TB TB
Supercomputadoras Division fundamental entre estilos de supercomputadoras: 1100 D-Core PowerPC 4G p/node 5120 procs (5% del uso es pago) 16 Pentium 3 (o.
Computadoras Multiprocesador
ProParPresentaciónCurso 14/15 Departamento: Informática Aplicada => Sistemas Informáticos (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417
Michael Carter Joshua Carvacho Magdalena Von Borries 1.
Procesador xeon Xeon es una familia de microprocesadores Intel para servidores PC y Macintosh. El primer procesador Xeon apareció en 1998 con el nombre.
Contribuir al avance de la ciencia en España: Dotando de alta capacidad de cálculo a la comunidad científica, pública y privada. Mediante programas propios.
Sistemas Operativos Avanzados
ArqParPresentaciónCurso 14/15 Departamento:Sistemas Informáticos (A.T.C.) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417
Misión crítica Prevención de fallas en la infraestructura tecnológica Niveles de seguridad de las operaciones y transacciones de datos Ofrecer continuidad.
El Microprocesador.
Historia de las computadora INFORMATICA. apareció en un artículo del New York Times el 3 de noviembre de Seis años más tarde un fabricante tomó.
HISTORIA DE LAS COMPUTADOR AS INFORMATICA.  Originalmente el término "computadora personal" apareció en un artículo del New York Times el 3 de noviembre.
Saltar a la primera página Esquemas de procesamiento Definen la forma en que se efectúan los procesos dentro de los equipos de cómputo n Esquema centralizado.
Cluster de Computadores de Alto Desempeño con Acceso Remoto
En el ámbito de los servidores reinan los procesadores, las memorias y los discos duros. En líneas generales, el hardware interno de los servidores de.
Tema: Historia de los Microprocesadores
Tipos de procesadores de ultima generación
ARQUICTECTURA DE SERVIDORES
Belén Fernández Araya Educación Parvularia
Microprocesadores actuales
Son los atributos de un sistema que son visibles para un programador, es decir aquellos atributos que impactan directamente en la ejecución lógica de un.
PROCESADORES.
Características de Phenom Permite el flujo de información rápido y directo entre los núcleos del procesador, la memoria principal y los aceleradores de.
Durante las tres décadas que AMD lleva en el negocio, el silicio y el software se han convertido en el acero y el plástico de la economía digital del.
PROCESAMIENTO PARALELO SUPERCOMPUTADORAS, MULTIPROCESAMIENTO, BENCHMARKS CRUZ VAZQUEZ MA.ROSAURA CRUZ VAZQUEZ MA.ROSAURA GUERRERO REBOLLO ARTURO GUERRERO.
Tipos de procesadores de ultima generación
1 MICROPROCESADORES II Capítulo 1 - Sesión 2 OBJETIVOS 1- Evolución de los procesadores INTEL. 2- Ancho de BUS, Registro internos. 4- Modo de operación.
Historia de las computadoras INFORMATICA. Originalmente el término "computadora personal" apareció en un artículo del New York Times el 3 de noviembre.
Computadoras de Alto Rendimiento (HPC)
Arquitecturas AvanzadasASCI QCurso 10/11 Completo => Alpha EV-68 a 1,25GHz => 30TFlops Contrato 22/8/2000 => 200 m$ => 175 m€ => mPts.
“Servicios de Supercomputación en la Universidad de Granada” Antonio Ruiz Moya Centro de Servicios de Informática y Redes de Comunicaciones de UGR.
Actualización del Superordenador Virtual Gallego Valencia, 12 Abril Carlos Fernández Sánchez Responsable Técnico de Sistemas
Diferencias entre las arquitecturas de 64 bits de AMD e intel.
ARQUITECTURAS PARALELAS LOS SISTEMAS PARALELOS
¿Cómo son nuestros clusters?
proPar Necesidades comParalelos-30
Programa de Prácticas Entorno Las prácticas Planificación
Transcripción de la presentación:

A rkitektura P araleloak IF - EHU Arquitecturas paralelas 9. Herramientas para la programación de aplicaciones paralelas: OpenMP y MPI (introducción). Computadores de alta velocidad (la lista top500).

A rquitecturas P aralelas FI - EHU 599 Array Vectorial MP P C bus memoria compartida SMP MPP/NUMA Clusters memoria distribuida P C M red general 1 1 N N SIMD MIMD SISD fl. instrucciones flujo datos Arquitectura de los sistemas paralelos

A rquitecturas P aralelas FI - EHU 609  Un procesador (vectorial)  Sistemas SMP / sistemas SIMD  Sistemas masivamente paralelos MPP Las mejores prestaciones (velocidad de cálculo): comunicación de baja latencia y elevado ancho de banda, en algunos casos procesadores con diseño específico, software de control muy optimizado, etc. Pero coste muy elevado.  Clusters Evolución de las arquitecturas

A rquitecturas P aralelas FI - EHU 619  Lista de los 500 supercomputadores más rápidos del mundo ejecutando el banco de pruebas LINPACK.  Se mide el valor de Rmax, Nmax y N 1/2. También se empieza a medir la potencia consumida.  Sistemas de ecuaciones lineales densos (cálculo matricial). Permite obtener velocidades muy altas (un máximo virtual). Top500 (

A rquitecturas P aralelas FI - EHU 629  Cada 6 meses desde 1993 (junio/noviembre )  Lista nº 40 - noviembre 2012  Más o menos aceptado por todos los fabricantes.  Análisis de tendencias / evolución del mercado. Top500

A rquitecturas P aralelas FI - EHU 639  Evolución de la velocidad de cálculo  Top5+  Fabricantes  Procesador: arquitectura / familia / número  Sistema: arquitectura / red / S.O.  Utilización Top500

A rquitecturas P aralelas FI - EHU 649 ×1,9/año 162,1 PF/s cores ( c. - 10,9 GF/s) 1 PF/s → PF/s → PF/s → 2015 Top500 Intel ASCI Red SandiA IBM ASCI White LLNL NEC Earth Sim. BlueGene RoadRunne r Jaguar K-computer Titan Sequoia Tianhe- 1A

A rquitecturas P aralelas FI - EHU 659 Rank Computer Cores R max R peak (Pflop/s) Power (kW) Installation site Country/year Type Top5 (diciembre 12) 1 mpp Titan, Cray XK7 Opteron 6274, 16 core 2,2 GHz Cray Gemini, NVIDIA K20x ,6 27, Oak Ridge N.L. USA / mpp Sequoia, BlueGene/Q Power BQC, 16c – 1,60 GHz Custom (torus 5D) (96x1024x16) 16,3 20, DOE/NNSA/LLNL USA/ 2012 Research 3 cluster K computer, Fujitsu SPARC67 viiifx - 2 GHz Tofu interc., 6D torus/mesh ,5 11, RIKEN AICS Japonia/ 2011 Research 6 cluster SuperMUC, IDataPlex DX360M4 Xeon E ,7 MHz Infiniband FDR ,9 3, Leibnitz R. Alemania/ 2012 Academic Más BueGene/Q: (4): Mira, 48x, USA; (5) JUQUEEN, 24x, Juelich; (9) Fermi, 10x, Bologna 8 mpp Tianhe-1A NUDT-MPP Intel EM64T Xeon X ,93 GHz Propietary ,6 4, Tianjin NSC Txina / 2010 Research

A rquitecturas P aralelas FI - EHU 669 Cant.% Rmax (PF/s) Cores IBM 19338,666, HP 14629,218, Cray Inc. 316,228, Appro 244,85, SGI 193,85, Fujitsu 10213, Total (+) , fabricante del sistema Top500

A rquitecturas P aralelas FI - EHU 679 Top500

A rquitecturas P aralelas FI - EHU 689 Cant.% Rmax (PF/s) Cores Escalar49999, Vectorial10,20, Total , arquitectura del procesador Top : Earth Simulator 2, NEC – 0,12 PF/s – cores

A rquitecturas P aralelas FI - EHU 699 Top500

A rquitecturas P aralelas FI - EHU 709 Cant.% Rmax (PF/s) Cores Xeon 38176,270, Opteron 6112, Power 5310,646, NEC 10, Total (+) , familia de procesadores Top500

A rquitecturas P aralelas FI - EHU 719 Top500 Num. cores (mpp / cluster)

A rquitecturas P aralelas FI - EHU 729 VP500 Y-MP C90 CM5 Paragon T3D SP2 T3E ASCI Red Sun HPC CM2 Earth Sim. Blue Gene RoadRunner Jaguar Tianhe-1A K computer Top500 Sequoia Titan

A rquitecturas P aralelas FI - EHU 739 Cant.% Rmax (PF/s) Cores Clusters41182,283, MPP8917,878, Total , un año → x 2,20 x 1,6 arquitectura del sistema Top500

A rquitecturas P aralelas FI - EHU 749 Top500

A rquitecturas P aralelas FI - EHU 759 Cant.% Rmax (PF/s) Cores Infiniband 22444,852, Gigabit Eth , Custom , Proprietary 1536, Cray 15322, Myrinet 30,60, Fat tree 10,20, Total (+) , Red de conexión Top500

A rquitecturas P aralelas FI - EHU 769 Top500

A rquitecturas P aralelas FI - EHU 779 Top500

A rquitecturas P aralelas FI - EHU 789 Cant.% Rmax (PF/s) Cores Industry24749,4 28, Research12124,2 96, Academic9719,4 29, Government183,6 3, Vendor132,6 3, Classified40,8 0, Total , área de utilización Top500

A rquitecturas P aralelas FI - EHU 799 Top500

A rquitecturas P aralelas FI - EHU 809 Top500

A rquitecturas P aralelas FI - EHU 819 Top500: España/Francia (dic. - 12) 36Mare Nostrum IBM iDataPlex, Xeon E5 (8c), Infiniband FDR cores – 637 TF/s 290BSC Bull, cluster (Infin.) – cores – 103 TF/s >> cores – 0,7 PF/s (0,3%) 11 Curie thin nodes, CEA Bullx B510 Xeon E5 (8c), Infniband, c. – TF/s 20 Tera-100, CEA Bullx super-node S6010/S6030, Infniband, c. – TF/s 31/32 BlueGene/Q Power BQC, c TF/s … Total: 21 sistemas (EDF, Airbus, CINES, Total,…) >> c.- 6,5 PF/s (4%) >> Europa: Alemania ( ,2 PF/s), G.B. (24 – 7,3 PF/s), Italia (7 - 2,4 PF/s) Total: 31,2 PF/s (20%)

A rquitecturas P aralelas FI - EHU 829 El cluster ARINA de la UPV/EHU  Arina, Arinaz (260 núcleos, Itanium2) Guinness (440 núcleos, Xeon) Maiz (40 núcleos, Opteron)  Sistema paralelo de ficheros (SFS) 4 servidores 4,7 TB / 7,1 TB  Infiniband, 1 GB/s

A rquitecturas P aralelas FI - EHU 839 El cluster ARINA de la UPV/EHU

A rquitecturas P aralelas FI - EHU 849  Aplicaciones En general, de química, física y biología. Software adquirido: CFX, dinámica de fluidos MOLCAS, estructura molecular ADF, estr. electrónica de las moleculas WIEN2K, estr. electrónica de sólidos Qsite, proteínas NBO5-NBOView, enlaces moleculares El cluster ARINA de la UPV/EHU

A rquitecturas P aralelas FI - EHU 859  Cluster del laboratorio ×4 procesadores (Pentium IV) Gigabit Ethernet OpenMP, MPI, UPC Laboratorio de Paralelismo

A rquitecturas P aralelas FI - EHU 869 Titan

A rquitecturas P aralelas FI - EHU 879 Cray Jaguar

A rquitecturas P aralelas FI - EHU 889 Cray Jaguar

A rquitecturas P aralelas FI - EHU 899 K computer

A rquitecturas P aralelas FI - EHU 909 Tianhe-1A

A rquitecturas P aralelas FI - EHU 919 Tianhe-1A

A rquitecturas P aralelas FI - EHU 929 Nebulae

A rquitecturas P aralelas FI - EHU 939 Hopper

A rquitecturas P aralelas FI - EHU 949 Tera-100

A rquitecturas P aralelas FI - EHU 959 RoadRunner Cell

A rquitecturas P aralelas FI - EHU 969 RoadRunner

A rquitecturas P aralelas FI - EHU 979 RoadRunner

A rquitecturas P aralelas FI - EHU 989 RoadRunner

A rquitecturas P aralelas FI - EHU 999 RoadRunner

A rquitecturas P aralelas FI - EHU 1009 RoadRunner

A rquitecturas P aralelas FI - EHU 1019 RoadRunner

A rquitecturas P aralelas FI - EHU 1029 JuGene - BlueGene/P

A rquitecturas P aralelas FI - EHU 1039 JuGene - BlueGene/P

A rquitecturas P aralelas FI - EHU ,5 GB/s 11 GB/s 15 way fully assoc. pref. caches 5,5 GB/s 27 GB/s 22 GB/s BlueGene/L

A rquitecturas P aralelas FI - EHU 1059 BlueGene/L

A rquitecturas P aralelas FI - EHU x 32 x 64 1,4 Gb/s (x2) 5,6 Tb/s bisección tr (max) = 69 ns cut-through adaptativo deadlock-free active messages BlueGene/L

A rquitecturas P aralelas FI - EHU 1079 BlueGene/L

A rquitecturas P aralelas FI - EHU 1089 JuGene - BlueGene/P

A rquitecturas P aralelas FI - EHU 1099 JuGene - BlueGene/P

A rquitecturas P aralelas FI - EHU 1109 JuGene - BlueGene/P

A rquitecturas P aralelas FI - EHU 1119 JuGene - BlueGene/Q

A rquitecturas P aralelas FI - EHU 1129 Earth Simulator 2

A rquitecturas P aralelas FI - EHU 1139 Earth Simulator 2 Peak performance:102,4 GF/s × 8 × 160 CPU = 131 TF/s Shared memory:128 GB × 160 = 20 TB ES → ES2: proz: 1/4; mem: x2; perform: ×3,2; sarea: cross → fat tree

A rquitecturas P aralelas FI - EHU 1149 Earth Simulator 2 1 Chip LSI : 102,4 Gflops 65 nm CMOS 11 Layers copper interconnection 21,04 mm x 19,84 mm 350 million transistors pins Clock Cycle: 3,2 GHz Power Consumption: 240 W (Typ.)

A rquitecturas P aralelas FI - EHU 1159 Earth Simulator 2

A rquitecturas P aralelas FI - EHU 1169 Earth Simulator 2 Internode Crossbar Switch (IXS)

A rquitecturas P aralelas FI - EHU 1179 Earth Simulator 2

A rquitecturas P aralelas FI - EHU 1189 Earth Simulator 2

A rquitecturas P aralelas FI - EHU 1199 Mare Nostrum (

A rquitecturas P aralelas FI - EHU 1209 Mare Nostrum

A rquitecturas P aralelas FI - EHU 1219 Mare Nostrum

A rquitecturas P aralelas FI - EHU 1229 Mare Nostrum

A rquitecturas P aralelas FI - EHU 1239 Mare Nostrum

A rquitecturas P aralelas FI - EHU 1249 Mare Nostrum