arqAvaPar Presentación Curso 17/18 Departamento: Sistemas Informáticos (ATC) (Bloque IV - Planta 4ª) Profesores: Pablo Carazo D4417 email: pcarazo@etsisi.upm.es José L. Esteban D4414 email: joseluis@etsisi.upm.es TABLÓN DE ANUNCIOS: www.etsisi.upm.es/escuela/dptos/si Normas del Curso Tutorías Notas Exámenes PRÁCTICAS: Laboratorios 4401 y 4405 Lunes 16’00 a 19’00 Miércoles 10’00 a 13’00
arqAvaPar Presentación 2 Tablón Mi despacho Secretaria M y X (15’30 a 17’30)
“Aumento de prestaciones” arqAvaPar Presentación 3 “Aumento de prestaciones” Un año 6 meses Alta productividad Alto rendimiento 3 en un año Misma tarea en menos tiempo + gente + ahínco mejor + CPU’s + GHz algoritmo Más tareas en el mismo tiempo
arqAvaPar Presentación 4 Ordenación con distintos algoritmos [Core 2 Quad Q6600] 42.000 3:400 84.000 13:530 168.000 54:064 Burbuja 2:210 8:823 35:254 ranksort 0:745 2:972 11:844 SelecDir 0:368 1:477 5:865 InserDir 0:004 0:013 0:025 quickSort Cardinalidad quickSort 262.144 1.048.576 8.388.608 33.554.432 0:031 0:129 1:170 5:048 Radix 32_4 0:015 0:058 0:466 1:685
“Aumento de prestaciones” arqAvaPar Presentación 5 “Aumento de prestaciones” Un año 6 meses Alta productividad Alto rendimiento 3 en un año Misma tarea en menos tiempo + gente + ahínco mejor + CPU’s + GHz algoritmo Más tareas en el mismo tiempo
arqAvaPar Presentación 6 Evolución de la frecuencia del reloj de los microprocesadores 4GHz 2017 3GHz
“Aumento de prestaciones” arqAvaPar Presentación 7 “Aumento de prestaciones” Un año 6 meses Alta productividad Alto rendimiento 3 en un año Misma tarea en menos tiempo + gente + ahínco mejor + CPU’s + GHz algoritmo Más tareas en el mismo tiempo
Poner a trabajar juntos a varios procesadores (2 ... 10.000 ...) arqAvaPar Objetivo 8 Poner a trabajar juntos a varios procesadores (2 ... 10.000 ...) ¿Buses? Intel AMD Oracle 18 núcleos 16 núcleos 32 núcleos Decenas de núcleos Miles de núcleos 28 72 32 RED
OBJETIVOS: “Aumento de prestaciones” arqAvaPar Presentación 9 OBJETIVOS: “Aumento de prestaciones” ALTERNATIVAS AL MODELO DE VON NEWMANN Poner a trabajar juntos a varios procesadores (2..10000) 18 núcleos 16 núcleos 32 núcleos PARALELISMO INTERNO Arquitecturas superescalares PARALELISMO DE DATOS Sistólicos Vectoriales GPU’s y CUDA Multi Threading IMPLEMENTACIONES CONCRETAS (Prácticas)
Programa de Teoría Horas arqAvaPar Presentación 10 Programa de Teoría Horas INTRODUCCIÓN 4 CONECTIVIDAD 7 COPROCESAMIENTO 3 MÁQUINAS MIMD 8 MÁQUINAS SIMD 5 PARALELISMO INTERNO 2 Pruebas parciales 3 Bibliografía Transparencias => WWW “Interconnection networks. …” José Duato y …, 2003 “Parallel Computer Architecture. A Hw/Sw approach”. David E. Culler y Jaswinder Pal Singh, 1999 “Computer Architecture. ...” Hennessy y Patterson, 2012
Abril y Mayo => Parallella y CUDA arqAvaPar Presentación 11 Programa de Prácticas Entorno 2 clusters de 19 + 12 PC’s -4 núcleos- [76+48 núcleos] 12 Placas Parallella de 2 + 16 núcleos 12 TEGRA TK1: 4 + 192 núcleos “C” + MPI “Message Passing Interface” + CUDA Planificación 5 6 7 8 9 Febrero 12 13 14 15 16 Formar ¿grupos? de prácticas 19 20 21 22 23 26 27 28 1 2 26 Feb ... Hacer una práctica ... 23 Marzo P0: Toma de contacto con MPI Paralelizar Ordenación, Primos, Viajante, Cifrado, Palabras, Crypt, … Abril y Mayo => Parallella y CUDA
Arquitecturas Avanzadas arqAvaPar Presentación Planificación 12 Viernes Martes Viernes Martes Febrero Teoría Prácticas Abril Teoría Prácticas M 6 Presentación M 3 2. Parallella V 9 Introducción V 6 MIMD M 13 IntroyConex M 10 2. Parallella V 16 Conexión V 13 MIMD M 20 1. MPI P0 M 17 2. Parallella V 23 Conexión V 209 MIMD M 27 1. MPI P0 M 24 3. CUDA Marzo V 27 P2 y SIMD Mayo V 2 Conexión M 6 1. MPI P1 V 4 SIMD V 9 P1 y Copro M 8 3. CUDA M 13 1. MPI P1 V 11 SIMD V 16 Coprocesa M 15 M 20 1. MPI P1 V 18 ParaInter V 23 MIMD M 22 3. CUDA V 25 P3 Semana Santa M 29 Arquitecturas Avanzadas
Arquitecturas Avanzadas arqAvaPar Presentación Planificación 13 Viernes Jueves Viernes Jueves Febrero Teoría Prácticas Abril Teoría Prácticas J 8 Presentación J 5 2. Parallella V 9 Introducción V 6 MIMD J 15 IntroyConex J 12 2. Parallella V 16 Conexión V 13 MIMD J 22 1. MPI P0 J 19 2. Parallella V 23 Conexión V 209 MIMD Marzo J 26 3. CUDA V 27 P2 y SIMD J 1 1. MPI P0 Mayo V 2 Conexión J 8 1. MPI P1 V 4 SIMD V 9 P1 y Copro J 10 3. CUDA J 15 1. MPI P1 V 11 SIMD V 16 Coprocesa J 17 3. CUDA J 22 1. MPI P1 V 18 ParaInter V 23 MIMD J 24 Artículos V 25 P3 Semana Santa J 30 Artículos Arquitecturas Avanzadas
arqAvaPar Presentación 14 25+5+5 = 215 => 32.768 colores => 43 segundos Con 16 cores => 3 segundos
arqAvaPar Presentación 15 28+8+8 = 224 => 16,8 mill colores => 6 horas Con 20 cores => 18 minutos
arqAvaPar Presentación 16 12 ciudades => 12,5 segundos 13 ciudades => 169,4 segundos 16 cores 12,9 seg