¿Cómo son nuestros clusters? arqAvaPar Presentación 17 Un modelo de Práctica: Ordenación paralela maestro esclavo1 esclavo2 esclavoN Ordenación Muy habitual un proceso x núcleo ¿Cómo son nuestros clusters?
arqAvaPar Presentación 18 2 5 4 6 7 9 10 8 12 13 lab4401 lab4405 PC9 PC1 PC2 PC3 PC4 PC8 PC7 PC6 PC5 RED ETSISI servidor 14 PC12 PC11 PC10
Lab 4405 arqAvaPar Presentación 19 Pentium Core 2 Quad Q6600 2,4GHz • 8ML2 • 4GB • 500GB Lab 4405 Red E.U.I. Switch GigaEthernet pc1 pc2 pc3 pc5 pc4 pc6 pc7 pc8 Core i7
arqAvaPar Presentación 20 Pentium Core 2 Quad Q8200 2,4GHz • 4ML2 • 2GB • 74,5GB PC10..PC12
arqAvaPar Presentación 21 2 Xeon E5520 Quad 2,26GHz • 8ML3 • 12GB • 500GB
Lab 4405 arqAvaPar Presentación 22 Intel Core i5-4460 4 cores 3,2GHz • 6ML3 • 8GB • 122GB lab4401-1 .. lab4401-19 y Red Pública lab4401-2 como pc2
arqAvaPar Presentación 23 Parallella Epiphany-16 Desktop Computer 16 núcleos 600MHz => 19,2 GFlops Zynq dual core ARM-A9 1GB SDRAM µSD µHDMI µUSB Gigabit Ethernet
arqAvaPar Presentación 24
arqAvaPar Presentación 25
arqAvaPar Presentación 26
comunicaciones en nseg? arqAvaPar Presentación 27 Cálculo de números primos: [3 .. 5.449]720 [5.471 .. 29.713.267]1.840.417 ? 1 núcleo en Parallella => 220,5 segundos 16 núcleos en Parallella => 13,7 segundos 1 núcleo en PC1 => 16,7 segundos ¿Latencia de comunicaciones en nseg? 93 99 100 103 115 121 72 78
arqAvaPar Presentación 28 3 * NVIDIA GEFORCE GTX 660 2GB GDDR5 960 núcleos 1,03 GHz 1 * NVIDIA GEFORCE GTX 750 2GB GDDR5 512 núcleos 1,14 GHz
arqAvaPar Presentación 29 12 * NVIDIA Jetson TK1 2GB DDR3L 192 núcleos 852 MHz ARM A14 4 cores 2,32 GHz 16GB eMMC
arqAvaPar Presentación 30 34,245 seg 8,840 seg MPI 4 núcleos 1,329 seg 1,809 seg MPI 32 núcleos
Conocimientos que vienen bien: arqAvaPar Presentación 31 Conocimientos que vienen bien: Arquitectura de Computadores: Caches, pipeline, … Redes de Computadores: Redes locales, … Taller de SO: Entorno de prácticas Linux Fundamentos | Taller de Programación: Programar en C Programación Concurrente y Avanzada
Arquitecturas Avanzadas arqAvaPar Presentación 32 Evaluación no continua [Decirlo antes del 1 de Marzo] Teoría 5 puntos Prácticas 5 puntos T + P >= 5 ¡Mínimo 4! Evaluación continua Teoría 4,5 puntos (Test + preguntas cortas) Prácticas 5 puntos: 2 + 1,5 + 1,5 [MPI+Para+CUDA] Compe. 0,5 puntos: Planificación [de las prácticas] Mínimos: En cada prueba | práctica => 3,5 sobre 10 En la suma total de teoría => 4 sobre 10 Arquitecturas Avanzadas
Arquitecturas Paralelas arqAvaPar Presentación 33 Evaluación no continua [Decirlo antes del 1 de Marzo] Teoría 6 puntos Prácticas 4 puntos T + P >= 5 ¡Mínimos 3,5! Evaluación continua Teoría 4 puntos (tests [3*1,33]) Trabajo 2 puntos (Exposición o Escrito) Prácticas 4 puntos (Funcionando en 1 .. 16 núcleos) “Descripción y uso del supercomputador #1 TOP500 Nov 2017” "Why On-Chip Cache Coherence is Here to Stay“, 2012 “Efficient Hardware Barrier Synchronization in Many-Core CMPs”, 2012 “GPU Acceleration of Real Time Viola-Jones Face Detection”, 2015 Competencia Análisis y Síntesis Arquitecturas Paralelas