proPar Necesidades comParalelos-30 Dibujos animados y efectos especiales 1995 1ª totalmente digital 117 SUN’s 10.000 millones Pts. 2000 www.dygrafilms.es 1ª Europea en 3D > 20 CPU’s CESGA 550 millones Pts. 2008 2002 1er superhéroe digital 100 SGI Octane2 27.000 millones Pts. 2012 † ¡ Muy costosa la renderización !
proPar Necesidades comParalelos-31 Pixar How We Do It El sueño de una noche de San Juan (2005) 45’ x fotograma [381.828] Un nodo => + 32 años 165 Pentium III y 4 6h x fotograma, algunos 90h
proPar Necesidades comParalelos-32
proPar Necesidades comParalelos-33 26/Jul/2015
proPar Necesidades, ......... Introducción-34
proPar Necesidades, …….… comParalelos-35 StarCAVE III – 2008 California Institute for Telecommunications and Information Technology … 18 nodos QuadCore para rendering
proPar Necesidades comParalelos-36 4 Quadro P6000 3.840x4 cores 26.800$
proPar Necesidades comParalelos-37 Tecnologías relacionadas
proPar Necesidades Introducción-38 18/02/2011 90x32 núcleos IBM POWER 7 www.mskcc.org/videos/mskcc-and-ibm-collaborate-applying-watson-technology-help-oncologists
proPar Necesidades Introducción-39 8/01/2015 32GB + 11TB + 900 años PC 200 x 24 cores => 2 meses ¡ Uno contra otro !
proPar Necesidades Introducción-40 20/03/2017 https://www.psc.edu/notelling 600 núcleos del Bridges PSC ¡ De los 2 millones de $ en juego se llevó 1,7 millones ! Jugando (uno por uno) contra 4 de los mejores del mundo
proPar Necesidades Introducción-41 28/01/2016 48 .. 1.920 CPU’s 8 .. 280 GPUs Intuición vs fuerza bruta
proPar Necesidades comParalelos-42
proPar Necesidades comParalelos-43
proPar Necesidades comParalelos-44 9/Oct/2013
proPar Necesidades comParalelos-45 Requisitos identificados por el HPCC Program (1992) Capacidad de Memoria Genoma Humano Turbulencia fluidos Dinámica de vehículos Circulación océanos Visión, ................ 1000 GB ¿Exaflop? 100 GB 5 Tflops y 8 Tbytes 2002 Biología estructural 10 GB Identificar vehículos 1 GB Tiempo en 72 horas Diseño farmacéutico 98Tbytes 2011 Modelos Plasma 3D 100 MB Dinámica de la Química Tiempo en 48 horas ¿1 Pflops? ¿2010? 2008 4/12/96 10 MB Velocidad del Sistema 1980 100 Mflops 1988 1 Gflops 1991 10 Gflops 1993 100 Gflops 1995.... 1 Tflops ¿2018? 6C Core i7 8700 3,7GHz 90 GFlop 2.282.544C Summit Power9+NVIDIA 3,1GHz 187.659 TFlop
proPar Necesidades comParalelos-46 nextbigfuture.com/2014/11/united-states-china-europe-and-japan.html ¿No antes de 2022? 2017 Sierra + Summit + 150..300 PFlops 325m$ ¿ 2019 | 2020 ? Europa invertirá 1.000 millones de euros en varios supeordenadores Bruselas 11/Ene/2018 2017 100 PFlops ¿ Abril 2021 ? ¿ 2020 ?
proPar Necesidades comParalelos-47 Introduction to Terascale Code Development (Sep/2004) www.psc.edu/training/TCD_Sep04/index.html
proPar Tipos de Computadores Paralelos comParalelos-48 ¡ MÁS DE 60 AÑOS TRABAJÁNDOSE EN ESTE CAMPO ! ei.cs.vt.edu/~history/Parallel.html 1955: IBM704 (FPU) Gene Amdahl 1956: IBM STRETCH (* 100 pero 1961 * 50) 1962: Burroughs D825 (1 a 4 CPU’s) 1965: Dijkstra (R.C.) Cooley & Tukey (FFT) 1966: Taxonomia de Flynn 1968: Dijkstra (Semáforos) 1969: MULTICS (con 8 CPU’s) 1976: Cray I (Más potente hasta 1985 => Cray II)
proPar Tipos de Computadores Paralelos comParalelos-49 IBM STRETCH (1961) Cray I (1976) CM5 (1993) IBM Sequoia (2012) 3 días 1 seg ¿1 hora?
proPar Clasificación de Flynn (1966/1972) comParalelos-50 Combina Flujo de Datos y Flujo de Instrucciones con (Único) Single y Múltiple, dando 4 combinaciones: MMX SSE SSE4 AVX Flujo de Datos Múltiple Único Flujo de Intrucc. SISD MISD MIMD SIMD 2 1 3 4 5 7 8 6 9 A B C + SISD Una Instrucción Un Dato Von Neumann SIMD Una Instrucción Muchos Datos Vectoriales / Sistólicos MISD Muchas Instrucciones Un Dato Pipeline? MIMD Muchas Instrucciones Muchos Datos Multiprocesadores / Multicomputadores
proPar Modelo MIMD comParalelos-51 MIMD: Muchas Instrucciones Muchos Datos M. Común (Multiprocesador) M. Privada (Multicomputador) varGlobal a: int; Thread1 Thread2 a = 5; if (a>0) a t1 t2 P1 P2 Pn Red de conexión (Bus,....) Memoria M P Red ¿ cachés ? var a: int; var aa: int; a = 5; rec(t1, &aa) send(t2, &a) if (aa>0) a t1 aa t2
proPar Multiprocesadores comParalelos-52 Problema de tener varias cachés P1 P2 Pn En general resuelto por HW A P2.R[A] P2.W[A’] ’ C1 A Pn.R[A] C2 Cn INV Sistemas de memoria común con cachés coherentes Red de conexión (Bus, …) Protocolos de coherencia: Bus Snoop Red Directorios M1 M2 Mk *
proPar Multiprocesadores comParalelos-53 8x4x8 = 256 núcleos 4 Xeon • 2,2GHz • 2MB caché 6GB Mem • 73GB Disco * 4 10.730 € 2004 Bus Pocos procesadores 24 POWER7 8cores y 6TB + 2.463TB 14.276.808 $ con descuento en Ago2010 Red ¿ Intel Core i3, i5, i7 y … ?
proPar Procesadores Multinúcleo (Intel) comParalelos-54 Intel Core 2 Quad Q6600 (4 núcleos a 2,4 GHz) => Sep/2007 1.000€ Smart Cache 4MB 2007..2009 2,33 .. 3 GHz 4, 6, 8 y 12MB L2 Sin HT
proPar Procesadores Multinúcleo (Intel) comParalelos-55 Intel Core i7 920 (4 núcleos a 2,66 GHz) => Mayo/2009 962€ 2008.. 1,06 .. 3,33 GHz 4, 6, 8 y 12MB L3 2, 4 y 6 núcleos con HT High End 2014.. 3,5 .. 3,8 GHz 15, 20 y 25MB L3 6, 8 y 10 núcleos con HT
proPar Procesadores Multinúcleo (Intel) comParalelos-56 Intel Xeon E7 Family 32KB L1I + 32KB L1D 256KB * 8 24MB L3 2016.. 2 .. 3,2 GHz 20 .. 60MB L3 4 .. 24 núcleos con HT 2011.. 1,73 .. 2,66 GHz 18, 24 y 30MB L3 6, 8 y 10 núcleos con HT Junio 2011: 2 Xeon E5520 8N/16T 1.925€ Micro 373$ Xeon E7-88xx => 2.280..4.616$