La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

GPGPUs General Purpose GPUs. GPGPUs - AMD Fusion - Nvidia CUDA - Intel Nehalem - AMD Fusion - Nvidia CUDA - Intel Nehalem.

Presentaciones similares


Presentación del tema: "GPGPUs General Purpose GPUs. GPGPUs - AMD Fusion - Nvidia CUDA - Intel Nehalem - AMD Fusion - Nvidia CUDA - Intel Nehalem."— Transcripción de la presentación:

1 GPGPUs General Purpose GPUs

2 GPGPUs - AMD Fusion - Nvidia CUDA - Intel Nehalem - AMD Fusion - Nvidia CUDA - Intel Nehalem

3 AMD Fusion AMD Fusion es el nombre clave de la futura nueva generaci ó n de dise ñ o de microprocesadores producto de la uni ó n de AMD y ATI, combinando la ejecuci ó n general de procesos y el procesamiento de geometr í as 3D y otras funcionalidades de las GPUs modernas en un solo paquete. La uni ó n de AMD con ATI se cerr ó a final de octubre del 2006. Esta tecnolog í a se espera que debute en la segunda mitad del 2011 como sucesora de las ú ltimas microarquitecturas.

4 AMD Fusion Informaci ó n preliminar. Una arquitectura de procesador multicore heterog é nea, combinada con un n ú cleo/s con procesador multiprop ó sito y otro n ú cleo con procesador gr á fico b á sico, todo integrado en un procesador ú nico con se ñ ales de reloj para el n ú cleo gr á fico y el n ú cleo central de proceso. Hay 4 plataformas de enfoque seg ú n los 4 aspectos de uso: * Prop ó sito General * Centrado en Datos * Centrado en Gr á ficos * Centrado en Multimedia. Informaci ó n preliminar. Una arquitectura de procesador multicore heterog é nea, combinada con un n ú cleo/s con procesador multiprop ó sito y otro n ú cleo con procesador gr á fico b á sico, todo integrado en un procesador ú nico con se ñ ales de reloj para el n ú cleo gr á fico y el n ú cleo central de proceso. Hay 4 plataformas de enfoque seg ú n los 4 aspectos de uso: * Prop ó sito General * Centrado en Datos * Centrado en Gr á ficos * Centrado en Multimedia.

5 AMD Fusion Las series de procesadores Fusion mostrar á n un nueva metodolog í a modular llamada ‘ M-SPACE ’, con el cual los dise ñ os de procesadores multicore tendr á n un rango m á s amplio de combinaciones as í como una flexibilidad mejorada, y as í minimizar las diferentes combinaciones de componentes. Esta iniciativa de AMD beneficia los cambios de n ú cleo gr á fico sin necesidad de redise ñ ar todo el n ú cleo.

6 AMD Fusion Los productos Fusion incluir á n por lo menos 16 puertos PCI Express, presumiblemente la versi ó n 2.0. La implementaci ó n del UVD en silicio para la decodificaci ó n totalmente por hardware del MPEG-2, VC-1 y H.264 streams de video en el software soportado. Los productos Fusion incluir á n por lo menos 16 puertos PCI Express, presumiblemente la versi ó n 2.0. La implementaci ó n del UVD en silicio para la decodificaci ó n totalmente por hardware del MPEG-2, VC-1 y H.264 streams de video en el software soportado.

7 AMD Fusion El primer dise ñ o de Z-RAM en tecnolog í a de fabricaci ó n de 45nm se complet ó en 2006 junto con la renovaci ó n de la licencia de Z-RAM. Tambi é n coincide con el ‘ roadmap ’ oficial de AMD para caches L3 m á s grandes antes del 2009. As í que se rumorea que AMD destacar á la Z-RAM para caches m á s grandes en los productos Fusion.

8 AMD Fusion Un nuevo set de instrucciones y librerias de desarrollo se han desarrollado para Fusion, se revel ó que ser í a una nueva secuela de las SSE, la SSE5. Habr á 2 implementaciones: Un nuevo set de instrucciones y librerias de desarrollo se han desarrollado para Fusion, se revel ó que ser í a una nueva secuela de las SSE, la SSE5. Habr á 2 implementaciones:

9 AMD Fusion -Falcon: Originalmente su nombre era Procesador con N ú cleos ‘ Bulldozer ’ enfocados al mercado de sobremesa con un TDP de entre 10 y 100 W. de TDP (Thermal Design Power). Una opci ó n de implemetarlo en telefonos m ó viles, UMPC (Ultra-Mobile PC) y peque ñ os dispositivos multimedia, con el nombre de Procesador con N ú cleos ‘ Bobcat ’ enfocados para bajo consumo de entre 1 y 10 W. de TDP (Thermal Design Power).

10 AMD Fusion -Swift: basado en el llamado N ú cleo ‘ Stars CPU ’ (Arquitectura K10) hecha con proceso de 45nm. En vez del n ú cleo ‘ Bulldozer ’ y ‘ Bobcat ’. Enfocado al mercado de portatiles, con un n ú cleo GPU en el mismo dado que la CPU nativa y 2 variantes posibles: -White Swift: N ú cleo de CPU ú nico. -Black Swift: N ú cleo de CPU dual. Soporte para DDR3 Tecnolog í a UVD para decodificaci ó n de video por hardware. Nuevas interconexiones ‘ Onion ’. Nuevo interfaz de memoria ‘ Garlic ’ para lecturas de la memoria de la GPU con retardo reducido. -Swift: basado en el llamado N ú cleo ‘ Stars CPU ’ (Arquitectura K10) hecha con proceso de 45nm. En vez del n ú cleo ‘ Bulldozer ’ y ‘ Bobcat ’. Enfocado al mercado de portatiles, con un n ú cleo GPU en el mismo dado que la CPU nativa y 2 variantes posibles: -White Swift: N ú cleo de CPU ú nico. -Black Swift: N ú cleo de CPU dual. Soporte para DDR3 Tecnolog í a UVD para decodificaci ó n de video por hardware. Nuevas interconexiones ‘ Onion ’. Nuevo interfaz de memoria ‘ Garlic ’ para lecturas de la memoria de la GPU con retardo reducido.

11 AMD Fusion

12 Nvidia CUDA

13 La tecnolog í a CUDA es el ú nico entorno, [Herramientas de desarrollo y compilador] basado en el lenguaje C que permite a los programadores escribir software para resolver problemas computacionales complejos en menos tiempo aprovechando la gran capacidad de procesamiento paralelo de las GPUs multin ú cleo. Miles de programadores est á n utilizando ya las herramientas gratuitas de desarrollo de CUDA v á lidas para millones de GPUs ya instaladas en el mercado, a fin de acelerar todo tipo de aplicaciones, desde herramientas de codificaci ó n de audio y v í deo, hasta software para la exploraci ó n de gas y petr ó leo, el dise ñ o de productos, la generaci ó n de im á genes en medicina o la investigaci ó n cient í fica.

14 Nvidia CUDA Caracter í sticas de la tecnolog í a. -Lenguaje C est á ndar para el desarrollo de aplicaciones de procesamiento en la GPU. -Librer í as num é ricas est á ndar para FFT (Fast Fourier Transform) y BLAS (Basic Linear Algebra Subroutines). -Controlador CUDA dedicado al c á lculo con comunicaci ó n de datos de alta velocidad entre la GPU y la CPU. -El controlador de CUDA interacciona con los controladores de gr á ficos OpenGL y DirectX. -Compatibilidad con sistemas operativos Linux de 32/64 bits, Windows XP de 32/64 bits, y Mac.

15 Nvidia CUDA La tecnolog í a NVIDIA CUDA es el ú nico entorno de programaci ó n en C que aprovecha la gran capacidad de procesamiento de las GPUs para resolver los problemas de c á lculo m á s complejos y de mayor carga computacional. Las herramientas de desarrollo CUDA est á n formadas por tres componentes fundamentales para ayudar al programador a iniciarse en este lenguaje: 1.El ú ltimo controlador CUDA. 2.Un kit de herramientas completo. 3.Ejemplos de c ó digo del SDK de CUDA. El Toolkit de CUDA es un entorno de desarrollo en lenguaje C dise ñ ado para las GPUs compatibles con la tecnolog í a CUDA

16 Nvidia CUDA

17

18

19

20 Intel Nehalem

21 Nehalem es el nombre clave para el procesador de microarquitectura de Intel, sucesor del Core Microarquitectectura. El primer procesador que uso la arquitectura Nehalem fue el sobremesa ‘ Core i7 ’, Noviembre 2008. Servidores y portatiles basados en procesadores Nehalem lo seguir á n en 2009 y 2010.

22 Intel Nehalem Los primeros procesadores Nehalem usaron la misma tecnolog í a de 45nm que Penryn. La arquitectura tma su nombre del rio Nehalem que a su vez lo toma de una tribu de nativos americanos, en Oregon. Y el nombre en si aparece al final de muchas ‘ roadmaps ’ del 2000. En esa fase se supon í an que iba a ser la ultima evoluci ó n de la arquitectura ‘ NetBurst ’. Desde el abandono de ‘ NetBurst ’, el nombre ha sido reciclado y se refiere a otro proyecto distinto

23 Intel Nehalem

24 Tecnolog í a: Especificaciones de los procesadores de la familia Nehalem: 2, 4 u 8 n ú cleos. 731Millones de transistores en la variante ‘ Quad Core ’. Tecnolog í a de 45nm. Controlador de memoria integrado con soporte para 2 o 3 canales de memoria DDR3 SDRAM o 4 canales FB-DIMM. Un nuevo procesador de interconexi ó n ‘ point-to-point ’, el ‘ Intel QuickPath Interconnect ’, que sustituye al ‘ front side bus ’. Algunos procesadores Nehalem implementan DMI en vez FSB y eliminan el ‘ northbridge.

25 Intel Nehalem Tecnolog í a: Multithreading simultaneo por multiples n ú cleos, y Hyperthreading, el cual habilita 2 threads por n ú cleo. Multithreading simultaneo no ha aparecido en los procesadores de Intel a nivel consumidor hasta 2006 con el Pentium4 y Pentium XE. Procesadores quad y octo-core monoliticos (n ú cleos integrados en un mismo dado). Las siguientes caches: -32KB instrucciones y 32KB L1 cache de datos por n ú cleo. -256KB L2 cache por n ú cleo. -2-3MB L3 cache por n ú cleo y compartida con todos los n ú cleos. 33% mas de ‘ in-flight ’ microoperaciones que el Corroe. Predictor de saltos de segundo nivel y ‘ Translation Lookaside Buffer ’ de segundo nivel. Bloques modulares de componentes como n ú cleos que puede a ñ adirse o quitarse seg ú n al segmento de mercado variable al que vaya dirigido.

26 Intel Nehalem Prestaciones y mejoras de potencia: Nehalem se ha enfocado hacia prestaciones, lo que ha aumentado el tama ñ o del n ú cleo comparando con Penryn. Nehalem tendr á : -1.1x – 1.25x en comportamiento de thread ú nico o 1.2x – 2x en comportamiento multithreading al mismo nivel de potencia. -30% menos de consumo de potencia para el mismas prestaciones. -20-30% ventaja media sobre el Penryn con solo un 10% m á s de consumo de potencia. -N ú cleo inteligente, reloj a reloj, Nehalem supondra de un 15-20% de aumento de prestaciones frente al Penryn. El procesador Nehalem ‘ Gainestown ’ tiene 1,6x SPECfp_rate_2006 en enteros y 2,4x SPECfp_rate_2006 en punto flotante de un procesador XEON Quad-Core de 3.0GHz X5365 ‘ Clovertown ’. El sistema Nehalem ‘ Bloomfield ’ de 2,93GHz se uso para ejecutar un 3DMark Vantage Benchmark y dio una puntuaci ó n de 17.966. La variante de 2,66GHz puntu ó 16.294. Un Core 2 Duo E6600 a 2,4GHz puntu ó 4.300.

27 Intel Nehalem Sucesor: Westmere o m á s form á lmente Nehalem-C, es el nombre del encogimiento a 32nm del Nehalem. Estar á listo para 2009 suponiendo que Intel mantenga el objetivo en su ‘ roadmap ’. De todas maneras parece que el grueso de las versions del Westmere, excluyendo las versions portatiles aparecer á n en el 2010. Las mejoras del Nehalem ser á n: -Tecnolog í a de 32nm. -Procesadores 6-Core (o m á s, aparentemente Sexa-Core) -Un Nuevo juego de instrucciones que ofrece 3x en grado de encriptaci ó n y desencriptaci ó n de procesos AES comparado con los anteriores. -AES-NI puede ser incluido en la gr á fica integradad del Westmere. -Virtualizaci ó n del retardo mejorado.

28 Intel Nehalem Sucesor: El sucesor de Westmere sera Sandy Bridge (32nm), programado para el 2010 de acuerdo con los roadmaps de Intel. Y a su vez Haswel (22nm) suceder á a Sandy Bridge en el 2012. Y vendr á con un subsistema de cache Nuevo, una unidad FMA y un coprocesador vectorial.

29 Intel Nehalem


Descargar ppt "GPGPUs General Purpose GPUs. GPGPUs - AMD Fusion - Nvidia CUDA - Intel Nehalem - AMD Fusion - Nvidia CUDA - Intel Nehalem."

Presentaciones similares


Anuncios Google