REPUBLICA BOLIVARIANA DE VENEZUELA

Slides:

Advertisements

Presentaciones similares

ARQUITECTURA CUDA Integrantes: Jose D Apollo

Advertisements

Alejandro Samarín Lionel Aster Mena García Sergio Armas Pérez.

GPUs Rayco González Sicilia Microprocesadores para Comunicaciones 5º ETSIT.

Alejandro Samarín Lionel Aster Mena García Sergio Armas Pérez.

SISTEMAS DE PROCESAMIENTO DE LA INFORMACION HISTORIA Y EVOLUCIÓN DEL SOFTWARE.

La placa base, también conocida como placa madre o tarjeta madre, es una tarjeta de circuito impreso a la que se conectan los componentes que constituyen.

Organización del Computador UC1.- Arquitectura y estructura del computador.

¿Que es un ordenador? Un ordenador es una máquina programable. Las dos características principales de un ordenador son: 1. Responde a un sistema específico.

UNIVERSIDAD FERMIN TORO CABUDARE ENSAYO TIPOS DE SOFTWARE E IMPORTANCIA JUNIO 2014.

ALUMNO: NORMA DOLORES ILLESCAS CANALIZO. GRUPO:503 CECYTEM TEPOTZOTLAN. Procesador de un servidor.

COMPUTACIÓN Y SOFTWARE DE APLICACIÓN

TECNOLOGÍAS DE LA INFORMACIÓN Y DE LA COMUNICACIÓN (TIC’S)

“Alternativa para procesamiento de datos oceanográficos que requieren gran capacidad de cómputo, por medio de programación en paralelo con el programa.

L. S. C. A. Raúl Monforte Chulin

Universidad American College. Objetivos Introducción a la Informática Tema: Introducción a la Informática 1.Explicar los conceptos fundamentales relacionados.

UNIVERSIDAD DE LAS FUERZAS ARMADAS - ESPE

“Los Sistemas Operativos”

Tratamiento de Datos Capitulo Dos.

Republica Bolivariana de Venezuela, Ministerio del Poder Popular para la Educación, U.E.C Juan XXIII Fe y Alegría. Ciudad Ojeda/Edo. Zulia. PROCESADOR.

Unidad II: Clasificación del Hardware y del Software

UNIDAD CENTRAL DE PROCESO CPU.

Hardware Software Sistema Informática Computadora Computación Datos.

Arquitecturas alternativas UNIVERSIDAD TECNOLOGICA DE PUEBLA TECNOLOGIAS DE LA INFORMACION Y COM. AREA REDES Y TELECOMUNICIONES ADMINISTRACION DE SERVIDORES.

El hardware y el software

PRUEBA DIAGNÓSTICA GRADO SEXTO TECNOLOGÍA E INFORMÁTICA 1

EL Procesador. República bolivariana de Venezuela.

Componentes básicos de una computadora

Características en general de Pentium II. ESQUEMA Introducción. Pentium. Pentium II. Tipos de Pentium II. Características en general de Pentium II.

Universidad Nacional de Canindeyú Facultad de Ciencias de la Salud

Software Es intangible, existe como información, ideas, conceptos, símbolos, pero no ocupa un espacio físico, se podría decir que no tiene sustancia. Se.

EVOLUCIÓN DE LOS MICROPROCESADORES

Unidad 1 Introducción al mundo de la computación.

COMPONENTES DE UN ORDENADOR

INTRODUCCIÓN A JAVA.

Concepto Clasificación Hardware Como procesa datos Sistemas de los Procesos de Datos (Dispositivos) Software (Conceptos, tipos, clasificación, fuentes)

SOL GUTIÉRREZ Y MARIANA HEINTZ 4°C Prof. Gustavo price

Concepto Clasificación Hardware Como procesa datos Sistemas de los Procesos de Datos (Dispositivos) Software (Conceptos, tipos, clasificación, fuentes)

EL SISTEMA OPERATIVO Es un conjunto de programas hechos para la ejecución de varias tareas, en las que sirve de intermediario entre el usuario y la computadora.

El microprocesador o simplemente procesador, es el circuito integrado central más complejo de un sistema informático; a modo de ilustración, se le suele.

 La cuestión de la cantidad es simple, cuanto más memoria haya disponible, más podrá utilizarse. La velocidad óptima para la memoria es la velocidad.

Las computadoras se clasifican en categorías, con el fin de ayudar a los clientes y a los programas informáticos a entender lo que pueden obtener o con.

ARQUITECTURA DEL COMPUTADOR Ing. Diana E. López.

CURSO PROGRAMACIÓN BÁSICA SEMANA 2

22/11/2018 Sistema inteligente de tipo TLD (Track, Learn and Detect) para plataforma móvil de última generación: Implementación y comparativa de su rendimiento.

Procesadores El procesador es el elemento vital del PC.

FUNDAMENTOS DE PROGRAMACIÓN. INTRODUCCIÓN  Conceptos: Informática, Ordenador, Programa, Dato, Bit, Byte, Hardware, Software, Lenguaje de Programación,

Autor: Ing. Maritza Núñez Solís

2.4.3 Procesadores Tema 2 página 35

Estructura de los sistemas Operativos 1. Componentes de un sistema operativo  Administración de procesos  Administración de memoria  Subsistema de Entrada/Salida.

SOFTWARE Y HARDWARE.

Concepto Clasificación Hardware Como procesa datos Sistemas de los Procesos de Datos (Dispositivos) Software (Conceptos, tipos, clasificación, fuentes)

CON DETECCIÓN DE MOVIMIENTO USANDO IMÁGENES IMPLEMENTADO EN LABVIEW JORGE LEÓN JUAN SANCHEZ ESPOL 2010.

Características de los Sistemas Operativos

LOS SISTEMAS OPERATIVOS MENÚ SISTEMAS OPERATIVOS Introducción Definición Historia Funciones Tipos S.O. Algunos Existentes Conclusiones Referencias.

1 TEMA 10. SISTEMAS OPERATIVOS DISTRIBUIDOS Introducción Hardware Software Aspectos de diseño.

CULTURA ORGANIZACIONAL: CASO UNIVERSIDAD VALLE DEL MOMBOY

Núcleo Lic. Gonzalo Pastor.

UNIVERSIDAD PRIVADA SAN JUAN BAUTISTA FILIAL CHINCHA ESCUELA PROFESIONAL DE INGENIERÍA DE COMPUTACIÓN Y SISTEMAS Por: Nestares Torres Luis Jesús Enrique.

ESTRUCTURA DE LOS SISTEMAS OPERATIVOS

ESTRUCTURA DE LO SISTEMAS OPERATIVOS Presentado por: Jennifer.

Estructura de los Sistemas Operativos

Estructura de los Sistemas Operativos

Concepto Clasificación Hardware Como procesa datos Sistemas de los Procesos de Datos (Dispositivos) Software (Conceptos, tipos, clasificación, fuentes)

Hilos de Procesamiento. Hilos Concepto Beneficios Hilos a nivel kérnel y a nivel usuario Modelos multihilos Hilos de Solaris 2 Hilos de Java.

Los sistemas operativos en el sistema informático

Concepto Clasificación Hardware Como procesa datos Sistemas de los Procesos de Datos (Dispositivos) Software (Conceptos, tipos, clasificación, fuentes)

Transcripción de la presentación:

REPUBLICA BOLIVARIANA DE VENEZUELA UNIVERSIDAD VALLE DEL MOMBOY FACULTAD DE INGENIERÍA UVM CARVAJAL ESTADO TRUJILLO ACELERACION GRÁFICA POR GPU PARA OPTIMIZAR EL RENDIMIENTO EN DIFERENTES ORDENADORES Tutor: Dr. Iván Pérez AUTOR: Yonmar S. VILLARREAL p. CARVAJAL, Junio 2018

CAPITULO I MARCO INTRODUCTORIO

PLANTEAMIENTO DEL PROBLEMA ARQUITECTURAS MULTI-CORE: -Diseñada únicamente para realizar operaciones matemáticas, lógicas -Distribuye sus recursos entre las tareas ejecutadas -Congestionamiento de su función principal “No es posible reemplazar la CPU por una GPU”

FORMULACIÓN DEL PROBLEMA ¿Como se obtiene un mejor rendimiento si no podemos contar con las arquitecturas Multi-Core? ARQUITECTURAS MANY-CORE: -Optimizar el desempeño de las aplicaciones -Se especializa únicamente en gráficos -Se libera la carga de trabajo gráfica de la CPU -Se implementan Modelos de programación, (CUDA) y (OpenCL)

OBJETIVOS DE LA INVESTIGACIÓN OBJETIVO general: Evaluar la influencia del rendimiento por causa de la aceleración de GPU teniendo en cuenta las prestaciones de los distintos componentes de hardware en el computador. OBJETIVOS ESPECIFICOS: Identificar los funcionamientos de las arquitecturas gráficas y características básicas del pipeline gráfico. Describir las diferencias y similitudes entre las arquitecturas CPU y GPU. Interpretar los conceptos fundamentales e implementación de las Arquitecturas Orientadas al Procesamiento Gráfico. Presentar los resultados de rendimiento, beneficios y optimización.

JUSTIFICACIÓN de la investigación Evaluar la influencia del rendimiento por causa de la aceleración de GPU teniendo en cuenta las prestaciones de los distintos componentes de hardware en el computador. Graficas Comparativas de rendimiento entre tecnologías CPU y GPU. Resultados favorables con respecto al Procesamiento de imágenes en una GPU vs CPU. Aplicaciones Implementadas por CUDA.

CAPITULO iI MARCO TEÓRICO

ANTECEDENTES DE LA INVESTIGACIÓN Francesc Guim y Ivan Rodero (2011): Estudio de arquitecturas orientadas a computación gráfica y procesamiento gráfico como lo son las arquitecturas de Nvidia y AMD (ATI). David A. Patterson y John L. Hennessy (2011): Estudio de las arquitectura del sistema GPU y su programación, así como también el sistema de memoria paralelo. María Fabiana Piccoli (2011): Características de la GPU y su adopción como arquitectura masivamente paralela para aplicación de propósito general. Carlos Juega Reimúndez (2010): Estudiar el rendimiento en GPU mediante un uso eficiente del sistema de memoria, heterogéneo, de múltiples niveles, con gestión software o hardware.

BASES TEóRICAS Francesc Guim (2011) > Entender los orígenes y características básicas de las arquitecturas basadas en la computación gráfica (pipeline), y así mismo las diferencias entre CPU y GPU < David A. Patterson y John L. Hennessy (2011). David A. Patterson y John L. Hennessy (2011) > Conocer el modelo de programación de aplicaciones graficas en la GPU las cuales corresponde a DirectX, OpenGL, y CUDA. Carlos Juega Reimúndez (2010): Menciona los distintos modelos de programación y optimizaciones basados en el modelo de investigación del proyecto Estudio de rendimiento en GPU.

CAPITULO iII MARCO METODOLÓGICO

DISEÑO DE INVESTIGACIÓN Investigación no experimental descriptiva Estudiar y observar las variables es su contexto natural. MÉTRICAS DE DESEMPEÑO Tiempos de ejecución Aceleración

TIPO DE ARQUITECTURAS ARQUITECTURAS PARALELAS ARQUITECTURAS DEL SISTEMA DE LA GPU ARQUITECTURA DEL PIPELINE ARQUITECTURAS ORIENTADAS AL PROCESAMIENTO GRÁFICO

ARQUITECTURAS PARALELAS Michael J. Flynn propuso en 1966, una taxonomía (considerando sistemas con uno o varios procesadores) que se basa en el flujo que siguen los datos dentro de la máquina y de las instrucciones sobre esos datos

ARQUITECTURA DEL SISTEMA DE LA GPU David Patterson, afirma que la arquitectura de un sistema de computación heterogéneo formado por una CPU y una GPU puede describirse a alto nivel con dos características primarias: 1) Cuantos subsistemas funcionales o chips se utilizan y cuáles son las tecnologías y las topologías de interconexión. 2) Que subsistema de memoria están disponibles para estos subsistemas funcionales.

ARQUITECTURA DEL PIPELINE Los procesadores gráficos funcionan mediante un pipeline de procesamiento formado por etapas muy especializadas en las funciones que desarrollan y que se ejecutan en un orden preestablecido. Funcionalidades del pipeline gráfico

ARQUITECTURAS ORIENTADAS AL PROCESAMIENTO GRÁFICO ARQUITECTURA NVIDIA: Se especializa en el desarrollo de unidades de procesamiento gráfico y tecnologías de circuitos integrados para estaciones de trabajo, ordenadores personales y dispositivos móviles (1993) La arquitectura G80 de Nvidia se define como una arquitectura totalmente unificada, sin diferenciación a nivel de hardware entre las diferentes etapas que forman el pipeline gráfico, totalmente orientada a la ejecución masiva de flujos NVIDIA® Maxwell: Actualmente es la arquitectura de GPU mas avanzada del mundo. Todo en ella gira en torno a la luz y está diseñada para ser el motor de la próxima generación de juegos de PC.

ARQUITECTURAS ORIENTADAS AL PROCESAMIENTO GRÁFICO ARQUITECTURA AMD (ATI): La tecnología GPU desarrollada por AMD/ATI ha evolucionado muy rápidamente en la última década hacia la computación GPGPU. La Arquitectura de la serie R600 de AMD implementa una arquitectura unificada como en el caso de la Nvidia G80. También incluye un shaders de geometría que permite ejecutar operaciones de creación de geometría en la GPU y así no tener que sobrecargar la CPU. La serie R600 incorpora 320 SP, que son muchos más que los 128 de la G80.

ARQUITECTURAS ORIENTADAS AL PROCESAMIENTO GRÁFICO ARQUITECTURA CUDA: CUDA es un modelo de programación paralela mediante el uso de dispositivos de aceleración gráfica (GPU). Jerarquía de grupos de hilos. Modelo de recursos compartidos Instrucciones de sincronización Arquitectura de Tarjeta NVIDIA con 128 núcleos

ARQUITECTURAS ORIENTADAS AL PROCESAMIENTO GRÁFICO ARQUITECTURA DE OPENCL: OpenCL es una interfaz estándar, abierta, libre y multiplataforma para la programación paralela. La principal motivación para el desarrollo de OpenCL fue la necesidad de simplificar la tarea de programación portátil y eficiente de la creciente cantidad de plataformas heterogéneas, como CPU multinúcleo, GPU o incluso sistemas incrustados.

DIFERENCIAS, SIMILITUDES, INTERCONEXIÓN ENTRE LAS ARQUITECTURAS CPU Y GPU. CPU GPU Su Arquitecturas es Multicore Su Arquitecturas es Many-Cores Provee mejor desempeño a soluciones secuenciales Se centran en optimizar el desempeño de las aplicaciones Provee lógica de control compleja para la ejecución paralela de código secuencial Se obtienen mejoras en la velocidad del performance. Incluye memorias caché más rápidas y más grandes para disminuir la latencia de las instrucciones. Las memorias caché son pequeñas Optimiza el ancho de banda para atender a todas las aplicaciones, operaciones de entrada/salida y funciones del sistema operativo. Logra un mayor ancho de banda diez veces superior al de las CPU contemporáneas. Alto rendimiento sobre un único hilo. Alto rendimiento cuando se ejecutan tareas paralelas. Se implementa CUDA OpenGL

Device (el dispositivo): La tarjeta gráfica [GPU + memoria de vídeo] TERMINOLOGÍA: Host (el anfitrión): La CPU y la memoria de la placa base [DDR3]. Device (el dispositivo): La tarjeta gráfica [GPU + memoria de vídeo] Hilos: Los hilos son generalmente entidades pesadas (CPU) o ligeras (GPU) RAM: Ambos dispositivos (host y device) tienen su propia RAM

CAPITULO iV modelos DE PROGRAMACIÓN Y OPTIMIZACIONES

PROGRAMACIÓN DE LAS GPU La programación de las GPUs multiprocesador es cualitativamente diferente de la programación de otros multiprocesadores como las CPU multinúcleo. NVIDIA en el campo de la GPU está compuesta por un nuevo modelo de programación que permite a los desarrolladores el acceso a los dispositivos con capacidades CUDA, así como un conjunto de herramientas y librerías de desarrollo para facilitar la labor de los mismos en la programación y depuración de aplicaciones bajo este modelo.

MODELO DE PROGRAMACIÓN CUDA El modelo de programación CUDA asume que los hilos CUDA se ejecutan en una unidad física distinta que actúa como coprocesador (device) al procesador (host) donde se ejecuta el programa. // Kernel definition __global__ void VecAdd (f loat * A, f loat * B, f loat * C) { int i = threadIdx . x ; C[ i ] = A[ i ] + B[ i ] ; } int main ( ) . . . // Kernel invocation with Nthreads VecAdd<<<1, N>>>(A, B, C) ;

MODELO DE MEMORIA La memoria es uno de los aspectos de las GPUs donde se encuentra más información pero existe diferente tipos de memorias. “El correcto uso de los diferentes tipos de memoria que un dispositivo brinda será el mejor aliado si se quiere conseguir un mayor rendimiento”

MODELO DE MEMORIA MEMORIA GLOBAL: Es la memoria más abundante, pero también la que se caracteriza por una mayor latencia y menor ancho de banda. MEMORIA LOCAL: Es una manera alternativa de utilizar memoria global, acotando la visibilidad y el tiempo de vida de los datos a nivel de hilo y de kernel respectivamente. REGISTROS: Son el recurso de almacenamiento más rápido de las GPUs, junto con la memoria compartida.

MODELO DE MEMORIA MEMORIA COMPARTIDA: Es uno de los recursos más valiosos del dispositivo. Se encuentra dentro del chip y, a diferencia de los registros y la memoria local, su visibilidad es a nivel de bloque. MEMORIA CONSTANTE: Su función es ofrecer un nivel de caché por encima de la memoria global. MEMORIA DE TEXTURAS: Es utilizada nativamente para leer texturas de imágenes en aplicaciones gráficas.

ETAPAS PROGRAMABLES DEL PIPELINE Los procesadores de fragmentos programables requieren muchas de las operaciones matemáticas que exigen los procesadores de vértices, pero añaden operaciones sobre texturas. Este tipo de operaciones facilita el acceso a imágenes (texturas).

INTERFACES DE PROGRAMACIÓN DEL PIPELINE GRÁFICO Para programar el pipeline de un procesador gráfico de forma eficaz, los programadores necesitan bibliotecas gráficas que ofrezcan las funcionalidades básicas para especificar los objetos y las operaciones necesarias para producir aplicaciones interactivas con gráficos en tres dimensiones. Direct3D: Permite que el pipeline gráfico se pueda acelerar por hardware. Exponiendo capacidades más complejas de las GPU como por ejemplo efectos atmosféricos, aplicaciones de texturas mediante corrección de perspectiva, gráficos 2D y 3D en aplicaciones multimedia. OpenGL: Está diseñada de manera completamente independiente al hardware para permitir implementaciones en varias plataformas, pero no incluye instrucciones para la gestión de ventanas o la gestión de acontecimientos de usuario, entre otros.

ESTRUCTURA DE UN PROGRAMA EN CUDA ?????

OPTIMIZACIONES DE PÍXELES ??????

OPTIMIZACION USO DE MEMORIA Para ????

CAPITULO v RESULTADOS Y ANALISIS DE RENDIMIENTO

COMPARACIÓN DE RENDIMIENTO ENTRE LA CPU Y GPU Por las propiedades de la GPU, es de esperar que las aplicaciones desarrolladas en ella obtengan buena performance. Las primeras generaciones de GPU tenían una cantidad de núcleos bastante reducida, pero rápidamente se incrementó hasta hoy en día, Este aumento de la cantidad de núcleos hizo que en el 2003 hubiera un salto importante de la capacidad de cálculo en coma flotante de las GPU respecto a las CPU.

COMPARACION DE MODELOS DE NVIDIA Y AMD Comparativa de varios modelos de la familia Nvidia Comparativa de varios modelos de GPU AMD

APLICACIONES DE CUDA SeismicCity (Energía): Se utiliza para mejorar la posibilidad de descubrir petróleo. Esta tecnología de imágenes interpreta datos sísmicos que llevan a la selección de nuevas ubicaciones para perforación con mucho más rapidez de lo que podrían hacerlo los sistemas anteriores. Para mejorar la calidad y eficiencia de sus imágenes SeismicCity se inclinó por CUDA y las GPU NVIDIA Tesla de la serie 8.

APLICACIONES DE CUDA NAMD (Investigación): Se utiliza para la simulación de virus. Los virus, causa de muchas enfermedades, son los organismos naturales más pequeños que se conocen. Los biólogos computacionales eligieron un virus para su primer intento de simular una forma de vida completa usando una computadora. Se trata del virus satélite de mosaico del tabaco, uno de los más pequeños. Los investigadores simularon el virus en una gota de agua salada usando un programa llamado NAMD

APLICACIONES DE CUDA TechniScan (Medicina): Tiene la capacidad de producir rápidamente imágenes bastante detalladas en un plazo corto de las ecografías para detección del cáncer de mama. Un desarrollador de sistemas de imágenes automatizadas por ultrasonido, cambió su algoritmo patentado de un sistema tradicional en la CPU a CUDA.

APLICACIONES DE CUDA Badaboom de Elemental (Vídeo y Fotografía): Es un programa de transcodificación de vídeo que convierte los archivos de vídeo estándar en formatos que se ejecutan en el Ipod y en otros dispositivos portátiles. Al aprovechar CUDA en las GPU NVIDIA, Badaboom puede acelerar el proceso de conversión para que resulte hasta 18 veces más rápido que los métodos tradicionales. La conversión de una película de dos horas de duración tarda cerca de 20 minutos en vez de varias horas.

PRESTACIONES DE CPU/GPU EN CÁLCULO Y ACCESO A MEMORIA

Evolución GPU: GB/s.

CONCLUSIONES Badaboom de Elemental (Vídeo y Fotografía): Es un programa de transcodificación de vídeo que convierte los archivos de vídeo estándar en formatos que se ejecutan en el Ipod y en otros dispositivos portátiles. Al aprovechar CUDA en las GPU NVIDIA, Badaboom puede acelerar el proceso de conversión para que resulte hasta 18 veces más rápido que los métodos tradicionales. La conversión de una película de dos horas de duración tarda cerca de 20 minutos en vez de varias horas.