ARQUITECTURAS SIMD TIPOS

Slides:



Advertisements
Presentaciones similares
DIRECCIONES IP.
Advertisements

DISEÑO DE TRANSFERENCIA ENTRE REGISTROS
UNIVERSIDAD DEL VALLE DE MEXICO CAMPUS CHAPULTEPEC
Francisco Carlos Calderón
FAMILIA DE LÓGICA PROGRAMABLE EMBEBIDA ALTERA FLEX 10K.
Fernando Escribano Pro 1º de Bachillerato
Multiprocesadores 3.1 Dominios de aplicación
Computación PROGRAMACIÓN.
Fecha: 11/09/13.  Todos los sistemas distribuidos constan de varias CPU, organizadas de diversas formas.  La forma de interconectarlas entre sí. 
Sistemas Operativos Funcionamiento general de una computadora bajo el control de un programa.
PROGRAMACION DE ESTRUCTURAS DE DATOS
Tema II Unidad de memoria. 2 Unidad de memoria 2.1 Definiciones y conceptos básicos Localización Capacidad Unidad de transferencia
3. INTRODUCCIÓN A LA PROGRAMACIÓN
EMISION MULTIPLE DE INSTRUCCIONES
Composición Interna de un Procesador
Aritmética y Computadores. Refresco de aritmética binaria. Operaciones aritméticas y lógicas. Construcción de una ALU para MIPS. Multiplicación y División.
Microcomputadores Prof : Tatiana Marín R.. Sistema basado en microprocesador de 8 bits.
Tema 6: Procesadores Vectoriales
Arquitectura del Computador

PROGRAMACIÓN PARALELA EN ALGORITMOS SOBRE GRAFOS
ARQUITECTURA DE LOS MICROPROCESADORES DE 8 BITS
Introducción a la Ingeniería en Sistemas
OMAR SANCHEZ ROBLES HECTOR PEREZ GARCIA. “Sistemas de cómputo compuesto por un gran número de CPU´s conectados mediante una red de alta velocidad”, Tanenbaum.
Unidad 3. Arquitecturas SIMD
Estructura y Tecnología de Ordenadores Noviembre 2004.
Clase 10: Estructuras de datos y arreglos.
ARQUITECTURA DE COMPUTADORES Semestre A-2009 Clase 13.
Tema 10.3: Asignación de Espacio No Contiguo. Tema 10.3: 2 Silberschatz, Galvin and Gagne ©2005 Fundamentos de los Computadores (ITT, Sist. Electr.),
Asignación de Espacio No Contiguo
Conceptos Arquitectónicos del computador
Programación I MC José Andrés Vázquez Flores
ARQUITECTURAS SIMD Clase Práctica No Vector Processor M-M 1. Estime el tiempo de ejecución de una suma vectorial en un Vector Processor M-M basado.
Programación Básica con NQC Patricio A. Castillo Pizarro 25/08/2007.
Aplicación de estructuras de datos
TEMA 2: Organización de computadores
Funcionamiento de la CPU
FUNDAMENTOS DE PROGRAMACIÓN Unidad II. Elaborar programas en pseudolenguaje, de acuerdo a requerimientos. Unidad II.
Programación Básica con “NQC” Pedro F. Toledo – Patricio Castillo 15/04/2007.
¿Qué unidades conforman el procesador?
PROCESADOR Por: Luis Gonzaga Trujillo Cuervo USCO
ARQUITECTURAS PARALELAS
“Organización y Arquitectura de Computadores” William Stallings
La unidad central de procesos o CPU
Tema: Componentes físicos de una computadora
Estructura de los Sistemas Operativos
Objetivo Mostrar los fundamentos de la programación a través de ejemplos y prácticas utilizadas cotidianamente en el desarrollo de aplicaciones.
Informática Clase Arquitectura de la Computadora.
NOCIONES BÁSICAS COMPUTO II
ARQUICTECTURA DE SERVIDORES
ARQUITECTURA ALTERNATIVA DE SERVIDORES SISTEMAS OPERTIVOS DE RED En un sistema operativo de red los usuarios saben que están conectados a la red y que.
Modos de direccionamiento
Presente un cuestionario con los aspectos mas importantes sobre los
Son los atributos de un sistema que son visibles para un programador, es decir aquellos atributos que impactan directamente en la ejecución lógica de un.
Principio unidad 1.
* UNIVERSIDAD TECNOLOGICA DE PUEBLA TECNOLOGIAS DE LA INFORMACION Y COM. AREA REDES Y TELECOMUNIC IONES ADMINISTRACION DE SERVIDORES «ARQUITECTURA DE COMPUTADORAS»
ARQUITECTURAS DE LOS SERVIDORES El computador tiene 2 aspectos para entender su funcionamiento al nivel de programación: Almacenamiento Procesamiento Para.
Alumno: Gerardo Mario Valdés Ortega
PROCESAMIENTO DE DATOS. Entrada MemorizaciónProcesamiento Salida.
REPUBLICA BOLIVARIANA DE VENEZUELA UNIVERSIDAD ALONSO DE OJEDA FACULTAD DE INGENIERÍA ESCUELA DE COMPUTACIÓN ING. PROF. LEONEL SEQUERA MEMORIAS.
PROCESADOR SEBASTIAN MADRID PEREZ. ¿QUÉ ES UN PROCESADOR? El procesador, también conocido como CPU o micro, es el cerebro del PC. A pesar de que generalmente.
José Alvarado – Cristian Anzola
1 Unidades funcionales de un ordenador Procesadores Memorias Dispositivos de E/S
SISTEMAS OPERTIVOS DE RED Los usuarios están conectados a la red y que pueden compartir recursos. Cada equipo ejecuta con sus propios recursos su propio.
 PRESENTADO POR : ANDRES MAYORGA DANIELA PAEZ VEGA.
El microprocesador y su arquitectura
Lenguaje ensamblador Conceptos introductorios. Formatos de Instrucción. Modos de Direccionamiento. Conjunto de instrucciones básico. Introducción al Lenguaje.
Circuitos Combinacionales I
CAPITULO V Arquitectura de Von Neumann
Arquitectura de Computadoras (Taller) Semestre II de 2008.
Transcripción de la presentación:

ARQUITECTURAS SIMD TIPOS Los procesadores array que utilizan memoria de acceso aleatorio Los procesadores asociativos que usan memorias direccionables por contenido (o memorias asociativas).

Organización de las computadoras SIMD ILLIAC IV posee 256 PEs distribuidos en cuatro cuadrantes de 8 x 8 PEs Los PEs de un cuadrante son controlados por una unidad de control común, como resultado de esto los PEs de dicho cuadrante pueden ejecutar la misma operación simultáneamente. Cada PE es esencialmente una unidad aritmético y lógica (ALU) con registros de trabajo que le pertenecen y una memoria local (PEM) para el almacenamiento de los datos distribuidos.

Cada PE se comunica con su vecino, la mayor distancia entre dos PEs no vecinos es 8. La CU cuenta también con una memoria propia para el almacenamiento de programas. En ella se cargan los programas del usuario desde el almacenamiento principal. La función de la CU es decodificar todas las instrucciones y determinar dónde deben ejecutarse las instrucciones decodificadas.

Las memorias locales pertenecientes a cada PE son módulos paralelos de memoria compartidos por todos los PEs mediante una red (alignement network). La red de permutación de PEs se reemplaza por una red inter-PE de memoria, controlado por la CU. La red (alignement) es una red de caminos conmutables entre los PEs y las memorias paralelas. Este tipo de configuración existen n PEs y p módulos de memoria. Ambos números no son necesariamente iguales.

Estructura interna de un PE Di indica la dirección asignada al elemento de procesamiento. Si indica si este procesador está o no activo para realizar un cierto cálculo. Ii es un registro índice. Ri es el registro que apunta a otros procesadores Formalmente un procesador SIMD se caracteriza por el siguiente conjunto de parámetros : C = { N, F, I, M } Donde, N = el número de procesadores. F = el conjunto de funciones de ruteo de datos previstos por la red de interconexión. I = el conjunto de instrucciones para las operaciones escalares vectoriales, de ruteo de datos y manejo de la red. M = conjunto de máscaras que habilitan o deshabilitan a los procesadores.

Ejemplo de funcionamiento de un procesador array

Procesadores Array de estructura Bit-Plane En las arquitecturas bit-plane los procesadores array se colocan en una grilla (mesh) simétrica (por ej. de 64 * 64) y se asocian con múltiples planos de bits en memoria que se corresponden a las dimensiones de la grilla de procesadores El procesador n (Pn) situado en la grilla en la posición (x,y) opera sobre los bits de memoria ubicados en la posición (x,y) en todos los planos de memoria asociados. El Procesador Masivo Paralelo de Loral y el Procesador Array Distribuido de ICL ejemplifican esta clase de arquitecturas utilizadas muy frecuentemente para aplicaciones de procesamiento de imágenes mapeando pixels desde la estructura planar de la memoria.

ARQUITECTURA DE PROCESADORES ARRAY DE MEMORIA ASOCIATIVA Constituyen un tipo muy distintivo de máquinas SIMD, usan una lógica de comparación para acceder en paralelo, de acuerdo al contenido, a los datos almacenados. La mayoría de los procesadores de memoria asociativa usan una organización serial de bits, la cual implica operaciones concurrentes sobre un solo bitslice para todas las palabras en la memoria asociativa.

Una operación OR lógico realizada entre una columna de bits y el vector de bits en el registro A, almacena el resultado en el registro B. Un cero en el registro de máscara indica que la palabra asociada no debe incluirse en esta operación.

SYSTOLIC ARRAYS ( SISTÓLICOS) Este tipo de arquitecturas es la apropiada para resolver problemas de alta repetición y muy específicos, o sea se desarrollan para casos especiales y no se busca la resolución de problemas para procesos con mucho tiempo de cálculo y donde varias operaciones se realizan en forma repetida sobre un mismo dato. APLICACIONES Procesamiento de señales/imágenes y reconocimiento de patrones Aritmética de matrices Aplicaciones No-numéricas

Ejemplo 1) Se desea evaluar los polinomios : Yj = S i Wi * Xi+j-1 ; para j de 1 a ¥ o sea : Y1 = W1 * X1 + W2 * X2 + W3 * X3 Y2 = W1 * X2 + W2 * X3 + W3 * X4 Y3 = W1 * X3 + W2 * X4 + W3 * X5 ..... etc ..... 0 + W1*X1 0 + W2*X1 0 + W3*X1 (1) 0 + W1*X2 W1*X1+ W2*X2 W2*X1 + W3*X2 (2) 0 + W1*X3 W1*X2 + W2*X3 W1*X1 + W2*X2 +W3*X3 (3) 0 + W1*X4 W1*X3 + W2*X4 W1*X2 + W2*X3 + W3*X4 (4) 0 + W1*X5 W1*X4 + W2*X5 W1*X3 + W2*X4 + W3*X5 (5) -(1) Se obtiene W3*X1, se descarta. -(2) Se obtiene W2*X1 + W3*X2, se descarta. -(3) Se obtiene W1*X1 + W2*X2 + W3*X3, primer resultado válido. -(4) Se obtiene W1*X2 + W2*X3 + W3*X4, segundo resultado válido y así sucesivamente....

A = a11 a12 B = b11 b12 A * B = C = c11 c12 a21 a22 b21 b22 c21 c22 Ejemplo 2) Multiplicación de matrices A = a11 a12 B = b11 b12 A * B = C = c11 c12 a21 a22 b21 b22 c21 c22 Cantidad de celdas procesadoras : 3(n2 - n) + 1 Donde n es el grado de la matriz La cantidad de períodos o ciclos en los que se obtiene el resultado final responden a la fórmula : (3n - 1) i) Instante t1