Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porMartín Ríos Caballero Modificado hace 5 años
1
8. Diseño del Procesador Fundamentos de los Computadores
Grado en Ingeniería Informática (hasta final del diseño monociclo)
2
Objetivos Plantear y modificar una ruta de datos para un repertorio de instrucciones simple en un procesador básico Especificar y modificar una unidad de control con una máquina de estados finitos para una ruta de datos y un repertorio de instrucciones simples Implementar una unidad de control especificada mediante una máquina de estados finitos Especificar y modificar una unidad de control microprogramada para una ruta de datos y un repertorio de instrucciones simple Implementar una unidad de control microprogramada. Escribir una rutina de tratamiento de excepción para interrupciones o excepciones básicas Diseño del procesador
3
Estructura del tema Metodología de sincronización
Diseño de un procesador MIPS R3000 reducido Rutas de datos individuales Diseño monociclo Diseño de la ruta de datos Diseño de la unidad de control de la ALU Diseño de la unidad de control Ventajas y desventajas Diseño multiciclo Control cableado Control microprogramado Excepciones e interrupciones Resumen y bibliografía Diseño del procesador
4
Metodología de Sincronización
La metodología de sincronización define cuándo pueden leerse y escribirse las diferentes señales Características de la metodología de sincronización por nivel Un elemento de estado puede ser actualizado sólo en el flanco de reloj Un elemento de estado puede ser leído y modificado en un mismo ciclo Señales de habilitación de escritura explícitas Diseño del procesador
5
Estructura del tema Metodología de sincronización
Diseño de un procesador MIPS R3000 reducido Rutas de datos individuales Diseño monociclo Diseño de la ruta de datos Diseño de la unidad de control de la ALU Diseño de la unidad de control Ventajas y desventajas Diseño multiciclo Control cableado Control microprogramado Excepciones e interrupciones Resumen y bibliografía Diseño del procesador
6
Conocimientos previos: Arquitectura MIPS
Registros 32 registros de propósito general, de 32 bits cada uno. ($0, $1, ..., $31) Memoria Direccionable por bytes en modo “big endian” Direcciones de 32 bits Modo de direccionamiento registro base + desplazamiento [100($1)] Diseño del procesador
7
Conocimientos previos: Arquitectura MIPS
Repertorio de instrucciones longitud fija de 32 bits. 3 tipos de instrucciones aritmético-lógicas: add, sub, and, or, slt add $1, $2, $3 de referencia a memoria: lw, sw lw $1, 100($2) Saltos (condicionales o no): beq, j beq $1, $2, 48 3 formatos formato R formato I formato J op rs rt rd funct desplazamiento dirección shamt Diseño del procesador
8
Estructura del tema Metodología de sincronización
Diseño de un procesador MIPS R3000 reducido Rutas de datos individuales Diseño monociclo Diseño de la ruta de datos Diseño de la unidad de control de la ALU Diseño de la unidad de control Ventajas y desventajas Diseño multiciclo Control cableado Control microprogramado Excepciones e interrupciones Resumen y bibliografía Diseño del procesador
9
Ciclo de instrucción Ciclo de instrucción
Lectura de la instrucción M[PC] Decodificación de la instrucción y lectura de los registros Ejecución de la instrucción Ejecución de instrucciones: Pasos Común Leer instrucción de la memoria con el PC Leer registros especificados en la instrucción Similar Utilizar la ALU Diferente Terminación de ejecución de instrucción Diseño del procesador
10
Ruta de datos individuales – Búsqueda de la instrucción
Lectura de la memoria de instrucciones Actualización del PC a la siguiente instrucción Diseño del procesador
11
Ruta de datos individuales – Decodificación y lectura de registros
Envío de los campos de código de operación y función a la unidad de control Lectura del banco de registro de los registros $rs y $rt Diseño del procesador
12
Ruta de datos individuales – Aritmético-lógicas
add, sub, and, or y slt add rd, rs, rt Ejemplo: add $8, $9, $10 $8=$9+$10 Formato tipo R: op y funct especifican la operación aritmético-lógica Diseño del procesador
13
Ruta de datos individuales – Aritmético-lógicas
Escritura del registro $rd del banco de registros con la salida de la ALU Diseño del procesador
14
Instrucciones de acceso a memoria
lw y sw lw rt, despl(rs) ó sw rt, despl(rs) Ejemplos: lw $1, 24($2) $1= Mem[$2+24] sw $1, 24($2) Mem[$2+24]= $1 Formato tipo I op rs rt desplazamiento Diseño del procesador
15
Ruta de datos individuales– Cargas y almacenamientos
Cálculo de la dirección de memoria address $rs + extensión-signo(IR[15:0]) Carga de un registro (load) $rt M[$rs + extensión-signo(IR[15:0])] Almacenamiento de un registro (store) M[$rs + extensión-signo(IR[15:0])] $rt Diseño del procesador
16
Instrucción de salto condicional
beq rs, rt, despl Ejemplo: beq $1, $2, despl si ($1=$2) PC=PC+despl Formato tipo I op rs rt desplazamiento Diseño del procesador
17
Ruta de datos individuales – Saltos condicionales
Resta $rs y $rt y comprobación de la señal zero de la ALU Cálculo de la dirección efectiva de salto address PC (extensión-signoIR[15:0])<<2 Diseño del procesador
18
Instrucción de salto incondicional
j dirección Ejemplo: j 1000 PC = PC[31-28] [27-2]+00[1-0] Formato tipo J op dirección Diseño del procesador
19
Ruta de datos individuales – Bifurcaciones
Reemplazo del PC por la dirección efectiva de salto PC PC[31:28] || (IR[25:0]<<2) Diseño del procesador
20
Estructura del tema Metodología de sincronización
Diseño de un procesador MIPS R3000 reducido Rutas de datos individuales Diseño monociclo Diseño de la ruta de datos Diseño de la unidad de control de la ALU Diseño de la unidad de control Ventajas y desventajas Diseño multiciclo Control cableado Control microprogramado Excepciones e interrupciones Resumen y bibliografía Diseño del procesador
21
Tcpu = N · CPI · tciclo Diseño monociclo Depende del compilador y
de la arquitectura del repertorio de instrucciones Dependen de la organización e implementación del procesador Diseño del procesador
22
Diseño monociclo Integración de las rutas de datos individuales
Recursos hardware + multiplexores + señales de control + restricciones de diseño Restricción de diseño Todas las instrucciones tardan un único ciclo de reloj La instrucción más lenta determina el tiempo de ciclo Ningún componente de la ruta de datos puede ser reutilizado Memorias separadas de instrucciones y datos Sumadores varios… Diseño del procesador
23
Diseño de la RD - Integración tipo R y memoria
Diseño del procesador
24
Diseño de la RD - Integración tipo R y memoria
Instrucción Dirección a leer Memoria de Instrucciones PC 4 Add Extensión de signo result ALU Zero 16 32 M u x RegWrite ALUSrc 3 Operación Dirección Dato a escribir Memoria de Datos Registro lectura 1 Registro lectura 2 Registro a Escribir Dato a Escribir Dato leído 1 Banco de Registros leído 2 leído MemWrite MemtoReg MemRead Diseño del procesador
25
Diseño de la RD - tipo R + lw/sw + beq
Instrucción Dirección a leer Memoria de Instrucciones PC 4 Add Desplaz. izq. 2 Extensión de signo result ALU Zero 16 32 M u x RegWrite ALUSrc 3 Operación Dirección Dato a escribir Memoria de Datos Registro lectura 1 Registro lectura 2 Registro a escribir Dato a Escribir Dato leído 1 Banco de Registros leído 2 leído MemtoReg MemWrite MemRead PCSrc Diseño del procesador
26
Diseño de la RD - tipo R + lw/sw + beq + j
Instrucción Dirección a leer Memoria de Instrucciones PC 4 Add result ALU Desplaz. izq. 2 Registro lectura 1 Registro lectura 2 Registro a escribir Dato a escribir Dato leído 1 Banco de Registros Extensión de signo Zero 16 32 M u x RegWrite ALUSrc 3 Operación Dirección Memoria de Datos leído 2 leído MemWrite MemtoReg MemRead PCSrc1 PCSrc2 28 26 Instrucción[25-0] PC+4 [31-28] Diseño del procesador
27
Diseño de la RD – Señales de control
Selección de la operación a realizar Operación ALU: ALUControl Escritura y lectura del banco de registros: RegWrite Escritura y lectura de las memorias: MemRead, MemWrite Selección de entradas de los multiplexores (flujo de datos) ALUSrc, MemToReg ¿Y el número del registro destino de donde viene? Diseño del procesador
28
Diseño de la RD – Integración de la RD y de la UC
Diseño del procesador
29
Diseño de la RD – Flujo de datos y control para tipo R
Diseño del procesador
30
Diseño de la RD – Flujo de datos y control para lw
Diseño del procesador
31
Diseño de la RD – Flujo de datos y control para beq
Diseño del procesador
32
Integración de la RD – Flujo de datos y control para j
Diseño del procesador
33
Esquema alternativo (sin instrucción j)
Camino de datos con todos los multiplexores y líneas de control necesarias (según figura del libro de texto) M e m t o R g a d W r i A L U O p S c D s P C I n u y [ 3 1 – ] 2 6 5 4 x l Z h f Diseño del procesador
34
Estructura del tema Metodología de sincronización
Diseño de un procesador MIPS R3000 reducido Rutas de datos individuales Diseño monociclo Diseño de la ruta de datos Diseño de la unidad de control de la ALU Diseño de la unidad de control Ventajas y desventajas Diseño multiciclo Control cableado Control microprogramado Excepciones e interrupciones Resumen y bibliografía Diseño del procesador
35
Diseño de la UC de la ALU: visión completa
Camino de datos con la unidad principal de control y la unidad local de control de la ALU P C I n s t r u c i o m e y R a d [ 3 1 – ] 2 6 5 A M g L U O p W B h D S 4 x l Z f Diseño del procesador
36
Diseño de la UC de la ALU – Estructura de la ALU
Operaciones básicas (solo usaremos 5 de las 8 posibles) Diseño del procesador
37
Diseño de la UC de la ALU – Especificación del control ALU
Operaciones a realizar según la instrucción Load (lw) y store (sw): Suma($rs + extensión-signo(IR[15:0])) Salto (beq): Resta($rs-$rt) Aritméticas (tipo R: add, sub, or, and y slt): Definida por el campo funct Diseño del procesador
38
Diseño de la UC de la ALU: Tabla de verdad
op rs rt rd shamt funct 6 11 16 21 26 31 6 bits 5 bits Instrucción Tipo R: Main Control op 6 ALU (Local) func N ALUop ALUctr 3 funct<3:0> Instruction Op. 0000 0010 0100 0101 1010 add subtract and or set-on-less-than Diseño del procesador
39
Diseño de la UC de la ALU - Implementación
Diseño del procesador
40
Estructura del tema Metodología de sincronización
Diseño de un procesador MIPS R3000 reducido Rutas de datos individuales Diseño monociclo Diseño de la ruta de datos Diseño de la unidad de control de la ALU Diseño de la unidad de control Ventajas y desventajas Diseño multiciclo Control cableado Control microprogramado Excepciones e interrupciones Resumen y bibliografía Diseño del procesador
41
Diseño de la UC – Señales de control
Diseño del procesador
42
Diseño de la UC – Funcionalidad de las señales de control
Diseño del procesador
43
Funcionamiento instrucción tipo R (add, sub, and, or, slt)
add $t1,$t2,$t3 P C I n s t r u c i o m e y R a d [ 3 1 – ] 2 6 5 A M g L U O p W B h D S 4 x l f Z Diseño del procesador
44
Funcionamiento instrucción lw
lw $t1, desplazamiento ($t2) P C I n s t r u c i o m e y R a d [ 3 1 – ] 5 2 6 A M g L U O p W B h D S 4 x l f Z Diseño del procesador
45
Funcionamiento instrucción sw
sw $t1, desplazamiento($t2) P C I n s t r u c i o m e y R a d [ 3 1 – ] 5 2 6 A M g L U O p W B h D S 4 x l f Z Diseño del procesador
46
Funcionamiento instrucción branch
beq $t1, $t2, desplazamiento P C I n s t r u c i o m e y R a d [ 3 1 – ] 5 2 6 A M g L U O p W B h D S 4 f l x Z Diseño del procesador
47
Diseño de la UC – Implementación de la UC
Diseño del procesador
48
Estructura del tema Metodología de sincronización
Diseño de un procesador MIPS R3000 reducido Rutas de datos individuales Diseño monociclo Diseño de la ruta de datos Diseño de la unidad de control de la ALU Diseño de la unidad de control Ventajas y desventajas Diseño multiciclo Control cableado Control microprogramado Excepciones e interrupciones Resumen y bibliografía Diseño del procesador
49
Rendimiento de la implementación monociclo - Ejemplo
Suponiendo que los tiempos de operación (latencia) de las unidades funcionales son: Unidad de memoria: 2 ns ALU y sumadores: 2 ns Registros (lectura o escritura): 1 ns Resto de los componentes (multiplexores, acceso al PC, etc. ): 0 ns ¿Cuál de las siguientes implementaciones será más rápida? 1.- Una implementación en la que cada instrucción se ejecuta en un ciclo de reloj de duración fija. 2.- Una implementación donde cada instrucción se ejecuta en un ciclo de reloj pero de duración variable (solución no práctica, pero ilustrativa). Suponer un programa compuesto por: 24% carga (lw), 12% almacenamiento (sw), 44% R-format, 18% saltos (beq/bne) y 2% bifurcacines (j). Diseño del procesador
50
Solución Diseño del procesador
51
Ventajas y desventajas
V: Todas las instrucciones tardan un ciclo en ejecutarse D: Aprovechamiento ineficiente del área del chip (componentes repetidos) D: Ciclo de reloj largo para acomodar la instrucción más lenta Las instrucciones de punto flotante requerirían un tiempo de ciclo extra largo Diseño del procesador
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.