Departamento de Ingeniería de Sistemas Universidad de Antioquia

Departamento de Ingeniería de Sistemas Universidad de Antioquia 2010-1
ISI374 – Arquitectura de Computadores Clase 12: Segmentación (Pipelining) Pt.1 Departamento de Ingeniería de Sistemas Universidad de Antioquia 2010-1

Resumen La recurrente analogía con una lavandería Latencia, throughput
Pasos en la ejecución de una instrucción MIPS Procesador MIPS segmentado Rendimiento del procesador segmentado Speedup del pipeline ISA y pipeline Riesgos (Hazards)

La recurrente analogía con una lavandería
Tenemos cuatro canastas de ropa sucia para lavar, secar, doblar y guardar en el armario El lavado toma 30 minutos El secado toma 30 minutos El doblado toma 30 minutos Ubicar la ropa en el armario toma 30 minutos A B C D 3

Lavado secuencial 30 Time 6 PM 7 8 9 10 11 12 1 2 AM T a s k O r d e B
El lavado secuencial toma 8 horas para 4 canastas

Lavado segmentado (pipelined)
12 2 AM 6 PM 7 8 9 10 11 1 Time 30 T a s k O r d e B C D A El lavado segmentado toma 3.5 horas para 4 cargas Speedup = 8 / 3.5 = 2.3 ¿Qué pasa si el número de canastas es grande? Speedup  Número de etapas Ej: 500 canastas toman (4+499)×0.5 = horas Speedup = 500× 2 / = 3.98

Recordatorio Latencia
Tiempo necesario para ejecutar completamente una tarea (retardo) Throughput Cantidad de trabajo realizado en un periodo de tiempo (tasa)

Lecciones de la analogía
La segmentación no reduce la latencia de una tarea, sino que eleva el throughput de un proceso completo Varias tareas operan simultáneamente usando recursos diferentes Speedup potencial: número de etapas del pipe El speedup se reduce porque hay que llenar (fill) y vaciar (flush) el pipeline (2.3× contra 4× en este ejemplo) 6 PM 7 8 9 10 Time 30 T a s k O r d e B C D A

Lecciones de la analogía
Supongamos que las tareas de lavar y ubicar la ropa en el armario ahora toman 20 minutos cada una. ¿Qué tanto más rápido es el nuevo pipeline? La rata del pipeline está limitada por la etapa más lenta Etapas desequilibradas del pipeline reducen el speedup 6 PM 7 8 9 10 Time 30 20 T a s k O r d e B C D A Secuencial= 6.67 h Segmentado= 3.17 h Speedup= 2.11

Pasos en la ejecución de una instrucción MIPS
IF: (Instruction Fetch) Búsqueda de la instrucción, actualización del PC ID: (Instruction Decode) Decodificación de la instrucción, lectura del banco de registros EX: (Execution) Instrucción de acceso a memoria: Cálculo de la dirección Instrucción aritmético-lógica: Cálculo de la operación MEM: (Memory) Load: Lectura de la memoria de datos Store: Escritura de la memoria de datos WB: (Write Back) Escritura del resultado en el banco de registros

Procesador MIPS segmentado
Tendremos cinco etapas, una por cada paso de ejecución de una instrucción Cada etapa del pipeline se completa en un ciclo de reloj Cada instrucción toma el mismo número de etapas (5) para ejecutarse, aunque algunas de ellas estén inactivas algunas veces Mejora el throughput aunque la latencia de cada instrucción no se reduce Time cc 1 cc 2 cc 3 cc 4 cc 5 cc 6 cc 7 cc 8 cc 9 Una vez el pipeline está lleno, se finaliza una instrucción cada ciclo (CPI = 1) IF ID EX MEM WB Instr. i Instr. i+1 Instr. i+2 Instr. i+3 Instr. i+4

Rendimiento del procesador segmentado
Ciclo de reloj del procesador monociclo asumiendo que los retrasos de todos los componentes son despreciables (incluidos los cables), excepto los de los siguientes, cuyo retraso se indica: Unidades de memoria: 200 ps ALU y sumadores: 200 ps Banco de registros (R/W): 100 ps Ciclo de reloj para la versión monociclo: 800 ps Ciclo de reloj de la versión segmentada: 200 ps Tipo de instrucción Memoria de instrucciones Lectura banco de registros Operación ALU Memoria de datos Escritura banco de registros Total Tipo R 200 100 600 ps Load word 800 ps Store word 700 ps Branch 500 ps

Rendimiento del procesador segmentado
Monociclo (Tc= 800ps) Segmentado (Tc= 200ps) El tiempo de ciclo del pipeline está limitado por la etapa más lenta

Speedup del pipeline Si todas las etapas están balanceadas, es decir, todas tardan el mismo tiempo: Tiempo entre instruccionessegmentado = Bajo condiciones ideales y con un gran número de instrucciones, el speedup de la segmentación es aproximadamente igual al número de etapas del pipeline Si no está balanceado, el speedup es menor La segmentación eleva el rendimiento incrementando la tasa de ejecución de instrucciones (throughput), sin reducir el tiempo de ejecución de una instrucción individual (latencia) La tasa de ejecución de instrucciones es la medida que importa porque los programas ejecutan miles de millones de instrucciones Tiempo entre instruccionesno segmentado Número de etapas del pipe

ISA y segmentación La ISA del MIPS fue diseñada para una ejecución segmentada Todas las instrucciones son de la misma longitud Facilita la búsqueda de instrucciones en la primera etapa (IF) y su decodificación en la segunda (DE) Pocos formatos de instrucción Los campos de registros fuente ocupan el mismo lugar en cada formato Esta simetría permite que en la segunda etapa se lea el banco de registros a la misma vez que se determina el tipo de instrucción Los operandos de memoria sólo aparecen en las instrucciones load y store La etapa de ejecución (EX) se usa para calcular la dirección de memoria, y el acceso se produce en la siguiente etapa (MEM) Cada instrucción escribe a lo sumo un resultado y lo hace en las últimas etapas (MEM, WB) Alineamiento de memoria Los accesos a memoria se realizan en un solo ciclo de reloj

Representación gráfica del pipeline
Útil para: Saber cuántos ciclos de reloj toma la ejecución de un código Saber qué hace una unidad funcional en un ciclo determinado Si ocurre un riesgo (hazard), saber porqué y saber cómo resolverlo

Riesgos (Hazards) El principio de la segmentación es simple pero su implementación introduce una serie de problemas Riesgos (Hazards) Situaciones en las cuales la próxima instrucción no puede ejecutarse en el siguiente ciclo de reloj Pueden obligar a detener (stall) el pipeline, evitando que se logre el speedup ideal Los riesgos se pueden resolver esperando, pero será el controlador del pipeline quien los detecte y resuelva Tipos: Riesgos estructurales (Structural hazards) Riesgos de datos (Data hazards) Riesgos de control (Control hazards)

Riesgos estructurales
Se presentan cuando dos instrucciones diferentes intentar usar el mismo recurso simultáneamente Ej: ¿Qué sucede si el procesador tiene una memoria de un puerto, compartida para datos e instrucciones? Solución: Emplear memorias de datos e instrucciones independientes (I$ y D$). En general, replicar los recursos necesarios para permitir todas las combinaciones posibles de instrucciones en el pipeline

Riesgos estructurales
¿Qué sucede con los accesos al banco de registros? Para resolver el riesgo estructural al momento de acceder al banco de registros, las escrituras se realizan en la primera mitad del ciclo, y las lecturas en la segunda add $t0, $t1, $t2 Instr. 1 Instr. 2 add $s2, $t0, $s3 Clock Flanco de reloj que controla la escritura de resultados en el banco de registros Flanco de reloj que controla la lectura de operandos del banco de registros

Riesgos de datos Ocurren cuando una instrucción no puede ser ejecutada porque depende del resultado de una instrucción previa que no lo ha producido aún Ocurren cuando el pipeline modifica el orden de los accesos de lectura/escritura a los operandos tal que este orden difiere del orden visto por una ejecución secuencial no segmentada

Riesgos de datos Considere la ejecución segmentada de la siguiente secuencia de instrucciones: add $t0, $t1, $t2 sub $t3, $t0, $t4 and $t5, $t0, $t6 or $t7, $t0, $t8 nor $t9, $t0, $t9

Riesgos de datos Considere la ejecución segmentada de la siguiente secuencia de instrucciones: add $t0, $t1, $t2 sub $t3, $t0, $t4 and $t5, $t0, $t6 or $t7, $t0, $t8 nor $t9, $t0, $t9 Las dependencias de datos hacia atrás en el tiempo ocasionan riesgos de datos

Riesgos de datos Los riesgos de datos pueden afectar seriamente el rendimiento Una primera solución para evitarlos consiste en producir paradas en el pipeline para satisfacer las dependencias de datos add $s0, $t0, $t1 # También aplica con lw sub $t2, $s0, $t3 Bubble (burbuja), pipeline stall (parada del pipe)

Lecturas recomendadas
Computer organization and design. The hardware/software Interface, 3rd ed., Chapter 6. D. Patterson & J. Hennessy. Morgan Kaufmann Publishers Computer architecture. A quantitative approach, 3rd ed., Appendix A. J Hennessy and D. Patterson. Morgan Kaufmann Publishers

Departamento de Ingeniería de Sistemas Universidad de Antioquia

Presentaciones similares

Presentación del tema: "Departamento de Ingeniería de Sistemas Universidad de Antioquia"— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback

Iniciar la sesión

Autorizarse a través de una red social:

Departamento de Ingeniería de Sistemas Universidad de Antioquia

Presentaciones similares

Presentación del tema: "Departamento de Ingeniería de Sistemas Universidad de Antioquia"— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback