Ejercicio 5.6 sobre cachés

Slides:



Advertisements
Presentaciones similares
Hardware. Definición Equipamiento de las computadoras y de las redes consistente en transistores, tarjetas de circuitos,cableados, conexiones, unidades.
Advertisements

Memoria Cache.
Arquitectura de Computadores
Capítulo 4. Microprocesadres
Memoria Otros temas sobre cachés. Universidad de SonoraArquitectura de Computadoras2 Otros temas 1. Estrategias de búsqueda de bloque. 2. Estrategias.
La unidad central de procesamiento o CPU
Procesamiento paralelo
Gustavo Andrés Uribe Gómez
Memoria Cachés. Universidad de SonoraArquitectura de Computadoras2 Introducción Caché es el nivel de memoria situada entre el procesador y la memoria.
Memoria Introducción.
ARQUITECTURA DE COMPUTADORES Semestre A-2009 Clase 20 La mayor parte del contenido de estas láminas, ha sido extraído del libro Computer Organization and.
INTRODUCCIÓN El rendimiento, costo de compra y costo de operación forman la base para la toma de decisiones, sobre que PC es mejor que otra y así adquirir.
Rendimiento de la CPU y sus factores
Rendimiento y/o desempeño.. RENDIMIENTO “El computador A es más rápido que el computador B” Como se determina el rendimiento de un computador para: El.
Principio unidad 1.
UNIDAD 1. ORGANIZACIÓN BÁSICA Y DISEÑO DEL COMPUTADOR
Arquitectura de Computadores Clase 18 Memoria Caché: Fundamentos IIC 2342 Semestre Rubén Mitnik Pontificia Universidad Católica de Chile Escuela.
ARQUITECTURA DE COMPUTADORES ESCUELA: NOMBRES: Escuela de Ciencias de la Computación Ing. Greyson Alberca P. BIMESTRE: Primero.
César Gómez Martín Supercomputación “El alma está en el cerebro”
POTENCIAS 1. Multiplicación de Potencias de Igual Base y Distinto Exponente 2. Multiplicación de Potencias de Distinta Base e Igual Exponente 3. División.
Comprando un Computador
Memoria Cachés.
BOARD O TARJETA MADRE. EXPOSICION DE INFORMATICA TEMA 1: BOARD TIPOS DE PROCESADOR BUS PUERTOS MEMORIA NUEVAS TECNOLOGIAS.
Organización de computadoras
ARQUITECTURA BÁSICA DE UN ORDENADOR
Procesadores superescalares
Pipelining Peligros de control.
SISTEMAS DE E/S Es la colección de interfaces que usan las distintas unidades funcionales de un sistema de procesamiento de información para comunicarse.
IDENTIFICACIÓN Y CARACTERÍSTICAS DE MEMORIA RAM Y ROM
El procesador Diseño del control.
Ley de Amdahl.
Memoria Rendimiento del caché.
UNIDAD CENTRAL DE PROCESO CPU.
Superescalares Scheduling estático.
Pipelining Datapath y control.
Datapath para las instrucciones aritméticas y lógicas
Datapath para las instrucciones de brinco
Memoria Introducción.
Pipelining Peligros (hazards).
Datapath para las instrucciones de carga y almacenamiento (load/store)
Yecenia Bernal Profesor: Nelson
Otros temas sobre cachés
Diferencias entre las arquitecturas de 64 bits de AMD e intel.
EL Procesador. República bolivariana de Venezuela.
Organización del Computador
Organización del caché
Creando un solo datapath
Memoria virtual.
Memoria virtual.
Pipelining Introducción.
EXPOSICIONES Preparar una exposición de acuerdo al tema asignado
UD1 (PARTE 2: NUMERACIÓN)
MEMORIA RAM.
 La cuestión de la cantidad es simple, cuanto más memoria haya disponible, más podrá utilizarse. La velocidad óptima para la memoria es la velocidad.
Pipeline: Peligros de datos
Scheduling dinámico: algoritmo de Tomasulo
Pipelining Peligros de control.
Botón de encendido A Computadora C Chipset B Dispositivos de procesamiento de datos D.
1 TEMA 2: Organización de computadores Procesadores Memorias Dispositivos de E/S.
Funciones: Manejar todas las operaciones de acceso, lectura y escritura a cada una de las posiciones de la memoria principal donde se almacenan las instrucciones.
Unidad de disquetes Unidad cd Monitor Teclado Impresora Mouse “Partes externas de una computadora”
UNIVERSIDAD NACIONAL JORGE BASADRE GROHMANN
El procesador Datapath y control.
Memoria Cachés.
Otros temas sobre cachés
Universidad Técnica De Manabí Facultad De Ciencias Informáticas Departamento De Informática Y Electrónica Trabajo de investigación grupal Tema: Arquitectura.
Memoria Cachés. Universidad de SonoraArquitectura de Computadoras2 Introducción Caché es el nivel de memoria situada entre el procesador y la memoria.
Organización del caché
Memoria Rendimiento del caché.
Pipelining Peligros de control.
Transcripción de la presentación:

Ejercicio 5.6 sobre cachés Memoria Ejercicio 5.6 sobre cachés

Ejemplo Ejercicio 5.6 de COD 5 (p. 487) Suponer lo siguiente: El acceso a la memoria principal es de 70 ns. Las instrucciones de memoria son el 36%. Hay dos CPUs, P1 y P2, que tienen un nivel de caché unificado, L1, con los siguientes datos: Universidad de Sonora Arquitectura de Computadoras

Ejemplo Pregunta 1: Suponiendo que el tiempo de éxito (hit time) determina el tamaño del ciclo de P1 y P2, ¿cuáles son sus respectivas velocidades de reloj? V1 = 1 / 0.66 ns = 1.52 GHz. V2 = 1 / 0.9 ns = 1.1 GHz Nota: cuidado con las unidades. Universidad de Sonora Arquitectura de Computadoras

Ejemplo Pregunta 2: ¿Cuál es el AMAT de P1 y P2? AMAT = tiempo de éxito + tasa de fallas x castigo por falla Se necesita calcular el castigo por falla. Castigo por falla = Tiempo de acceso a memoria / Periodo Para P1: Castigo por falla = 70 ns / 0.66 ns/ciclo = 106 ciclos AMAT = 1 ciclo + 0.08 x 106 ciclos = 9.48 ciclos AMAT = 9.48 ciclos x 0.66 ns/ciclo = 6.26 ns Universidad de Sonora Arquitectura de Computadoras

Ejemplo Para P2: Castigo por falla = 70 ns / 0.9 ns/ciclo = 78 ciclos AMAT = 1 ciclo + 0.06 x 78 ciclos = 5.68 ciclos AMAT = 5.68 ciclos x 0.9 ns/ciclo = 5.11 ns Universidad de Sonora Arquitectura de Computadoras

CPI total = CPI base + ciclos de detención por memoria Ejemplo Pregunta 3: Suponiendo un CPI de 1.0 sin detenciones de memoria, ¿cuál es el CPI total de P1 y P2? ¿Qué CPU es más rápida y en cuánto? CPI total = CPI base + ciclos de detención por memoria Ciclos de detención por memoria = accesos a la memoria x tasa de fallas x castigo por falla Universidad de Sonora Arquitectura de Computadoras

Ejemplo Para P1 los ciclos de detención por memoria son: 0.36 x I x 0.08 x 106 ciclos = 3.05 x I ciclos CPI total = 1 + 3.05 = 4.05 Para P2 los ciclos de detención por memoria son: 0.36 x I x 0.06 x 78 ciclos = 1.68 x I ciclos CPI total = 1 + 1.68 = 2.68 Universidad de Sonora Arquitectura de Computadoras

Ejemplo Se calcula el tiempo de CPU usando: T = I x CPI x P Tiempo de CPU de P1: T = I x 4.05 x 0.66 = 2.67 x I Tiempo de CPU de P2: T = I x 2.68 x 0.9 = 2.41 x I Speedup 2.67 x I / 2.41 x I = 1.11 Conclusión: P2 es más rápida en 11% Universidad de Sonora Arquitectura de Computadoras

Ejemplo Pregunta 4: ¿Cuál es el AMAT de P1 si se le agrega un caché secundario, L2? ¿El AMAT es mejor o peor que el de P2? Nota: la tasa de fallas debería ser 5%. Universidad de Sonora Arquitectura de Computadoras

Ejemplo Se usa la fórmula: AMAT = tiempo de éxito L1 + tasa de fallas L1 x (tiempo de éxito L2 + tasa de fallas L2 x castigo por falla) AMAT = 0.66 ns + 0.08 x (5.62 ns + 0.05 x 70 ns) AMAT = 1.39 ns Conclusión: es mejor que el AMAT anterior de P1 (6.26 ns) y el de P2 (5.11 ns). Universidad de Sonora Arquitectura de Computadoras

Ejemplo Pregunta 5: Suponiendo un CPI de 1.0 sin detenciones de memoria, ¿cuál es el CPI de P1 con la adición del caché L2? Castigo por falla a L2 = 5.62 / 0.66 = 8.5 ciclos CPI = 1 + 0.36 x [0.08 x (5.62 / 0.66) + 0.05 x (70 / 0.66)] CPI = 3.15 Universidad de Sonora Arquitectura de Computadoras

Ejemplo Pregunta 6: ¿Qué procesador es más rápido ahora que P1 tiene 2 niveles de caché? Si P1 es más rápido, ¿qué tasa de fallas debe tener P2 en su caché L1 para igualar el rendimiento de P1? Si P2 es más rápido, ¿qué tasa de fallas debe tener P1 en su caché L1 para igualar el rendimiento de P2? Universidad de Sonora Arquitectura de Computadoras

Ejemplo Tiempo de CPU de P1: T = I x 3.15 x 0.66 = 2.08 x I Tiempo de CPU de P2 (el mismo de antes): T = I x 2.68 x 0.9 = 2.41 x I Speedup = 2.41 x I / 2.08 x I = 1.16 Conclusión: ahora P1 es más rápido 16% Universidad de Sonora Arquitectura de Computadoras

Ejemplo Para que P2 iguale el rendimiento de P1: T P1 = I x 3.15 x 0.66 = 2.08 x I T P2 = I x 2.68 x 0.9 = 2.41 x I CPI P2 = 1.0 + 0.36 x 0.06 x 78 ciclos = 2.68 T P2 = I x (1.0 + 0.36 x 0.06 x 78) x 0.9 Se igualan los dos tiempos y la tasa de fallas de P2 es ahora una incógnita. I x (1.0 + 0.36 x MR x 78) x 0.9 = 2.08 x I MR = 0.467 = 4.67% Universidad de Sonora Arquitectura de Computadoras