Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porRuy Casagrande Modificado hace 10 años
1
TARDPCurso 05/06 Prophet/Critic Hybrid Branch Prediction Ayose Falcón, Stark, Ramirez, Lai y Valero ISCA’04 Pablo Carazo Minguela – Junio/2006
2
TARDPResumenCurso 05/06 Híbrido ¿novedoso? Profeta Crítico pasado futuro Híbrido 8K+8K vs 16K 2Bc-gskew Reduce errores hasta un 39% Aumenta PC 7,8.. 18% Reduce PC leídas en un 8,6% Resultados BBB
3
TARDP3 ÍNDICE Introducción Trabajos relacionados Primera aproximación Filtrando el crítico Juntándolo todo Simulación Resultados Conclusiones
4
TARDPIntroducción4 Valdebernardo profeta crítico ??
5
TARDP5 ÍNDICE Introducción Trabajos relacionados Primera aproximación Filtrando el crítico Juntándolo todo Simulación Resultados Conclusiones
6
PredicAPredicB BHSR PC Selec | Fusión Híbrido bitFuturo TARDPTrabajos relacionados6 PredicAPredicB BHSR PC =? Salto1 Salto2 Sobre-escritura BHSR PC Predictor CT 0110 reduc Estimador Confianza BHSR’ Novedoso t PiCi
7
TARDP7 ÍNDICE Introducción Trabajos relacionados Primera aproximación Filtrando el crítico Juntándolo todo Simulación Resultados Conclusiones
8
TARDPPrimera aproximación8 Profeta Predicción LQRSTUVWXY P PC BHSR t QRSTUVWXYP Crítico Crítica BOR QRSTUWXYPV ¿Unos ciclos más tarde? UVWXYABCDP UVWXYABCDP Pasado Futuro P DCBA
9
¡Ojo! A B E H D C GF IJ TT TARDPPrimera aproximación (Un ejemplo)9 WXYZ Error => Crítico se entrena NOPQ ¿Esto es frecuente? + Interferencia …WXYZ …NOPQ PC ¡n*2 fallos! Sig (A, T) => Crítico (A,T) Profeta T Crítico T T T T ¿Cuánto?
10
TARDP Primera aproximación (Tasa de interferencias) 10 Chang, Evers y Patt (1996) gcc y gshare con 8K entradas Entradas con 32 interferencias o menos Entradas con 325 interferencias o más ¡ 325 interferencias de media ! 154.450.036 25.903.086 2.772.686 1.679.135 977.729 115.822 Instrucciones Bcc Interferencias Neutras Destructi. Constructi. 1.513.438 957.999 471.607 83.832 ¡Filtrado!
11
TARDP11 ÍNDICE Introducción Trabajos relacionados Primera aproximación Filtrando el crítico Juntándolo todo Simulación Resultados Conclusiones
12
BOR 1010101000 dirSalto Crítico predicc. TARDPFiltrando el Crítico12 El Profeta acierta ≈ 90..95% => El Crítico se centre en el otro 5..10% Filtro tag Hash =? AciertoCrítica FalloProfecía Falla Meter salto en el Crítico
13
TARDP13 ÍNDICE Introducción Trabajos relacionados Primera aproximación Filtrando el crítico Juntándolo todo Simulación Resultados Conclusiones
14
TARDPJuntándolo todo (I)14 Reinman, Austin y Calder (1999): Escalado de conexionesFront-End desacoplado FTQ L1 I-Cache Segmentada Decodi. Ejecución MUX sigPC sigBloque L1 FTB ultBloque miss [jump, jsr, rst] miss Bcc L2 FTBL2 I-Cache Profeta Crítico profeta crítico ??
15
Crítico TARDPJuntándolo todo (II)15 Profeta I-Cache & Fetch A FTQ ABC DEFGHIJKL B CDE F BOR 4 b futuro IHG Ideal: FTQ casi siempre bastante llena 2xCiclo 1xCiclo 6µOpxCiclo Bcc cada 13µOP Pega: No hay suficientes bits de futuroCon 8b 0,1% veces ¡ Usar los que haya ! ¿Crítico corrige predicción? Efecto limitado a la FTQ
16
TARDP16 ÍNDICE Introducción Trabajos relacionados Primera aproximación Filtrando el crítico Juntándolo todo Simulación Resultados Conclusiones
17
TARDPSimulación17 Micro tipo Pentium 4 * 2 3,8GHz; 6 OPC; L1I 64KB; L1D 32KB; L2 2MB; FTQ 32 Predictores utilizados: Gshare, 2Bc-gskew y Perceptron 108 bancos de pruebas: tpcc, premiere, msvc7, unzip, facerec, …
18
TARDP18 ÍNDICE Introducción Trabajos relacionados Primera aproximación Filtrando el crítico Juntándolo todo Simulación Resultados Conclusiones
19
TARDPResultados19 Importancia de los bits de futuro Precisión de la predicción Distribución de las críticas Productividad del conjunto
20
TARDPResultados (Importancia de los bits de futuro)20 Profeta: 8KB perceptron + Crítico: 8KB gshare etiquetado Unos pocos bits OKMás no rentables? ¿8 OK?
21
TARDPResultados (Precisión de la predicción)21 Mejoras: 25..31% Con 32KB parecido
22
TARDPResultados (Distribución de las críticas)22 ProCrí ProCrí ProCrí ProCrí ¿ Profeta + [Crítico] ? 3Bcc => 1 Crítico4Bcc => 1 Crítico Profeta 23 ¡ Acierta el 98,7% !
23
TARDPResultados (Productividad del conjunto)23
24
TARDP24 ÍNDICE Introducción Trabajos relacionados Primera aproximación Filtrando el crítico Juntándolo todo Simulación Resultados Conclusiones
25
TARDPConclusiones25 Híbrido 8K+8K vs 16K 2Bc-gskew Reduce errores hasta un 39% Aumenta PC 7,8.. 18% Reduce PC leídas en un 8,6% Resultados BBB Según los propios autores Needs fast hardware to compute prediction/mispredictions and refile the FTQ before branches consumed by I-Cache Large tag small coverage, small tag contention; Therefore it is not universal How to select branches to cover in the filtered critic FIN
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.