瀏覽單個文章
flatmode
*停權中*
 

加入日期: Apr 2015
文章: 58
引用:
作者蘇族
Intel有設計一個大型微指令快取來加速小型的LOOP,但若LOOP的程式碼很大(解碼後的微指令數量超過微指令快取能儲存的空間),此一加速秘技好像就破功了


Loop Stream Detector, 從c2d時代就有了. 但是由於有了micro-op fusion跟macro-uop fusion基本上很難出現"但若LOOP的程式碼很大", 因為重複的code會被融合在一起, 況且c2d時代還加入了"shadow register architecture", 也就是至少兩組通用暫存器堆來應付這種outage. 當然不排除意外的可能所以nehalem時在renaming register(reorder buffer)外加了"physical register file"來應付可能的leak out. sandy bridge/haswell時更加入了雙"LSD buffer", "uop cache"跟"trace inter loop"所以根本上已經不可能會出現農企才會出的包.
舊 2015-09-21, 03:10 AM #14
回應時引用此文章
flatmode離線中