PCDVD數位科技討論區 - 瀏覽單個文章 - FX8350的浮點運算性能比想像中的好

引用:

作者蘇族

Intel有設計一個大型微指令快取來加速小型的LOOP，但若LOOP的程式碼很大(解碼後的微指令數量超過微指令快取能儲存的空間)，此一加速秘技好像就破功了

Loop Stream Detector, 從c2d時代就有了. 但是由於有了micro-op fusion跟macro-uop fusion基本上很難出現"但若LOOP的程式碼很大", 因為重複的code會被融合在一起, 況且c2d時代還加入了"shadow register architecture", 也就是至少兩組通用暫存器堆來應付這種outage. 當然不排除意外的可能所以nehalem時在renaming register(reorder buffer)外加了"physical register file"來應付可能的leak out. sandy bridge/haswell時更加入了雙"LSD buffer", "uop cache"跟"trace inter loop"所以根本上已經不可能會出現農企才會出的包.