PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   系統組件 (https://www.pcdvd.com.tw/forumdisplay.php?f=19)
-   -   FX8350的浮點運算性能比想像中的好 (https://www.pcdvd.com.tw/showthread.php?t=1087734)

limit555 2015-09-19 08:15 PM

挖 好帥 好像在開戰鬥機
從來沒想過這樣玩電腦

ps:我只會打電動看漂亮畫面 對什麼程式設計 硬體底層都不懂

蘇族 2015-09-20 07:17 AM

引用:
作者commando001
LOOP會造成執行效率低下我知道了,但是兩邊loop數量都是一樣的(同個程式)

Intel有設計一個大型微指令快取來加速小型的LOOP,但若LOOP的程式碼很大(解碼後的微指令數量超過微指令快取能儲存的空間),此一加速秘技好像就破功了

flatmode 2015-09-21 03:10 AM

引用:
作者蘇族
Intel有設計一個大型微指令快取來加速小型的LOOP,但若LOOP的程式碼很大(解碼後的微指令數量超過微指令快取能儲存的空間),此一加速秘技好像就破功了


Loop Stream Detector, 從c2d時代就有了. 但是由於有了micro-op fusion跟macro-uop fusion基本上很難出現"但若LOOP的程式碼很大", 因為重複的code會被融合在一起, 況且c2d時代還加入了"shadow register architecture", 也就是至少兩組通用暫存器堆來應付這種outage. 當然不排除意外的可能所以nehalem時在renaming register(reorder buffer)外加了"physical register file"來應付可能的leak out. sandy bridge/haswell時更加入了雙"LSD buffer", "uop cache"跟"trace inter loop"所以根本上已經不可能會出現農企才會出的包.


所有的時間均為GMT +8。 現在的時間是03:49 PM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。