瀏覽單個文章
commando001
Master Member
 
commando001的大頭照
 

加入日期: Nov 2010
文章: 2,414
FX8350的浮點運算性能比想像中的好

簡單來說事情是這樣

我寫了一個FEM的程式,本來是單緒的

計算瓶頸主要在LU分解(大概整個流程有90%的時間在LU分解)

最近我找到了多執行緒LU分解的方法,所以改寫程式讓程式可以多執行緒LU分解

測試一下3570可以跑3570單緒的3.2倍快,雖然跟預想有落差,但只更改少少的程式碼就有這樣的成果也不錯

然後無聊測一下FX8350的多執行緒狀況,想說FX8350只有4個浮點運算器,又比3570弱,所以應該比3570更花時間

...結果FX8350多緒跑的速度大概是3570單緒的4.8倍快,也就是說讓FX8350全速跑比3570全速跑快50%左右

後來在想會不會是因為我的程式中浮點數精度設定是double(64bit)

對推土機架構來說浮點數精度來到256bit時浮點運算器才是算4個

對128bit以下的浮點數其實還是算8個浮點運算器?

所以沒有模塊中兩個核心爭奪浮點運算資源的問題?

不過程式中沒有改成多執行緒的地方FX8350明顯比3570慢就是了
     
      
__________________
新。弱弱的戰績
舊 2015-09-18, 08:30 PM #1
回應時引用此文章
commando001離線中