好奇的去找了資料來看:
這篇講得最簡單
http://bitcoin.stackexchange.com/qu...er-than-nvidias
基本上,最大的原因是因為AMD的VLIW架構使得擁有較多的ALU-運算單元,頻率較低。
而nVidia的ALU比較驅近於CPU,所以一個ALU的單位面積較大也就不能塞太多ALU進去,而頻率較高。
第二個主因是挖擴用到的了int32 right rotation運算,而AMD剛好有一個指令可以符合需要。nVidia則需要2次shift再1次add才會完成動作(在Compute capacity 3.5有改進,也可以一次完成- 也就是780, Titan...)。
所以整個比起來,AMD在挖擴快了很多。
nVidia的ALU應該是塞了比較多的流程邏輯進去吧,對於流程控制的運算才會100%發揮。
這種存運算的就看ALU多了。