引用:
作者lzarconlony1
Pascal這次最大改變就是TPC 然後把單元開始拆小
如果說之前Kepler擅長一次處理大區塊
那這次就是可以好幾個一起處理大區塊+拆開處理小區塊
不過Warp好像有重新定義 沒有很注意看
|
???
Warp size沒變啊,從Fermi到現在都是32 threads
雖然變小有助於遇到branch/divergence時的performance penalty,不過前面scheduler的grouping policy應該可以避掉大部份的情況
至少目前沒看到n或a有要改這部份
要等Volta看有什麼大改變了