消息來源
NVIDIA創始人兼CEO黃仁勳於台北時間今日凌晨在GTC 2012大會上發表主題演講,光重大宣佈就有三四項,但其中最受關注GPU發展動態的用戶關注的還是Tesla K20的現身——Kepler架構的真正旗艦GK110終於來了。
此次黃仁勳通過講解Kepler架構新特性的方式引出了兩款產品——Tesla K10與Tesla K20,實際上三種特性中除SMX外均為GK110所獨有,包括加強GPU利用率減少輕載使用情況的Hyper-Q以及加強任務並行度的Dynamic Parallelism。
Hyper-Q
由於Kepler架構的改進,GK110可以讓最多32個CPU核心為單個GPU提供硬體工作隊列,相比之下上代Fermi旗艦GF110只有1個。多條硬體工作隊列可顯著提升小負載的執行效率。
Dynamic Parallelism
之前的GPU如GF110在執行Kernel(程式內核)時,每執行一個或者一組Kernel都需要與CPU互動一次,Kernel需要由CPU創建。而在GK110中Dynamic Parallelism使得GPU能自己在執行完Kernel後自行判定並創建下面的Kernel,減少了與CPU互動的頻率可節省時間,並提升GPU的計算效率。
GK110規格
實際上宣佈的兩款產品中,Tesla K10正是之前BSN爆料聲稱的GeForce GTX 690的Tesla版,並且目前已經上市。NVIDIA宣稱其具有3倍於上代Tesla旗艦M2090的單精度浮點計算能力——4.577T FLOPS,VRAM頻寬為320GB/s,單個GPU 160GB/s略小於GTX 690,VRAM為8GB GDDR5。
新產品基於GK110核心的Tesla K20目前NVIDIA官方只宣稱雙精度浮點約3倍於Tesla M2090,晶體管數量為71億個,將於2012年第四季進入市場。從核心圖上來看,GK110擁有15個SMX,也就是CUDA Core數量為192*15=2880個。但根據PCinlife管理員cho爆料,其中一組被遮蔽作為冗餘之用,上市產品CUDA Core數量為2688個,雙精度浮點計算能力為1.4-1.5T FLOPS左右。
而BSN在現場帶來的訊息是GK110核心整合384bit VRAM控制器,支援6GB、12GB和24GB VRAM,黃仁勳稱最終產品VRAM容量要取決於DRAM業界的進展,預計屆時Tesla K20的VRAM數量為12GB。功耗部分,據稱Tesla K20的輔助供電接口設計為6pin+8pin,TDP不超300W。至於GK110核心何時進入Quadro或者GeForce產品尚無相關消息。