PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 電腦硬體討論群組 > 顯示卡討論區
帳戶
密碼
 

回應
 
主題工具
ChungWhaCanon
Senior Member
 
ChungWhaCanon的大頭照
 

加入日期: Mar 2004
您的住址: 長沙
文章: 1,365
NVIDIA正式宣佈CUDA 6:支援統一尋址!

消息來源
NVIDIA今天正式宣佈了最新版並行計算開發工具CUDA 6,相比之前的CUDA 5.5有著革命性的巨大進步。

NVIDIA表示,CUDA 6可以讓並行編碼前所未有的輕鬆,能夠顯著節省開發人員的時間和精力,而通過GPU加速可帶來比CPU模式最多8倍的性能提升。

CUDA 6的關鍵新特性包括:

1、 統一尋址(Unified Memory):

可直接訪問CPU記憶體、GPU VRAM,無需在彼此之間手動拷貝數據,可在大量編碼語言中更簡單地添加GPU加速支援。

其實CUDA 4就開始支援統一虛擬尋址,x86 CPU、GPU記憶體池可在同一空間內進行尋址,但那僅僅是簡單的記憶體管理,擺脫不了手動數據轉移。

CUDA 6則在現有的記憶體池結構上增加了一個統一記憶體系統,程式設計師可以直接訪問任何記憶體/ VRAM資源,或者在合法的記憶體空間內尋址,而不用管涉及到的到底是記憶體還是 VRAM。

不過注意,CUDA 6並不是完全不需要數據拷貝,只不過將這個工作從程式設計師那裡接過來自動執行而已,它仍然受制於PCI-E的頻寬和延遲,因此和AMD hUMA異構統一尋址架構是不一樣的。

另外值得一提的是,NVIDIA之前已經宣佈下代GPU Maxwell將會支援統一虛擬記憶體,但它要到明年才會發佈。NVIDIA表示,他們找到了完全通過軟體執行統一記憶體的方法,所以就提前這麼做了,Maxwell則會有某種硬體層面的統一記憶體技術(或許性能更高),但具體細節還有待公佈。

2、 替換庫(Drop-in Libraries):

簡單地用GPU加速庫替換已有的CPU庫,BLAS(基礎線性代數程序集)、FFTW(快速傅立葉變換)計算即自動提速最多8倍。

3、 多GPU支援(Multi-GPU Scaling):

重新設計的BLAS、FFT GPU庫,單個節點可自動支援最多八顆GPU,雙精度浮點性能可超過9TFlops,並且支援最多512GB的更大負載。

此外,CUDA 6平台還會提供一整套的編碼工具、GPU加速數學庫、文檔和編碼指導。

CUDA 6目前只是紙面宣佈,2014年初才會開放下載。有需要的可註冊加入CUDA-GPU開發者項目。
     
      
__________________

Which one do you like to choose?
舊 2013-11-15, 01:15 PM #1
回應時引用此文章
ChungWhaCanon離線中  
ben_chien
Elite Member
 
ben_chien的大頭照
 

加入日期: Oct 2002
您的住址: 另一個地球
文章: 4,558
我只想知道跑F@H有沒有更快?
 
__________________
大家快來加入World Community Grid(BOINC for Android)與Folding@home(Folding@Home for Android)的行列,一同找出重大疾病(愛滋、癌症、帕金森氏症...等)的解決方案
[YOUTUBE]PPc7gsZIk24[/YOUTUBE]
網路果然很危險,動不動就會被告...
發現自己越來越痴漢了...
舊 2013-11-15, 04:41 PM #2
回應時引用此文章
ben_chien離線中  
Raziel
Elite Member
 
Raziel的大頭照
 

加入日期: Dec 2006
您的住址: Taipei
文章: 8,344
引用:
作者ben_chien
我只想知道跑F@H有沒有更快?

應該會, 大概也要新卡才能跑, 只是還得要史丹佛的團隊也寫出新版的F@H程式才行.
舊 2013-11-16, 08:51 AM #3
回應時引用此文章
Raziel離線中  
idleic2
Master Member
 

加入日期: Mar 2004
您的住址: 亞洲.台灣.台北
文章: 2,054
引用:
作者ChungWhaCanon
...
不過注意,CUDA 6並不是完全不需要數據拷貝,只不過將這個工作從程式設計師那裡接過來自動執行而已,它仍然受制於PCI-E的頻寬和延遲,因此和AMD hUMA異構統一尋址架構是不一樣的。
...


看起來只是簡化程式設計, 為將來的真正統一尋址做準備 !

引用:
作者ben_chien
我只想知道跑F@H有沒有更快?


應該不會耶 ! 因為還是要數據拷貝
舊 2013-11-20, 10:06 AM #4
回應時引用此文章
idleic2離線中  
megag5
*停權中*
 
megag5的大頭照
 

加入日期: Oct 2010
您的住址: 四季如夏的地方
文章: 2,596
這可以對抗HSA還是Mantle?
舊 2013-11-20, 10:29 AM #5
回應時引用此文章
megag5離線中  
我要開機啦
Advance Member
 

加入日期: Sep 2005
文章: 307
為什麼這種平行運算可以支援到4GPU以上
而遊戲就只能到4GPU,而且還要SLI模式
跑運算好像不需要裝SLI橋接卡就可以用了(網路上有人插4塊690)
舊 2013-11-20, 12:14 PM #6
回應時引用此文章
我要開機啦離線中  
ben_chien
Elite Member
 
ben_chien的大頭照
 

加入日期: Oct 2002
您的住址: 另一個地球
文章: 4,558
引用:
作者我要開機啦
為什麼這種平行運算可以支援到4GPU以上
而遊戲就只能到4GPU,而且還要SLI模式
跑運算好像不需要裝SLI橋接卡就可以用了(網路上有人插4塊690)

運算好像是一個核心算一個單元???(十個人同時被分配到做十個蛋糕,一人做一個)
遊戲是多個核心算同一個遊戲,所以比較難搞(十個女人要嘗試在一個月內生出一個小孩,現在是天方夜譚的,但將來天曉得能不能這樣搞... (喂 )
__________________
大家快來加入World Community Grid(BOINC for Android)與Folding@home(Folding@Home for Android)的行列,一同找出重大疾病(愛滋、癌症、帕金森氏症...等)的解決方案
[YOUTUBE]PPc7gsZIk24[/YOUTUBE]
網路果然很危險,動不動就會被告...
發現自己越來越痴漢了...
舊 2013-11-20, 01:01 PM #7
回應時引用此文章
ben_chien離線中  


回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是11:59 PM.


vBulletin Version 3.0.1
powered_by_vbulletin 2025。