PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   顯示卡討論區 (https://www.pcdvd.com.tw/forumdisplay.php?f=8)
-   -   AMD第一款Vega核心MI25加速卡發佈:搭載16GB HBM2 VRAM (https://www.pcdvd.com.tw/showthread.php?t=1118404)

st202 2016-12-19 02:02 AM



「High Bandwidth Cache and Controller」

不過若是如傳聞說的頻寬512GB/s
那麼頻寬等同 Fiji 的 HBM Gen1

csshih 2016-12-19 09:13 AM

引用:
作者st202
http://pc.watch.impress.co.jp/img/pcw/docs/758/161/01_s.jpg
Google的「TensorFlow」也是標榜快速低精度
「Tensor Processing Unit(TPU)」
甚至不是完整的CPU

引用wiki

Tensor processing unit (TPU)

In May 2016 Google announced its tensor processing unit (TPU), a custom ASIC built specifically for machine learning and tailored for TensorFlow. The TPU is a programmable AI accelerator designed to provide high throughput of low-precision arithmetic (e.g., 8-bit), and oriented toward using or running models rather than training them. Google announced they had been running TPUs inside their data centers for more than a year, and have found them to deliver an order of magnitude better-optimized performance per watt for machine learning.[12]


Tensor Flow我不熟
但是HFT與金融體系要的可不只如此
只是這張卡出來是只賣tensorflow的準用戶?
tensorflow我看過台灣用戶跑的時候也是隨便拿張遊戲卡就跑的嚇嚇叫
AMD研發到最後只剩下跑低精度的深度學習? :shock: :shock: :shock:
ps:剛查一下tensor flow,精度可設定範圍很廣阿
真的有人拿8 bits來跑正式環境????

st202 2016-12-19 09:56 AM

引用:
作者csshih
Tensor Flow我不熟
但是HFT與金融體系要的可不只如此
只是這張卡出來是只賣tensorflow的準用戶?
tensorflow我看過台灣用戶跑的時候也是隨便拿張遊戲卡就跑的嚇嚇叫
AMD研發到最後只剩下跑低精度的深度學習? :shock: :shock: :shock:
ps:剛查一下tensor flow,精度可設定範圍很廣阿
真的有人拿8 bits來跑正式環境????


AMD「MI25」半精度25TFLOPS 單精度12.5TFLOPS 倍精度6.25TFLOPS

NVIDIA「Tesla P100」半精度21TFLOPS 單精度10.6TFLOPS 倍精度 5.3TFLOPS

:jolin: :jolin: :jolin:

st202 2016-12-19 10:15 AM

「MI25」或許會用HBM2 不過如果是ECC模式 容量頻寬會縮減
至於顯示卡 容量確定8GB 頻寬則傳聞是512GB/s 可能是low cost HBM
市場區隔

csshih 2016-12-19 11:22 AM

引用:
作者st202
AMD「MI25」半精度25TFLOPS 單精度12.5TFLOPS 倍精度6.25TFLOPS

NVIDIA「Tesla P100」半精度21TFLOPS 單精度10.6TFLOPS 倍精度 5.3TFLOPS

:jolin: :jolin: :jolin:


你確定這張AMD的卡跑以下這幾各主流framework都有相同的實力與效果?
https://developer.nvidia.com/deep-learning-frameworks
我對AMD自己玩自己的framework沒興趣
因為不是市場主流在用
若AMD這張卡在上面那圖中的實力照樣打翻對手tesla
消費者會非常高興
因為採購議價,就會拿出來比,以後也不會被老闆刁難
若只是AMD拿自己寫的framework再喊爽
那就謝謝再連絡 :think:

csshih 2016-12-19 12:48 PM

引用:
作者st202
AMD「MI25」半精度25TFLOPS 單精度12.5TFLOPS 倍精度6.25TFLOPS

NVIDIA「Tesla P100」半精度21TFLOPS 單精度10.6TFLOPS 倍精度 5.3TFLOPS

:jolin: :jolin: :jolin:


我剛看了一下你舉的例子
tensor flow要吃cuDNN,或cuda toolkits
AMD的卡真吃的下去?你確定AMD的卡吃下去效能也是這樣?
https://www.tensorflow.org/get_started/os_setup

st202 2016-12-19 12:53 PM

引用:
作者csshih
我剛看了一下你舉的例子
tensor flow要吃cuDNN,或cuda toolkits
AMD的卡真吃的下去?你確定AMD的卡吃下去效能也是這樣?
https://www.tensorflow.org/get_started/os_setup

沒人知道
不過要攻擊AMD 拿精度說事 可把哭狗NV全拖下水了 :laugh: :laugh: :laugh:

csshih 2016-12-19 01:56 PM

引用:
作者st202
沒人知道
不過要攻擊AMD 拿精度說事 可把哭狗NV全拖下水了 :laugh: :laugh: :laugh:


所以你不知道此精度下跑這些深度學習框架有沒有效?
跑分是一回事
在某特定框架下跑分又是另一回事
不知閣下分不分的出兩者的區別?

---------------------------------------------------
若放在PPT的漂亮數字在現實應用上根本無法達到
那這跑分只是到底具有何意義?

ExtremeTech 2016-12-19 03:49 PM

引用:
作者st202
沒人知道
不過要攻擊AMD 拿精度說事 可把哭狗NV全拖下水了 :laugh: :laugh: :laugh:


NVidia的遊戲卡

基本上把除了FP32之外精度的通用計算能力

砍到渣都不剩

Xforce 2017-02-03 12:33 PM

引用:
作者csshih
Tensor Flow我不熟
但是HFT與金融體系要的可不只如此
只是這張卡出來是只賣tensorflow的準用戶?
tensorflow我看過台灣用戶跑的時候也是隨便拿張遊戲卡就跑的嚇嚇叫
AMD研發到最後只剩下跑低精度的深度學習? :shock: :shock: :shock:
ps:剛查一下tensor flow,精度可設定範圍很廣阿
真的有人拿8 bits來跑正式環境????

深度學習用在電腦視覺上 8bit 是適用的
RGB/YUV component 都是8bit.


所有的時間均為GMT +8。 現在的時間是01:35 AM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。