PCDVD數位科技討論區 - AMD第一款Vega核心MI25加速卡發佈：搭載16GB HBM2 VRAM

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)

- 顯示卡討論區 (https://www.pcdvd.com.tw/forumdisplay.php?f=8)

- - AMD第一款Vega核心MI25加速卡發佈：搭載16GB HBM2 VRAM (https://www.pcdvd.com.tw/showthread.php?t=1118404)

「High Bandwidth Cache and Controller」

不過若是如傳聞說的頻寬512GB/s
那麼頻寬等同 Fiji 的 HBM Gen1

引用:

作者st202

http://pc.watch.impress.co.jp/img/pcw/docs/758/161/01_s.jpg
Google的「TensorFlow」也是標榜快速低精度
「Tensor Processing Unit(TPU)」
甚至不是完整的CPU

引用wiki

Tensor processing unit (TPU)

In May 2016 Google announced its tensor processing unit (TPU), a custom ASIC built specifically for machine learning and tailored for TensorFlow. The TPU is a programmable AI accelerator designed to provide high throughput of low-precision arithmetic (e.g., 8-bit), and oriented toward using or running models rather than training them. Google announced they had been running TPUs inside their data centers for more than a year, and have found them to deliver an order of magnitude better-optimized performance per watt for machine learning.[12]

Tensor Flow我不熟
但是HFT與金融體系要的可不只如此
只是這張卡出來是只賣tensorflow的準用戶?
tensorflow我看過台灣用戶跑的時候也是隨便拿張遊戲卡就跑的嚇嚇叫
AMD研發到最後只剩下跑低精度的深度學習? :shock: :shock: :shock:
ps:剛查一下tensor flow，精度可設定範圍很廣阿
真的有人拿8 bits來跑正式環境????

引用:

作者csshih

AMD「MI25」半精度25TFLOPS 單精度12.5TFLOPS 倍精度6.25TFLOPS

NVIDIA「Tesla P100」半精度21TFLOPS 單精度10.6TFLOPS 倍精度 5.3TFLOPS

:jolin: :jolin: :jolin:

「MI25」或許會用HBM2 不過如果是ECC模式容量頻寬會縮減
至於顯示卡容量確定8GB 頻寬則傳聞是512GB/s 可能是low cost HBM
市場區隔

引用:

作者st202

AMD「MI25」半精度25TFLOPS 單精度12.5TFLOPS 倍精度6.25TFLOPS

NVIDIA「Tesla P100」半精度21TFLOPS 單精度10.6TFLOPS 倍精度 5.3TFLOPS

:jolin: :jolin: :jolin:

你確定這張AMD的卡跑以下這幾各主流framework都有相同的實力與效果?
https://developer.nvidia.com/deep-learning-frameworks
我對AMD自己玩自己的framework沒興趣
因為不是市場主流在用
若AMD這張卡在上面那圖中的實力照樣打翻對手tesla
消費者會非常高興
因為採購議價，就會拿出來比，以後也不會被老闆刁難
若只是AMD拿自己寫的framework再喊爽
那就謝謝再連絡 :think:

引用:

作者st202

AMD「MI25」半精度25TFLOPS 單精度12.5TFLOPS 倍精度6.25TFLOPS

NVIDIA「Tesla P100」半精度21TFLOPS 單精度10.6TFLOPS 倍精度 5.3TFLOPS

:jolin: :jolin: :jolin:

我剛看了一下你舉的例子
tensor flow要吃cuDNN，或cuda toolkits
AMD的卡真吃的下去?你確定AMD的卡吃下去效能也是這樣?
https://www.tensorflow.org/get_started/os_setup

引用:

作者csshih

我剛看了一下你舉的例子
tensor flow要吃cuDNN，或cuda toolkits
AMD的卡真吃的下去?你確定AMD的卡吃下去效能也是這樣?
https://www.tensorflow.org/get_started/os_setup

沒人知道
不過要攻擊AMD 拿精度說事可把哭狗NV全拖下水了 :laugh: :laugh: :laugh:

引用:

作者st202

沒人知道
不過要攻擊AMD 拿精度說事可把哭狗NV全拖下水了 :laugh: :laugh: :laugh:

所以你不知道此精度下跑這些深度學習框架有沒有效?
跑分是一回事
在某特定框架下跑分又是另一回事
不知閣下分不分的出兩者的區別?

---------------------------------------------------
若放在PPT的漂亮數字在現實應用上根本無法達到
那這跑分只是到底具有何意義?

引用:

作者st202

沒人知道
不過要攻擊AMD 拿精度說事可把哭狗NV全拖下水了 :laugh: :laugh: :laugh:

NVidia的遊戲卡

基本上把除了FP32之外精度的通用計算能力

砍到渣都不剩

引用:

作者csshih

深度學習用在電腦視覺上 8bit 是適用的
RGB/YUV component 都是8bit.