PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 電腦硬體討論群組 > 效能極限
帳戶
密碼
 

  回應
 
主題工具
bureia
Golden Member
 

加入日期: Dec 2001
文章: 2,875
引用:
作者dox6
因為處理器核心數量一直增加,但是程式的平行化卻很慢
加上很多程序也無法平行化,所以我們設計一個看似很強大的Virtual Core
背後是用好幾個實體的core來支撐他

問題在於要人寫平行化的程式都很難了,
叫CPU自己做會比較容易嗎?

而且前面有提到了,如果能聰明調度多核CPU資源的話,
在OS跟Compiler就能做了
     
      

此文章於 2015-10-05 08:04 PM 被 bureia 編輯.
舊 2015-10-05, 08:02 PM #11
回應時引用此文章
bureia離線中  
vampire
Advance Member
 

加入日期: Jun 2013
文章: 416
這就跟永動機一樣 都是騙人的東西

不管是理論上 實際上都不可能辦到

用來騙騙不懂的人而已

"再多的多核心 都不可能合併成一個加速單線程運行"

即使像openmp 這種簡易的多線程分配方式, 仍然必須由寫程序的人去避免多工記憶體寫入錯亂的問題
 
舊 2015-10-05, 09:10 PM #12
回應時引用此文章
vampire離線中  
anomaly
Advance Member
 

加入日期: Feb 2003
文章: 406
不是不能做, 只是很難

他們想達成的東西類似以下, 以前都是mainframe在做的事情.
https://en.wikipedia.org/wiki/Specu..._multithreading

IBM日本有做一些研究, 好玩的是用Haswell做
http://researcher.ibm.com/researche...14_TLSonHTM.pdf

用 Haswell是因為有支援硬體Transactional memory, 也加入了自己的程式搭配.
https://en.wikipedia.org/wiki/Transactional_memory

Haswell的Transactional Memory 是透過 TSX達成(但後來有BUG, 被microcode更新關閉, 目前好像只有Skylake的TSX是沒有bug的)
https://en.wikipedia.org/wiki/Trans...tion_Extensions

IBM日本研究人員的結論, SPEC CPU2006有11%進步, 但其他情況因記憶體衝突, 導致效能低落. 未來還需要一大堆功能輔助才能達成, 最後一句也有列出需要達到什麼.

引用:
We manually modified potentially parallel benchmarks in SPEC CPU2006 for thread-level speculation. Our experimental results showed that thread-level speculation resulted in up to an 11% speed-up even without the advanced optimization facilities, but actually degraded the performance in most cases.

In contrast to our expectations, the main reason for the performance loss was not the lack of hardware support for ordered transactions but the transaction aborts due to memory conflicts. Our investigation suggests that future hardware should support not only ordered transactions but also memory data forwarding, data synchronization, multi-version cache, and word-level conflict detection for thread-level speculation.
舊 2015-10-05, 11:10 PM #13
回應時引用此文章
anomaly離線中  
idleic2
Master Member
 

加入日期: Mar 2004
您的住址: 亞洲.台灣.台北
文章: 2,054
Intel Skylake 單執行緒效能爆表,疑似具備逆超執行緒功能
http://www.techbang.com/posts/25299...thread-function

soft machines visc ppt
http://www.softmachines.com/wp-cont...Briefing-vF.pdf

對我來說, 1VC(2C) 1.8x 1VC(4C) 2.2x
代表有其極限, 最佳狀況是 1VC(2C)

在 程式無法 multithread 的情況下,
可以用 2Core 模擬 1 Core 得到 近兩倍的效能 !

可是 程式若改 multithread 的情況下, (改的好, 且 情況適合)
還是 multithread 好過 single thread
舊 2015-10-05, 11:19 PM #14
回應時引用此文章
idleic2離線中  
vampire
Advance Member
 

加入日期: Jun 2013
文章: 416
引用:
作者anomaly
不是不能做, 只是很難

他們想達成的東西類似以下, 以前都是mainframe在做的事情.
https://en.wikipedia.org/wiki/Specu..._multithreading

IBM日本有做一些研究, 好玩的是用Haswell做
http://researcher.ibm.com/researche...14_TLSonHTM.pdf

用 Haswell是因為有支援硬體Transactional memory, 也加入了自己的程式搭配.
https://en.wikipedia.org/wiki/Transactional_memory

Haswell的Transactional Memory 是透過 TSX達成(但後來有BUG, 被microcode更新關閉, 目前好像只有Skylake的TSX是沒有bug的)
https://en.wikipedia.org/wiki/Trans...tion_Extensions

IBM日本研究人員的結論, SPEC CPU2006有11%進步, 但其他情況因記憶體衝突, 導致效能低落. 未來還需要一大堆功能輔助才能達成, 最後一句也有列出需要達到什麼.



說到底 這只不過是原本的程序 具有記憶體獨立跟計算獨立性質做出的取巧罷了

根本就沒有意義

for前端加一行openmp的前置 4核心效能馬上快3倍, 又何必用到這個?
舊 2015-10-05, 11:27 PM #15
回應時引用此文章
vampire離線中  
vampire
Advance Member
 

加入日期: Jun 2013
文章: 416
真有本事 就拿來算pi
如果這能加速3% 我可以接受他真的有用
舊 2015-10-05, 11:33 PM #16
回應時引用此文章
vampire離線中  
anomaly
Advance Member
 

加入日期: Feb 2003
文章: 406
引用:
作者idleic2
Intel Skylake 單執行緒效能爆表,疑似具備逆超執行緒功能
http://www.techbang.com/posts/25299...thread-function


Skylake絕對沒有逆超執行緒功能

當初報告這個新聞的編輯去了IDF 2015回來以後就確認沒這回事. 效能是靠CPU硬體進步來的.
http://www.heise.de/newsticker/meld...ur-2784862.html

引用:
作者vampire
說到底 這只不過是原本的程序 具有記憶體獨立跟計算獨立性質做出的取巧罷了

根本就沒有意義

for前端加一行openmp的前置 4核心效能馬上快3倍, 又何必用到這個?


小弟敢說多數寫程式的人沒有能力分析硬體架構/資源, 然後再從硬體去生出一個軟體架構以及配套的演算法, 做到有效率的結合. 搞過嵌入式系統或FPGA的人會比較有機會, 但若只寫過電腦或者手機程式的人不會有那個sense. 若硬體能做到一個黑盒子是最好不過了, 寫軟體的人只要負責把寫軟體的事情做好即可. 早期的CPU沒有Branch Prediction, 但現在幾乎所有CPU都有. Branch prediction對寫軟體的人是完全透明的, 所有人都受益, 要用軟體來模擬Branch Prediction也可以, 但沒有人會那麼做.
舊 2015-10-06, 12:12 AM #17
回應時引用此文章
anomaly離線中  
deanhu
Major Member
 

加入日期: Nov 2001
文章: 200
如果說量子電腦已經成功商業化的話,還比較可信些。只憑一些硬體/軟體上的排列組合,就可以提升一倍以上的性能,那諾貝爾獎應該是囊中物了。
舊 2015-10-06, 10:03 AM #18
回應時引用此文章
deanhu離線中  
limit555
Senior Member
 

加入日期: Jul 2012
文章: 1,103
聽得物颯颯 我完全外行
反正有本事只管闖

市場 價格自然會說話
舊 2015-10-06, 10:35 AM #19
回應時引用此文章
limit555離線中  
foxj
Advance Member
 

加入日期: Sep 2004
您的住址: 鳥不生蛋的工廠
文章: 460
外行人看完的結論, 這只是一個執行序優化&分散式運算的架構吧
1.一個VC 占據2core 然後跑單執行緒說比別人1core 效能好
2.一個VC 跟1core 有相同效能下, 一個VC 功耗會只有1core 的1/3~1/4, 這也是廢話, 1core 效能要追上2core, 這不加壓升頻哪追得上, 又功耗怎會好看

PS: 看過13樓的PDF page13, 所謂的1/3~1/4功耗比及1.7~2,2倍效能比, 是跟 "1C App CPU"比較, 根據page10 這個1C App CPU 指的可能是Apple A7 1C
__________________
amazing şaşırtıcı مدهش զարմանալի valehedici дзіўны удивителен increïble nevjerojatan úžasný forbløffende hämmastav hämmästyttävä étonnant sorprendente გასაოცარი erstaunlich καταπληκτικό etonan מדהים अद्भुत elképesztő ótrúlegt menakjubkan iontach stupefacente 素晴らしい 놀라워 mirum pārsteidzošs nuostabus неверојатно menakjubkan aqwa fantastisk شگفت انگیز surpreendente uimitor удивительный невероватна ajabu น่าอัศจรรย์ şaşırtıcı дивовижний حیرت انگیز tuyệt vời anhygoel אַמייזינג 了不起
舊 2015-10-06, 12:47 PM #20
回應時引用此文章
foxj離線中  


    回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是06:39 PM.


vBulletin Version 3.0.1
powered_by_vbulletin 2024。