Master Member
|
> 光看架構圖的話很難讓人覺得有20%提升
你可以從現有產品稍微看得出來 1 decode 跟 2decode 差多少
沒錯,已經有接近於steamroller 概念的現有產品 bobcat
或者應該換個方式說,steamroller 改成更接近於bobcat了
bulldozer,bobcat 是出至同樣概念不同走向的處理器,整數核心運算效率大致上相同
剩下的就是架構不同導致的效能損失,這方面主要就是落在decode跟fetch上
bobcat 每個核心都有自己的decode跟fetch
bulldozer 則是兩個整數核心共享一個decode跟fetch
這方面的不同讓bulldozer運算效率落後於bobcat 10% <-AMD 設計這兩個核心時的估計
如果當初(2011)Desktop上的CPU架構採取bobcat而不是bulldozer的話,不需要任何改良效率直接就提高10%
接下來的兩年(2012,2013)一年提高5%不算是太難
但畢竟最後還是採用bulldozer的共享機制,要把它改成bobcat那樣 就像上面所說的decode,fetch需要大改
大改通常需要兩年以上的時間,自然在這兩年的時間內 AMD不會把大量人力花費在大改前的架構上
所以piledriver 當然就是那副鳥樣 沒什麼太大改變
簡單的說steamroller 提高20%的由來 只是先把10%效能先撿回來
剩下來的10%則是因為piledriver 沒有長進造成的假象,但實際上這10%至少經過了兩年以上的持續開發
雖然20%看起來很誇張,在我來看這20%也只是AMD應該要達到的目標
|