瀏覽單個文章
giligula
Major Member
 

加入日期: Dec 2002
文章: 156
引用:
Originally posted by Artx1

NV3x是完全不同的理念. 要說起來NV3x整個實作性質上還比較接近3Dlabs P10.(Scalable Shader Array), 處理單元在晶片內部形成陣列, 高階晶片的Shader單元數量最多, 要出中階低階只要砍單元數量就好. 雖說P10當時主要的企圖是想透過compiler技術進一步提高管線執行效率, 當然NV3x因為有同樣性質的實作, 也具有同樣的優勢; 相對地, P10也有NV3x這樣可以很快部署高中低階產品的效果存在, 3Dlabs宣稱當初P10的簡化版P9的設計, 只花了兩個禮拜就搞定了, 架構設計可以說只做了一次, 成本管理上差距天差地遠,

反過來說, R8500 和 R9000 之間的差異並不大, 但是ATi可是幾乎從頭去刻這個晶片.... 搞著搞著可能ATi真的怕了, 現在 R300 和 R350之間沒啥差異, 只有整個晶片作徹底Custom Optimize, 不過花的功夫只怕旁人也難以想像. 總之R200時代帶來的反動就是現在傳聞R360和R390, 直到R420都是同樣的玩意兒不斷地在最佳化.... 直到 R500才會是新的架構. 只怕到時候ATi也開始玩nVIDIA/3Dlabs的這一套.

要強調的事情是, 暴力法是有極限的. 因為我們知道, 即使理論fillrate再高, 都會因為pipeline管線中其他地方造成瓶頸, 而無法實際發揮出來, 比如說即使是現在開始拋售的爛玩意兒, GF4Ti系列,即使是Ti4200都有4pipes x 250MHz = 1Gpixel/s, 這可是有辦法在1600x1200的解析度下跑出520FPS的鬼玩意兒; 更別提R9700啦, 那可是8pipe, FPS會破1K的.... 實際上呢? 我們知道, 瓶頸根本就不在那個地方; 那麼不如務實地追求Shader Performance還比較好不是嗎?

而且產品線的推展成本也變低了, 目前NV31Ultra最終版的時脈是400/800, 不管是fillrate和Memory Bandwidth都和NV30NU同等(1.6Gpixel/s & 12.8GB/s); 但是效能還是有差異. 因為內部的處理單元數量的確有差異, 架構本身已經等於考慮好產品區隔了, 能只做一次的事情就不應該做兩次.

只可惜, 現在根本就沒有啥DX9的遊戲, 甚至DX8的遊戲才剛開始普及, 隨便用個PS2.0的Shader就可以打著DX9遊戲的大旗了, NV3x這樣的架構在宣傳上實在是非常的不利, 看到ATi拿出"8pipes are for REAL.... 4 are a pipedream"字樣的T恤出來, nVIDIA的廣報部門當然是只能鬼扯了....

先不要提FP32和FP16環境上的問題, 即使12bit Int的品質之高令人驚艷, 連John Carmack大神都稱讚; 但是在宣傳上12bit Int一定是矮24bit FP一截, 偏偏就算是現行CRT也很難看出12bit Int與24bitFP的差異----目前市面上LCD目前頂多8bit, 256階, CRT則普遍可以顯示出約三百多階的色階差異, 但是12bit可是4096階.... 透過現行顯示週邊, 用肉眼看得出來才有鬼.

當初Beyond3D貼出3DMark03部分有問題截圖的時候, 有人指出可以"明顯看出"(apperently)因為用了FP16, 使得品質低於24bit的R300; 但是其實即使真的有差異, 因為CRT的限制, 肉眼也絕對看不出來; 除非你拿軟體去分析才會有結果, 肉眼則絕對看不出有差異.

那現在的這麼一大團烏煙瘴氣到底是什麼?

最主要的問題還是在於軟體方面. 像P10/NV3x這樣的架構效能維繫在Compiler Optimize, 塞給它傳統的 Shader 一定沒辦法發揮它的效能, 但是其實因為各種宣傳手法的關係, Optimize和Adaptec之類的字樣濫用得很厲害, 害消費者現在都搞不清楚了.

有些話恕刪了
就我認為
NV30 仍是一顆暴力的 GPU
500MHz 超高時脈
DDR II 記憶體
加上那顆超暴力風扇
很難將它歸類為精巧或聰明的 GPU
只能說他遇到了 R300 這顆比怪�**朁ヰ囿煽馱�

我不是來踢館
只是修正一下 A 大的某些話
A大應是講太快了一時語誤
floating point precision 主要不是用在顏色上
就算使用了 FP32
但是最後輸出的 DAC 也只有 10bit
那其他 22bit 照樣浪費
floating point 是應用在其他方面如 normal map 上
目前 8bit 的 normal map 的確有精確度不足的問題
造成 artifact 的存在
DOOM III 的 normal map 材質在設計之初就為 floating point precision 了

JC 並沒有說 12bit 就足夠
而是說並不是所有的情況下都需要用到高精確度
在某些情況下 12bit 就足夠
在某些是 FP16
少數需要用到 FP32
這和使用 pixel shader 2.0 的時機是一樣的
在 pixel shader 1.4 能夠做出很好的效果
又何必需要用到 2.0 呢
2.0 跟 1.4 的差別在可程式化的程度不同而已
如果 1.4 代表的是 Pentium 的指令集
那就能把 2.0 想成原先 Pentium 指令集加上 SSE 變成 Pentium III 指令集
這麼想就很容易理解(雖然這例子仍有許多不一樣的地方)
不是所有的程式都需要用到 SSE 吧
所以也不是所有像素都需要用到 2.0
同樣的
精度這種東西也是視情況而定
在效能與品質間取得平衡才是重要的
畢竟大家之前用 8bit precision 還不是用得很爽
不必出了個 floating point precision
就一窩蜂的趕流行

說實話
PS2.0 的能力
的確能做出許多貼近真實的質感
加上它只是 1.4 的擴充
所以 developer 接受它的速度會比一開始的 pixel shader 要來得快很多
像 Halo 的電腦版本已經有小部份用上 PS 2.0 了
舊 2003-06-13, 11:41 AM #57
回應時引用此文章
giligula離線中