NVIDIA又被逮到作弊了(這次是Texture Filtering作弊)

Artx1

Master Member

加入日期: Jun 2002

您的住址: 耗電量頗高的地方.

文章: 1,959

(2-2)

>2. 走向對應Shader3.0與PCI-Express 16x之路

Q: MS已經發表了次世代的Shader 3.0. 雖說FX已經加入了部分Shader 3.0的功能, 但是在Shader3.0中, Vertex Shader將加入Texture Access的能力. 到時候Shader 3.0的對應會怎樣呢?

K: 我們會完整支援PS3.0與VS3.0的. 等時機一到, 整條產品線(Top to Bottom)都會全面支援的吧.

Q: ATi 方面宣稱, 明年的GDC上Shader3.0就會成真, nVIDIA則是?

K: Shader3.0本身已經定義為DX9.1了. 所以我們早就摸得很清楚, 並一年前就開始著手了.

Q: 所以說, 會是NV40?

K: 八成.(笑)

Q: GeForceFX支援了MPEG-2的編碼. 這個是靠Shader Program來進行的嗎.

K: Pixel Shader的程式不論編碼與解碼都支援(譯註: 並非指出GeForce FX靠Shader Program來支援, 原因是FX仍有VPE支援). 到時人人都能靠GPU做DVR(數位錄影), Time Shifting(時光平移)與Authering(壓製定規片)吧.

Q: 還有能雙向大頻寬的PCI-Express 16x, 促使GPU朝這個方向前進.

K: 沒錯. 會使用到影像輸入輸出的雙向頻寬.

Q: 那加入支援會和Intel的晶片同時期嗎?

K: 還沒有發表. 不過到時候應該也會全產品線支援吧.

Q: GPU的像素輸出性能, 被限制在解析度和記憶體技術. 但是GPU的處理性能還在不斷地提升. 未來的GPU會不會變成Shader處理能力反而大過了Pixel的輸出能力呢. (譯註: FX已經這樣了)

K: 我是這麼覺得沒錯. 未來會有更多劇院品質的Shader登場吧. 到時候出自劇院而帶有強烈真實感的Shader, 會能夠能夠原封不動地放到GPU去執行吧. 而那需要的是32bit的精確度與大量的operation, 比如說動畫"Finding to Nemo(海洋總動員?)"那樣, 螢幕上的每個像素都經過了幾百幾千個Shader operation. 將來我希望GPU不僅能執行遊戲, 甚至能直接(即時操作, 指的是任意變換觀賞視點地)觀看CG動畫.

2003-06-14, 09:42 PM #81

Artx1

Master Member

加入日期: Jun 2002

您的住址: 耗電量頗高的地方.

文章: 1,959

(2-3)

>3. 對高次曲面的支援慎重處理

Q: 有沒有打算支援Perhelia的Adaptive Tessellator(適應性切割)嗎?

K: 是有關Adaptive sub-division(適應性次平面切割)的事情嗎? 未來的產品會怎樣恕我不予置評, 不過以我的個人意見來說, 這樣的技術對developer我不認為很實用. 其中一個原因是sub-division的控制developer是使不上力的(任由GPU看狀況運算), 很難正確地確定幾何資訊(長啥樣子). 如果沒有完整的建模技術做後盾, 只怕接受度不高.

遊戲的畫面品質已經提高到了很高的境界, 隨時都進行著反鋸齒, 進行著高品質的材質filtering, 也使用著複雜而有趣的Pixel Shader. 在這種狀況下設計遊戲, 很難接受多邊形間有接縫吧.

所以說我也覺得cube-surface與sub-division總有一天會佔重要地位的, 但是, 那是要等我們能真正精確地控制的時候再說.

Q: 與Matrox與ATi不同的見解啊.

K: 的確如此.

Q: 那NURBS之類的高次曲面呢?

K: 我不認為NURBS是個好解決方案. NURBS是個很老的技術, 而且也很難在硬體上實作. 我在20年前曾經以軟體實作過NURBS, 但是那演算法實在非常複雜.

我會希望有更直接一點的方法. 我就覺得sub-division Surfave是個不錯的點子, 對開發人員而言比較好處理, Authering process也容易得多.

比如說, 臉部表情之類的動畫, 如果透過sub-division surface來作的話, 只要能夠維持好surface-path, 靠對幾個控制點的操作就可以將(整張臉)一起動畫化; 但是如果是NURBS之類沒有控制點的技術的話, 就只好每個frame依次一小塊一小塊地整張慢慢編輯才成. 非常費工夫.

Q: 這是指GPU不適合實作NURBS之類的技術嗎?

K: 因為硬體實作困難, (對GPU而言)顯然是個bad choise, 而且對開發者也是個麻煩. 相對地sub-division(對上列雙方而言)就都輕鬆多了.

所以, 長期來說, 硬體會支援的高次曲面, 我覺得會朝向sub-division這個方向前進.

(譯: 有趣的地方是, SONY在PSP和PS3上頭都預計採用NURBS.... 當然我們知道SONY在3D還算是新同學....)

2003-06-14, 09:43 PM #82

Artx1

Master Member

加入日期: Jun 2002

您的住址: 耗電量頗高的地方.

文章: 1,959

(2-4)

>4. 所有的GPU都是移動版

Q: NVIDIA選上IBM為製作夥伴. 並且聽說5600的後繼NV36會交給IBM製造. 為什麼除了TSMC還又與IBM結盟呢?

K: 第一, TSMC與NVIDIA之間沒有任何問題. 我們與TSMC的關係非常好, 接下來也會繼續維持良好的合作; 但是我們的業務在擴展, 也應該要開始該把雞蛋分開放了. 所以我們選上IBM當第二代工廠. 我們要的是有經濟實惠的, 有未來性的生產資源. IBM手頭上有著出色的技術.

Q: 聽說TSMC製造的處理器沒有使用到low-k, NV35有用到low-k嗎?

K: 我們沒發表過這方面的相關消息. (譯: 不置可否? 但是沒回答)

Q: 今年2月的IDF的時候, ATi的presentation提出2006年的GPU耗電量會超過80W, 您的意見是?

K: 雖然有這個可能, 但是預測未來還是有其難度的. 因為變因並不只一個. 我們移轉到先進製程之後, 電壓也下降了, 晶片面積也縮小了, 每個電晶體各自的發熱量都降低了. 但是相對地, 我們的晶片也越來越大了. 計算總耗電量要考慮運作頻率, 電晶體數與各電晶體分別的耗電量. 彼此之間有增也有減.

Q: 現在的行動版GPU大多是桌面用版本的低電壓版, 但是現在CPU市場已經開始移轉到針對行動市場設計的Pentium M上頭來了. 那會出現針對行動市場的GPU嗎?

K: 要節約電力並非是專屬於行動市場的課題. 我也覺得桌面市場同樣應該要設法節約電力. 這樣一來能節約能源也能減少發熱與噪音. 總之, 並不是只開發省電技術給行動市場使用, 在桌面產品也理應有需要. 所以, 以後的方向應該會是所有的產品都具備(省電的)相應功能吧.

Q: 其他對手年終就要動用0.11um了, NVIDIA呢?

K: 這種事情就是等著瞧(wait and see)嘍.

Q: 我們一直都在等(waiting)啊.

K: 所以, 也都看得出來接下來八成會如何了吧. 對不對? (笑)

----
以上拙作, 請多多指教.

2003-06-14, 09:45 PM #83

giligula

Major Member

加入日期: Dec 2002

文章: 156

引用:

Originally posted by Artx1
well, 其實我覺得這句話有兩個問題.

1. 晶片發熱量高和它設計精巧與否沒有頗直接的關聯
我這樣講好了, 如果以R300的架構實作32bit內部精確度, 估計是一億五千萬以上的電晶體數; 目前的R300是一億一千五百萬.
雖說NV3x與R300的架構不能一概而論, 問題是R300的架構上的確比NV3x要"直來直往"許多.
先前也說過, NV3x需要相配合的軟體才能發揮, 而R300則是在設計上追求要先能夠跑快現有的軟體, 這部分的哲學造成的落差也應該要考慮進去.

實作 32bit 到底需要多少個電晶體在這裡推估恐怕不太準確
我很懷疑那些網路上對電晶體數的猜測
多過於 rumor 以及想像

ATI 會使用 24bit 是容易想像的
因為那是 DirectX 規範的最低精確度
DX9 規定最小要 24bit
但是建議 32bit
當廠商在考量 feature 與成本做平衡的時候
自然會選擇 24bit
而且在 PS3.0 的規範下
最低精確度依然是 24bit
並沒有變為 32bit

NV 的設計理念已經和 DX9 的規範走不同路了
要發揮 FX 的效能
非得使用 multiple precision 才行
在 DX9 那種使用單一精確度的 framework
會讓 FX 陷入泥沼
無法翻身
FX 的架構
適合用在 console 像 XBOX 或 PS2
PC 比較傾向 general purpose
需要廠商特殊關照的硬體在 PC 上稱不上是好商品

引用:

嗯, 當初GF4時期的DAC已經全面10bit了, 但是支援10bit Frame Buffer的則要等到FX之後.
只是高精確度轉低不是直接浪費掉, 而是經過dithering之後才轉換的, 人眼仍然可以感受到更多的資訊.
現在的重點在於, FP32/FP24/FP16目前使用上的絕對必要性存在嗎?
連Pixar都只用到FP16了.... FP32我現在覺得除了用於查表之外, 可能必要性並不大.

這邊我要提出一個疑問了.
這樣的整個Data Flow可以中途切換精確度嗎?

假設可以的話, R300全程都是FP24, 直到輸出前才轉成10bit;
但是NV3x可以從一開始是FP32, 部分精確度不需要保存可以轉成FP16, 甚至是FX12, 最後輸出前Dithering成10bit Int....

在 Data Flow 中切換精確度沒有意義
這麼做得不到什麼好處
需要的是
針對整個畫面的不同部份
使用不同的精確度
這部份是 FX 可以做到的
也是真正最佳化 FX 的方式

目前需要高精確度的使用地方不在顏色
16bit 或 32bit 甚至是 12bit filter 到 10bit
這三種出來的結果是幾乎不會有差異的
floating point frame buffer 對目前的顯示卡來說還考驗太大
不是使用的時機

需要高精確度是在「計算」
像光源處理
需要 high dynamic range 時就要較高的位元數來增加它的值域
其他像 bump mapping, shadow 也需要高精確度
只有原先 8bit 常常會造成 artifact
除掉這些 artifact 才是 high precision 的原意
用在這些地方並不會有所謂 dithering 的事情
也不會有用高精確度
但最後輸出時喪失精確度的事情

Pixar 只有用 FP16
這是哪裡的資料？
能提供一下嗎？
FP32 不是一、兩天的事情了
如果說 Pixar 早期的電影使用 FP16
這是可能的
但這一、兩年還是全部只用 FP16
我就很懷疑了

說 FP16 就夠用是誇張了一點吧…
FP16 和 FP24 甚至 FP32 還是有很大的差距
現在問題是開發者設計時是使用多少的精確度
如果他在 FP16 下設計
那在兩家的卡上都能跑得很好
但如果他是以 FP24 以上設計
以目前 NV 驅動沒有支援 FP32 來說
會讓 FX 的問題很大

引用:

不過我們好像也不能一聲令下要它們全部實作IEEE754.....
雖說FX的確除了部份例外之外, 把資料結構整個都弄成IEEE754了.

相對地, ATi 因為用了FP24, 現在當然會喊24bit就夠用; 但是明年呢?
R400可能是個內部精確度達32bit的R300系產品, 到時候它會喊24bit夠用嗎?

結論: 別把廠商看的太高尚了, 跟著起舞的消費者麻煩就大了.

2003-06-15, 10:41 AM #87

Artx1

Master Member

加入日期: Jun 2002

您的住址: 耗電量頗高的地方.

文章: 1,959

引用:

Originally posted by giligula
NV 的設計理念已經和 DX9 的規範走不同路了
要發揮 FX 的效能
非得使用 multiple precision 才行
在 DX9 那種使用單一精確度的 framework
會讓 FX 陷入泥沼
無法翻身
FX 的架構
適合用在 console 像 XBOX 或 PS2
PC 比較傾向 general purpose
需要廠商特殊關照的硬體在 PC 上稱不上是好商品

我是不覺得multiple precision向就會是console用的啦....
畢竟console空間是比較拮据沒錯, 但是PC其實也沒好到哪去;
何況量大不只需要空間放還需要頻寬去送.
本來就應該要視狀況去切換才能算是optimize.
(這可能又會扯上GL2現在還沒生出來的問題)

引用:

在 Data Flow 中切換精確度沒有意義
這麼做得不到什麼好處
需要的是
針對整個畫面的不同部份
使用不同的精確度
這部份是 FX 可以做到的
也是真正最佳化 FX 的方式

需要進一步拆成多個shader, 多個pass, 還是可以用branch拆開呢?
當初CineFX的presentation就宣稱可以以matrices為單位拆model, 透過branch來切換不同的處理.

引用:

需要高精確度是在「計算」
像光源處理
需要 high dynamic range 時就要較高的位元數來增加它的值域
其他像 bump mapping, shadow 也需要高精確度
只有原先 8bit 常常會造成 artifact
除掉這些 artifact 才是 high precision 的原意

我覺得....乾脆查表算了....

引用:

Pixar 只有用 FP16
這是哪裡的資料？
能提供一下嗎？
FP32 不是一、兩天的事情了
如果說 Pixar 早期的電影使用 FP16
這是可能的
但這一、兩年還是全部只用 FP16
我就很懷疑了

抱歉, 資料有點舊了.... 似乎是storage的部分用FP16.

引用:

說 FP16 就夠用是誇張了一點吧…
FP16 和 FP24 甚至 FP32 還是有很大的差距
現在問題是開發者設計時是使用多少的精確度
如果他在 FP16 下設計
那在兩家的卡上都能跑得很好
但如果他是以 FP24 以上設計
以目前 NV 驅動沒有支援 FP32 來說
會讓 FX 的問題很大

因為DX9是single framework啊....
所以要是全程開128bit, 全產品線一概半速, 那benchmark還能看嗎....
所以當然鎖64bit.... (當時4403好像還是FX12固定?! 天哩)

2003-06-15, 02:12 PM #89

0220 Master Member 加入日期: Jun 2002 文章: 2,291	嗯!看文章長知識!A大的發言不看是損失! 我推........
2003-06-14, 11:23 PM #84

giligula Major Member 加入日期: Dec 2002 文章: 156	翻得真不錯文句流暢也沒有擅改原意和大陸那邊真是天壤之別呀讓看不懂日文的我也能瞭解感謝了
2003-06-15, 10:55 AM #88