瀏覽單個文章
野口隆史
Elite Member
 
野口隆史的大頭照
 

加入日期: Mar 2001
您的住址: Rivia
文章: 7,068
這個只影響 kv cache
跟本省不了多少記憶體
上面那個 gemini 的回覆完全是幻覺
說甚麼處在論文階段,明明一堆實作現在都有了
而且 TurboQuant 本質上就是一種 kv 量化,而非壓縮
     
      
__________________
Folding@home with GPGPU集中討論串

Unix Review: ArchLinuxSabayonOpenSolaris 2008.5Ubuntu 8.10
AVs Review: GDTCAntiVir SSESSKIS 09NIS 09Norton 360 V3

I Always Get What I Want.
舊 2026-03-27, 06:58 PM #411
回應時引用此文章
野口隆史離線中