PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 其他群組 > 七嘴八舌異言堂
帳戶
密碼
 

  回應
 
主題工具
沒問題
Major Member
 

加入日期: Dec 2015
文章: 211
引用:
作者野口隆史
webui 你就把它包成 UWP 或者 web app 就可以了
你不管用什麼方式實現,都要面對解析器的性能問題
沒有任何語言可以快過 c++
這點 llama.cpp 已經做得很好了

前端我目前用的是 OpenWebUI
這套我用好幾年了
我當初用的時候它還是一個 100% 的開源專案
現在跟 ollama 一樣變成是假開源而且性能很差
但功能性還行,我必須再次強調性能真的很差
我不會推薦任何人使用,但你很難找到功能性如此全面的替代品

如果要打掉重來,我記得我上個月有看 llama.cpp 的後端添加 sqlite 的版本
但我沒加星,所以一時半刻找不到

其他你可以試試
Jan
https://www.jan.ai/

LibreChat
https://github.com/danny-avila/LibreChat

LibreChat 我幾年前用過一陣子
但是它那個時候還是開發階段
底層經常變動,導致我無法使用 ci/cd 在本地自動部署
現在這些問題都沒有了
部署方式也可以直接選擇 docke...


突然想到一件事情,如果我這個UI前端改用C++實現,你會接受嗎?
     
      
舊 2026-04-10, 03:41 PM #31
回應時引用此文章
沒問題離線中  
ghostcode
Senior Member
 

加入日期: Sep 2001
您的住址: 淡水
文章: 1,352
引用:
作者沒問題
突然想到一件事情,如果我這個UI前端改用C++實現,你會接受嗎?


不是用哪種語言實作的問題。

Agent 有很多地方可以優化。

看看之前 claude agent source code 洩漏,多少人去挖寶。

不用真的閉門造車。
 
舊 2026-04-10, 03:46 PM #32
回應時引用此文章
ghostcode現在在線上  
substar999
Master Member
 

加入日期: Sep 2001
您的住址: K
文章: 1,510
感謝建議,是否使用ROCM的問題我也問過Gemini。
它給的建議是Vulkan足矣,它也建議我使用GPU + GPU混合的模式,
所以才會有-ngl 99 -t8 的組合。
Gemini也說我的環境不需要--fit on --fit-target 128,原因在我的VRAM為32G。
全部的東西載入後應該只會佔用22G的空間,剩下10G應該足夠給windows繪製畫面使用。
另外我用的作業系統是windows,除非我打開WSL,否則我也只有Vulkan這個版本可以選。

引用:
作者野口隆史
-ngl 99 -t8 這些都是 llama-server的預設參數
llama.cpp 預設使用實體核心數的線程數
除非你是純 cpu 推理,否則我建議你以偶數的方式減少來提高性能
例如從 4 開始

我建議加 --fit on --fit-target 128
VRAM 預留 128MB,預設為 1024
--fit on 雖然也為預設參數,但與 --fit-target 一起使用的時候建議寫在一起

然後你應該先測試的後端為 ROCM
RDNA3 現在的 ROCM 支援很好
理應比 Vulkan 性能更高
舊 2026-04-10, 04:16 PM #33
回應時引用此文章
substar999離線中  
野口隆史
Elite Member
 
野口隆史的大頭照
 

加入日期: Mar 2001
您的住址: Rivia
文章: 7,071
引用:
作者沒問題
突然想到一件事情,如果我這個UI前端改用C++實現,你會接受嗎?

你有時間的話可以自己去試
我已經直接告訴你 ai 可以寫出能動的東西
但他不知道什麼叫做"簡潔高效"
現在 ai 寫不出跟人類一樣高性能的解析器
你可以去寫看看,然後發 PR 到 llama.cpp
看他們接不接受
我只是一個網路上的路人
沒有什麼接不接受的問題
重點是 llama.cpp 他們接不接受你的代碼
__________________
Folding@home with GPGPU集中討論串

Unix Review: ArchLinuxSabayonOpenSolaris 2008.5Ubuntu 8.10
AVs Review: GDTCAntiVir SSESSKIS 09NIS 09Norton 360 V3

I Always Get What I Want.
舊 2026-04-10, 04:19 PM #34
回應時引用此文章
野口隆史離線中  
野口隆史
Elite Member
 
野口隆史的大頭照
 

加入日期: Mar 2001
您的住址: Rivia
文章: 7,071
引用:
作者substar999
感謝建議,是否使用ROCM的問題我也問過Gemini。
它給的建議是Vulkan足矣,它也建議我使用GPU + GPU混合的模式,
所以才會有-ngl 99 -t8 的組合。
Gemini也說我的環境不需要--fit on --fit-target 128,原因在我的VRAM為32G。
全部的東西載入後應該只會佔用22G的空間,剩下10G應該足夠給windows繪製畫面使用。
另外我用的作業系統是windows,除非我打開WSL,否則我也只有Vulkan這個版本可以選。

ROCM 跟 Vulkan 性能差很多
你可以裝個 opencode,讓 agent 在你的環境下編譯 llama.cpp
AMD GPU 會選擇 Vulkan 做後端
那已經是去年的事情,ROCM 目前在 RDNA 3/3.5/4 都支援的很好
沒有選擇的時候才會用 Vulkan
__________________
Folding@home with GPGPU集中討論串

Unix Review: ArchLinuxSabayonOpenSolaris 2008.5Ubuntu 8.10
AVs Review: GDTCAntiVir SSESSKIS 09NIS 09Norton 360 V3

I Always Get What I Want.
舊 2026-04-10, 04:29 PM #35
回應時引用此文章
野口隆史離線中  


    回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是08:56 PM.


vBulletin Version 3.0.1
powered_by_vbulletin 2026。