剛剛看到網友談論到alphago圍棋,想到某A一直沒回我。
首先,alphago不是單純的暴力搜尋最佳解。
AlphaGo的做法是使用了蒙地卡羅樹搜尋與兩個深度神經網路相結合的方法,一個是以藉助估值網路(value network)來評估大量的選點,一個是藉助走棋網路(policy network)來選擇落子,並使用強化學習進一步改善它。在這種設計下,電腦可以結合樹狀圖的長遠推斷,又可像人類的大腦一樣自發學習進行直覺訓練,以提高下棋實力。
至於把棋盤變大的影響,AI固然會弱化,但是對人類更不利。
簡單來說,如果將棋盤變大(例如變為 25x25 或更高),對 AlphaGo 這類 AI 的影響
主要體現在硬體算力與模型適應性兩方面。
以下是具體影響分析:
1. 搜尋空間指數級暴增
圍棋的複雜度來自於其「分支因子」(每一步可落子的位置數)。
19x19 棋盤:約有
種狀態組合。
棋盤變大:組合數會呈指數級成長。雖然 AlphaGo 使用蒙地卡羅樹搜尋 (MCTS) 不需要窮舉所有路徑,但搜尋深度的覆蓋率會下降,導致 AI 需要更多的計算次數(Playouts)才能維持原本的判斷精準度。
Reddit +3
2. 模型架構的物理限制
AlphaGo 的核心是卷積神經網路 (CNN),其輸入層的大小是固定的(專為 19x19 設計)。
arXiv +1
無法直接運行:如果你直接在更大的棋盤上運行現有的 AlphaGo,它會因為輸入維度不符而無法運作。
需要重新訓練:若要適應大棋盤,必須調整網路結構並重新進行海量的「自我對弈」訓練。由於大棋盤的一局時間更長,訓練成本(時間與電費)將會極其驚人。
arXiv.org +3
3. 與人類的相對優勢
雖然大棋盤對 AI 是挑戰,但對人類可能更不利:
體力與計算力:大棋盤的對局時間會拉得很長,人類棋士容易因疲勞產生失誤,而 AI 則完全沒有這方面的問題。
大局觀的重塑:大棋盤會產生全新的「定式」與戰術邏輯,AI 透過自我對弈學習新邏輯的速度遠快於人類。
Reddit +1
4. 技術補救:更強的泛化模型
目前已有一些後續研究(如 KataGo 或相關論文)嘗試開發能適應不同尺寸棋盤的 AI,或是利用圖神經網路 (GNN) 讓 AI 在小棋盤訓練後,能直接「遷移」部分能力到大棋盤上,藉此降低訓練難度。
引用:
|
作者Adsmt
把棋盤改成 100x100,AI就會弱掉了。
是不是真的有AI,應該要把棋盤盡可能放大。不然電腦靠高速運算贏,還算不上真AI.
|