PCDVD數位科技討論區 - 瀏覽單個文章

引用:

作者人生現在才開始

這些擬真的AI影片
是在後台建模
還是直接畫啊？
模型動態的資料呢？

都不是你想的那種傳統方式

AI生成影片是AI生成圖片的進階版
要了解AI生成影片就需要先了解AI生成圖片

而AI生成圖片的演進過程也分很多種算法
但比較神奇的是從擴散模型Diffusion Model這種算法開始

網路上很多解析文章，隨便找一個提供參考：
https://u9534056.medium.com/ai-%E8%...95-66a73983a2e8

用最簡單的說法大概就是：
讓AI去機器學習圖片變成雜訊的規律
然後反過來從雜訊生成高解析度的圖片

雖然講起來很簡單
但AI機器學習通常會訓練出人類難以理解的內部運算過程
所以無法簡單解釋生成的圖片為何能有正確光影?
為何不用3D建模也能生成像是3D建模的成品?
為何AI生成圖片不是簡單的P圖而已?

比如圍棋曾被視為電腦無法打敗人腦的終極挑戰
因為傳統預測算法每預測更多步就會造成運算量幾何級數的增加
再怎麼快的電腦用傳統算法，也很難無止盡預測每一步的可能性變化
圍棋落子的變化太多種，還包含戰術運用等等，寫程式很難全面顧及
單純的預測算法很難提供邏輯性的大局分析，所以面對棋王也是輸多

可後來Google的AI機器訓練不是寫程式用傳統算法
而是直接拿各種圍棋棋譜給AI訓練，是從大量圖片中自動分析學習
AI並不懂那些人類棋王的思路，而是大數據分析出來的哪個位置勝率高
而且AI訓練還可以從棋譜學習完後互相對戰，讓AI自己創造棋譜越練越強
下到後來會出現棋王都無法理解的布局方式，反而棋王都要去學AI為何能下贏

回到AI生成圖片，根據算法不同、學習資料不同
甚至可以衍伸出各種風格，比如用哪位知名漫畫家的畫風
去生成各種想要的圖片，前陣子很流行的吉卜力(宮崎駿)動畫風格圖片就是
AI可不知道吉卜力畫風是啥，但就是能生成很相似的風格
然後任何照片都可以轉換成吉卜力風格，要從文字無中生有也沒問題

單純的P圖可辦不到，就算吉卜力的畫師要把各種照片改畫
也需要花時間去思考怎麼轉換比較合理、比較漂亮、風格才會像
但AI只靠高算力就能快速生成，還能一直給出各種方案讓你選