引用:
|
作者人生現在才開始
這些擬真的AI影片
是在後台建模
還是直接畫啊?
模型動態的資料呢?
|
都不是你想的那種傳統方式
AI生成影片是AI生成圖片的進階版
要了解AI生成影片就需要先了解AI生成圖片
而AI生成圖片的演進過程也分很多種算法
但比較神奇的是從擴散模型Diffusion Model這種算法開始
網路上很多解析文章,隨便找一個提供參考:
https://u9534056.medium.com/ai-%E8%...95-66a73983a2e8
用最簡單的說法大概就是:
讓AI去機器學習圖片變成雜訊的規律
然後反過來從雜訊生成高解析度的圖片
雖然講起來很簡單
但AI機器學習通常會訓練出人類難以理解的內部運算過程
所以無法簡單解釋生成的圖片為何能有正確光影?
為何不用3D建模也能生成像是3D建模的成品?
為何AI生成圖片不是簡單的P圖而已?
比如圍棋曾被視為電腦無法打敗人腦的終極挑戰
因為傳統預測算法每預測更多步就會造成運算量幾何級數的增加
再怎麼快的電腦用傳統算法,也很難無止盡預測每一步的可能性變化
圍棋落子的變化太多種,還包含戰術運用等等,寫程式很難全面顧及
單純的預測算法很難提供邏輯性的大局分析,所以面對棋王也是輸多
可後來Google的AI機器訓練不是寫程式用傳統算法
而是直接拿各種圍棋棋譜給AI訓練,是從大量圖片中自動分析學習
AI並不懂那些人類棋王的思路,而是大數據分析出來的哪個位置勝率高
而且AI訓練還可以從棋譜學習完後互相對戰,讓AI自己創造棋譜越練越強
下到後來會出現棋王都無法理解的布局方式,反而棋王都要去學AI為何能下贏
回到AI生成圖片,根據算法不同、學習資料不同
甚至可以衍伸出各種風格,比如用哪位知名漫畫家的畫風
去生成各種想要的圖片,前陣子很流行的吉卜力(宮崎駿)動畫風格圖片就是
AI可不知道吉卜力畫風是啥,但就是能生成很相似的風格
然後任何照片都可以轉換成吉卜力風格,要從文字無中生有也沒問題
單純的P圖可辦不到,就算吉卜力的畫師要把各種照片改畫
也需要花時間去思考怎麼轉換比較合理、比較漂亮、風格才會像
但AI只靠高算力就能快速生成,還能一直給出各種方案讓你選