這篇文章,騰訊工程師介紹了深度學習在遊戲中的應用。
AI這個議題,雖然很早以前就已經提出,但真正火的是在圍棋大殺四方之後。最近雖然有些沉澱,產業界對於AI的用法與探索一直沒停下腳步。
這篇文章的第一章:「什麼是深度強化學習」。對有些人來說可能有點不太理解,我簡單說明一下概念。
假設我想要訓練AI自動玩一個簡單的對戰PK遊戲。
1)確認要玩好一個遊戲的目標:譬如三星過關。
2)確認過關所需要的參數有哪些,給予不同參數權重:譬如移動、攻擊、防禦時機等等。
3)匯入大量的過關卡的數據。
4)有些數據不會過關,有些數據會過關,在這個過程中AI會調整參數的權重,影響過關的權重就會調高,不影響的就會調低。
5)最終AI慢慢試錯學習不同的權重組合,達到100%過關。
而在這篇文章中,作者提到了騰訊正使用AI來完善以下幾個方向,甚至已經放到QQ飛車(極速領域)等遊戲測試:
●BOT AI。譬如《極速領域》賽車的對手NPC。
●Procedural Content Generation (PCG) 自動化的生成遊戲內容。
●角色動畫。
●遊戲內推薦購買商品。
●最適合的廣告推薦組合。
●智能客服。
--
就營運角度來說,這些都是很重要的發展。
以BOT AI來說,傳統的做法是幫NPC寫腳本。但開發者不太可能寫出幾千種的腳本,因此玩家在遊戲過程中很容易摸索出NPC的行為而感到疲乏。
譬如射擊遊戲,AI對手常常被玩家詬病太過僵硬與呆版,但很多新手玩家卻又打不贏老手而流失。如果AI對手能仿造正常玩家的動作,又能針對每個玩家的能力提供適度的"挑戰"(譬如每場KD值目標為70%),那營運商就不用一直導入大量的真人玩家,以維持健康的競爭環境。
PCG則能協助開發商擺脫持續產出內容的惡夢。最近流行的Roguelike玩法,也是藉由變化的遊戲內容,降低開發商對於後續版本開發的壓力。
角色動畫這點的發展則挺讓我驚艷的。所有的AI訓練都要想辦法找到"誤差值",也就是「行為結果與正確結果的差異」。如果光從Youtube的影片中,就能協助AI動畫進行學習,那就能減少使用動態捕捉獲得數據的高門檻,加快AI的訓練發展進程。
遊戲內推薦購買商品這個就不用說了,簡直是營運的夢想。玩家隨著遊戲進程往往有不同需求,但活動只能提供一套一直是最困擾的問題之一。都已經LV100口袋滿滿還看到商城的小體力丹只能讓玩家吐血,AI推薦也許能真正做到遊戲電子商務化。
至於文中所說的最適合廣告訊息推薦組合嘛....容我吐槽一下,只有在中國家大業大等於你家的騰訊才能做到吧XD,微信、QQ、WeGame、包含支付這種遊戲生態鏈共屬一家的狀況實在太獨特。不過現在的確很多休閒小遊戲廠商的線上廣告導入,都號稱有使用AI來找出最佳組合。不可否認也是未來的方向。
--
如果觀察AI對於營運或研發的發展走向,我認為是「極度客製化」。亦即作到每個玩家的遊戲關卡、對戰對手、商品清單,都完全符合並且客製化其難度。
不過這些方向都比較偏向單一玩家的需求。當把玩家與玩家之間的關係,團體與團體之間的關係考量進去,「客製化」與「公平規則」之間的權衡,應該是人類需要代替AI去思考的課題。
希望我們未來都能好好使用這些AI,而不是被它們所取代。
#AI
#遊戲AI
#No51
ai 生成遊戲 在 那個誰SOMEone Facebook 的最佳解答
"用AI來自動生成遊戲?"
這種技術與過去那些學習系統的應用相比
難度又還要在上一層
因為遊戲還要考慮到難度與多樣性
這些抽象的概念並不適合用電腦來"暴力破解"
雖然不是不可能,但還是有些難度
除非我們已經有了通用人工智能 ( AGI
還是別要求AI來幫忙完成整個遊戲吧
那是個差勁的主意
那"用AI來自動生成關卡"怎麼樣?
試試看給AI一個遊戲類型的樣板
例如說射擊遊戲、賽車遊戲
我們先完成槍械的設定、人物的素材
然後讓AI自動生成敵人出現的位置
還有整個地圖的建築與地理配置
這聽起來就簡單許多了
而且還真的有人在嘗試這麼做
他們嘗試的是DOOM這款老招牌遊戲
學習系同則為生成對抗網路
Generative Adversarial Networks
這款遊戲算是FPS ( 不是幀數 )的鼻祖
有相當完整且複雜的客製關卡系統
發展至今已經有了不下幾千張的官方或同人關卡
因此,它具有相當龐大的規格化數據庫
可以供我們的學習系統參考
而確實,要利用這些數據來自動生成出新關卡
是完全辦的到的事
而且還做得跟人類一樣好
生成對抗網路不只會佈局,自動生成樣本
還會嘗試去破局,分辨電腦生成數據與真實數據的差別
它會嘗試去分辨哪些地圖是人類做的
那些地圖是由電腦自動生成的
而最後,他們開發的系統已經無法自破
至少對這套系統來說
自動生成的關卡以與人類設計關卡並無太大差異
當然,這並不代表電腦生成關卡已成
這也可能說明了他們提供的數據不夠深厚
而且這無法證明自動生成關卡有足夠的"多樣性"
不能保證每個關卡都會有全新的體驗
畢竟學習系統只是在學人做事
如果作為老師的數據本身的多樣性就不夠
那作為學生的學習系統又怎麼會有創意呢
更別提,它只能從有限的數據中
仿造出"類似但不相同"的東西
而"多樣性"並不能在模仿的過程中,憑空產生
如果只是在細節上有變化,而主幹不變
那也只是多了一堆
像刺客教條中的支線任務一樣的關卡而已
這個部分只是我這個外行人的見解而已
參考參考就好,我其實對生成對抗網路並不是很有研究
我並不知道它怎麼分辨真實數據與生成樣本
而且,或許只要進行生成的次數夠多
或是嘗試在玩家遊玩的過程中蒐集偏好數據
那就算無法生成具多樣性的遊戲
但真的應用起來至少可以稍微延長遊戲的耐完度吧
另外,就算不能生成新鮮的關卡
至少保證我們每次遊玩都可以稍稍提供變化
那也是挺不錯的,我會想要AI來當我的關主
那你是怎麼想的呢?
AI可以增加遊戲的耐完度嗎?
會不會之後就連劇情
甚至是過場動畫,都可以由AI生成呢?
在下面留言中
告訴我你是怎麼想的吧
我是那個誰,如果你不記得的名字
你八成已經說對了,我們下次見