作弊玩游戲,AI 也學壞了?

    人工智能
    2018
    11/19
    17:44
    愛范兒
    分享
    評論

    AI 的游戲方式大大出乎研究人員的意料。

    多年以前,當我第一次見識到朋友們是如何在《超級馬里奧》中通過卡一個龜殼無限刷分,在《魂斗羅》中用一種奇怪的方式獲得額外生命的時候,拯救世界和公主就再也不是我想做的事了。

    在我看來,游戲里發掘各種奇怪的 Bug 明顯比拯救公主更有趣。

    ▲ 在《惡魔城:月下》里研究各種各樣的出城 Bug 一直是我樂此不疲的一件事

    但是現在,關于 「利用 Bug 快速完成游戲目標」 這件事情上,AI 似乎比我還要擅長。

    今年四月,曾經開發出擊敗 Dota2 職業選手的 OpenAI 公司,舉辦了首屆針對 AI 的強化學習競賽。這個比賽的目標,旨在評估強化學習算法從以往經驗中泛化的能力。這聽起來很拗口,具體地說,就是讓 AI 來玩單機游戲,而且玩的是 NES 平臺上的《刺猬索尼克》。

    ▲ 世嘉公司在多年前開發的初代索尼克游戲成了 AI 的實驗對象

    每個參賽團隊需要讓自己研發的 AI 在不同的訓練關卡上運行,通過短時間的機器學習,讓 AI 掌握這款游戲的規則和操作方法,并在游戲設計師重新設計的地圖上迅速找到最優的通關策略。

    OpenAI 舉辦這次比賽的目的,是想驗證這樣一個觀點:強化學習的強泛化性是通往通用人工智能的關鍵路徑之一。舉個例子,如果你在《CS:GO》中是一個百發百中的神槍手,那么其他的 FPS 游戲你可能也會很輕松的上手。但如果你把一個針對《CS:GO》訓練的 AI 直接扔到《守望先鋒》里,那么它估計會直接崩潰。

    因此,參賽選手需要讓 AI 自己學習游戲的策略和技巧,以便在陌生的地圖上自己找到最優的通關方法。

    不過這一次,AI 們好像聰明過了頭。

    在研究人員的調試下,AI 被告知要優先獲得更高的分數(一般通過擊殺敵人和拾取金環獲得),同時在僅可能短的時間內到達終點。這樣的條件導致了一個奇怪但有趣的結果:AI 開始通過尋找游戲內的 Bug 來更好的完成目標。

    就像上面演示的這樣,AI 控制的索尼克在游戲中找到了一些特殊的 「捷徑」 來讓自己更快的達成目標,這些捷徑都是通過類似于 「卡 Bug」 的方式實現的。

    這樣的方式大大出乎研究人員的意料。最開始,研究人員希望 AI 能通過所提供的人類玩家數據來模仿人類的操作和行為,最終完成游戲目標。

    但通過機器學習的人工智能對游戲顯然有自己的一套理解,除了在游戲中尋找能讓自己快速通關的 Bug 以外,它們還會做許多在研究人員眼里匪夷所思的事情。

    谷歌 Deepmind AI 項目的研究人員維多利亞 · 克拉科夫納就搜集了大量像索尼克這樣的例子。

    比如在一個《海岸賽艇》的小游戲里,AI 操縱的船只沉迷于利用 Bug 不斷地撞擊獎勵目標以達到更高的分數,順利到達終點這件事已經不在它的計劃之內了。

    另一個研究人員試圖讓 AI 玩一款經典的像素游戲《Q 伯特》,同樣,AI 在游戲里找到了一個無限刷分的嚴重 Bug 并在時間結束之前達到了最高分。不僅如此,當它發現敵人會跟著 Q 伯特一起掉下懸崖后,AI 甚至采取了自殺的方式來獲得更高的分數。

    就連《俄羅斯方塊》這樣的游戲,AI 也能找到自己的另類玩法。由于每增加一個掉落的方塊都會使 AI 的評分略微升高,所以它采取了完全錯誤的游戲方式 ——盡可能快的落下每一個方塊并在快要 Game Over 時暫停游戲以確保自己不會輸。

    好像聽上去還蠻智能的 ……

    雖然在比賽的最后,使用特殊方法獲得勝利的 AI 并沒有得到研究人員的認可,但他們還是表示:

    「AI 展示了它如何在沒有人類介入的情況下贏得游戲勝利,出乎意料其富有創造性,可能會完全顛覆人類對游戲如何運行的理解。」

    人工智能無意間找到了獲取游戲勝利更好的方法,雖然暴露了目前人類對于機器學習仍無法完全控制的的缺陷,但也顯露出了 AI 異于人類的創造性火花。正是這種創造性的潛力讓 Deepmind 投入大量的資金來讓人工智能學習像《星際爭霸 2》這樣復雜的競技游戲。

    在 2017 年的暴雪嘉年華上,Deepmind 宣布將讓自己的 AI 嘗試《星際爭霸 2》這樣的游戲,雖然讓它和世界頂尖選手交戰還為時尚早,但在今年,暴雪表示它已經可以應對其他 AI 的前期速攻戰術。

    在《星際爭霸》2 中,有人曾經設計出一種名為 「悍馬 2000」 的腳本,雖然它能憑借操作以極少的兵力戰勝遠多于自己部隊(比如 100 條狗沖破坦克陣),但這是在后臺讀取游戲內部數據的結果,算是真正的作弊,而不是能夠自己學習和進化的 AI。

    2 年前,AlphaGo 帶給人類關于圍棋的新理解,也許再過不久,AI 也能用全新的戰術體系來顛覆人類在星際爭霸上的統治。

    當然就算失敗了,當一個專門找 Bug 的游戲測試員也是個不錯的選擇嘛。

    【來源:愛范兒】

    THE END
    廣告、內容合作請點擊這里 尋求合作
    ai
    免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

    相關熱點

    現在有這樣一句話:報了一個好學校,不如上一個好專業。不可否認的是,一個好的專業確實對之后的工作和發展有很大的影響。隨著互聯網的蓬勃發展,互聯網對各類人才,尤其是人工智能的人才需求更是旺盛,比...
    人工智能
    2018未來科學大獎暨F2科學峰會今日在北京召開,金沙江創投董事總經理、未來論壇理事丁健今天在2018未來科學大獎&F2科學峰會上接受媒體采訪時表示,仍然非常看好人工智能領域的發展,但應當警惕人工智能領...
    人工智能
    互聯網行業每隔一段時間就會出現一股潮流,比如云計算、區塊鏈、共享經濟等等,最近一直比較熱門的詞匯就是“人工智能”。
    人工智能
    有企業給應屆生的薪水拔高了10%~20%;也有企業上漲幅度更大,尤其是給博士生的年薪從去年的50萬元倏地躥到80萬元;也有準備布局AI領域的新銳企業,雖然還沒考慮好具體的價位,但是打算花高價從互聯網巨頭...
    人工智能
    據Techcrunch報道,谷歌和NASA宣布,通過機器學習技術在開普勒-90系統中發現了一顆新行星。科學家們把神經網絡應用于開普勒望遠鏡收集的數據中,首次發現了該系統的第八顆行星。在所有的已知行星系統中,...
    人工智能

    相關推薦

    1
    3
    主站蜘蛛池模板: 亚洲AV乱码一区二区三区林ゆな| 99国产精品一区二区| 影音先锋中文无码一区| 亚洲国产精品一区二区三区在线观看| 日本内射精品一区二区视频| 国产福利一区二区三区在线视频 | 精品人体无码一区二区三区| 日韩内射美女人妻一区二区三区| 精品一区二区91| 色窝窝无码一区二区三区色欲| 国产福利一区二区三区在线视频| 精品视频一区二区三区在线播放| 久久伊人精品一区二区三区| 久久久人妻精品无码一区| 精品视频一区二区三区四区| 久久亚洲中文字幕精品一区| 国产成人一区二区精品非洲| 国产日韩一区二区三区| 精品黑人一区二区三区| 少妇人妻精品一区二区三区| 亚洲AV综合色区无码一区爱AV| 亚洲A∨精品一区二区三区| 内射一区二区精品视频在线观看| 中文字幕视频一区| 伊人久久大香线蕉av一区| 红杏亚洲影院一区二区三区| 麻豆一区二区三区蜜桃免费| 中文字幕人妻AV一区二区| 狠狠色婷婷久久一区二区| 亚洲一区二区三区在线播放| 日本一区二区三区精品视频| 无码国产精品一区二区免费式影视 | 国产午夜精品一区理论片| 日韩精品人妻一区二区三区四区 | 日韩AV片无码一区二区不卡| 久久99精品一区二区三区| 国产成人综合精品一区| 高清无码一区二区在线观看吞精 | 日韩一区二区三区不卡视频 | 精品一区二区三区在线观看l | 无码人妻精品一区二区三区久久|