久久精品一区二区三区四区_国产91久久久久久久免费_99免费在线视频_亚洲免费成人网

DeepMind官博詳解AI打星際爭霸:靠戰略水平 而非手速

人工智能
2019
01/26
23:05
新浪科技
分享
評論

北京時間今日凌晨,谷歌母公司Alphabet旗下人工智能公司DeepMind與暴雪聯合直播最新AI程序“AlphaStar”與《星際爭霸2》職業選手比賽實況錄像,并讓AlphaStar和人類選手現場進行一盤比賽。AlphaStar在實況錄像中的10場均獲勝,而在與人類選手現場比賽時不敵人類,因此最終總成績定格在10-1。

在直播開始之際,DeepMind在官方博客上詳細解釋了打造AlphaStar的全過程。DeepMind團隊認為,盡管《星際爭霸》只是一款游戲,但不失為一款較為復雜的游戲。AlphaStar背后的技術可以用來解決其他的問題。在天氣預報、氣候建模、語言理解等等領域,以及研究開發安全穩定的人工智能方面,都會有很大幫助。

以下為DeepMind文章主要內容:

在過去幾十年里,人類一直用游戲測試評估AI系統。隨著技術的進步,科學界尋找復雜的游戲,深入研究智力的方方面面,看看如何才能解決科學問題和現實問題。許多人認為,《星際爭霸》是最有挑戰的RTS(實時戰略)游戲之一,也是有史以來電子競技領域最古老的游戲之一,它是AI研究的“大挑戰”。

現在我們推出一個可以操作《星際爭霸2》游戲的程序,名叫AlphaStar,它是一個AI系統,成功打敗了世界頂級職業玩家。12月19日,我們舉行了測試比賽,AlphaStar打敗了Team Liquid戰隊的Grzegorz "MaNa" Komincz,他是世界最強的職業玩家之一,以5比0獲勝,之前AlphaStar已經打敗同隊的Dario “TLO” Wünsch。比賽是按照職業標準進行的,使用天梯地圖,沒有任何游戲限制。

在游戲領域,我們已經取得一系列成功,比如Atari、Mario、《雷神之錘3:競技場》多人奪旗、Dota 2。但是AI技術還是無法應付復雜的《星際爭霸》。想拿到好結果,要么是對游戲系統進行重大調整,對游戲規則進行限制,賦予系統超人一般的能力,或者讓它玩一些簡單地圖。即使做了修改,也沒有系統可以與職業玩家一較高下。AlphaStar不一樣,它玩的是完整版《星際爭霸2》,用深度神經網絡操作,網絡已經用原始游戲數據訓練過,通過監督式學習和強化式學習來訓練。

《星際爭霸》游戲的挑戰

《星際爭霸2》由暴雪娛樂制作,是一款單位眾多的多層次宇宙科幻游戲,在設計上非常挑戰人工智能。與前作一樣,《星際爭霸2》也是游戲史上最宏大和成功的游戲,已有20余年的電競聯賽歷史。

該游戲玩法眾多,但電競中最常見的是1對1對戰,五局三勝制。開始時,玩家從人類、星靈和異蟲三個種族中人選一個進行操作,每個種族都有獨特的特點、能力(機關專業選手會專注于一個種族)。開局時,每個玩家都有一些“農民”來采集資源和建造建筑,解鎖新科技。這也讓玩家可以收集新的資源,建造更復雜的基地和建筑,研發新科技以勝過對手。要取得勝利,玩家必須仔細平衡宏觀經濟管理,即宏觀經濟,和每個單位的控制,即微操。

這就需要平衡短期和長期目標,還要應對意外情況,整個系統因而經常變得脆弱僵硬。處理這些問題需要在下列若干人工智能領域解決挑戰,取得突破:

- 游戲理論:《星際爭霸》是個游戲,就想剪刀石頭布一樣,沒有單一最佳戰略。因此人工智能訓練過程中需不斷探索和擴展最戰略知識前沿。

- 瑕疵信息:不同于國際象棋或圍棋那種一覽無余的狀態,星際玩家無法直接觀察到重要信息,必須積極探索“探路”。

- 長期規劃:和許多現實世界中的問題并非是從“因”立即生“果”一樣,游戲是可以從任何一個地方開始,需要1個小時時間出結果,這意味著在游戲開始時的行動可能在很長一段時間不會有收效。

- 即時性:不像傳統桌面游戲,玩家輪流行動,星際玩家必須在游戲時間內持續排兵布陣。

- 龐大的行動空間:要同時控制上百個單位及建筑,這就導致了大量的可能性,行動是分級別的,可以被修改和擴張。我們將游戲參數化后,每個時間步驟平均約有10到26個合理行為。

由于上述的大量挑戰,《星際爭霸》成為了人工智能研究中的“大挑戰”。自從2009年《母巢之戰》應用參數界面問世后,圍繞《星際爭霸》和《星際爭霸2》開展了眾多人工智能競賽。

AlphaStar與MaNa的第二場比賽可視化動圖。人工智能的視角,原始觀測輸入神經網絡,神經網絡內部活動,一些人工智能考慮可采取的行動,如單擊哪里或在哪里建造,以及預測結果。MaNa的視角也在其中,但人工智能看不見他的視角。  AlphaStar與MaNa的第二場比賽可視化動圖。人工智能的視角,原始觀測輸入神經網絡,神經網絡內部活動,一些人工智能考慮可采取的行動,如單擊哪里或在哪里建造,以及預測結果。MaNa的視角也在其中,但人工智能看不見他的視角。

AlphaStar如何觀察游戲以及玩游戲的

職業玩家TLO和MaNa的APM可以達到數百,現有機器人高出很多,它們可以獨立控制每一個單位,持續維持幾千甚至幾萬的APM。

對決TLO和MaNa時,AlphaStar的平均APM約為280,比職業玩家低,但它的動作更精準一些。為什么APM會低一些?主要是因為AlphaStar是用錄像訓練的,因此它會模擬人類玩法。還有,AlphaStar在觀察和行動之間平均會有350ms的延遲。

AlphaStar在APM和延遲方面與人類玩家的比較AlphaStar在APM和延遲方面與人類玩家的比較

對決時,AlphaStar借助原始界面與《星際爭霸》游戲引擎交流,也就是說,它可以直接觀察地圖上的我方單位和敵方可見單位,不需要移動攝像頭。如果是人類玩家,注意力有限,必須調整攝像頭,讓它瞄準應該關注的地方。分析AlphaStar游戲能發現,它有一個隱藏的注意力焦點。平均來說,游戲代理每分鐘會切換環境約30次,和MaNa、TLO的頻率差不多。

比賽之后,我們開發了第二版AlphaStar。和人類玩家一樣,這個版本的AlphaStar需要確定何時移動攝像頭,應該瞄準哪里,對于屏幕信息,AI的感知受到限制,動作位置也受到可視區域的限制。

AlphaStar在使用原始界面和控制攝像頭時,其MMR數據比較AlphaStar在使用原始界面和控制攝像頭時,其MMR數據比較

我們訓練了兩個代理,一個使用原始界面,一個學著控制攝像頭。兩個代理最開始時都用人類數據進行監督式和增強式訓練。使用攝像頭界面的AlphaStar幾乎和使用原始界面的AlphaStar一樣強大,在內部排行榜上達到7000 MMR(天梯積分)。在演示比賽中,MaNa用攝像頭界面打敗了原型版AlphaStar,但它只訓練了7天。我們希望能在近期內評估精煉的攝像頭界面AlphaStar。

事實證明,AlphaStar與MaNa和TLO對決時之所以占據上風,主要是因為它的宏觀戰略、微觀戰略決策能力更強,靠的不是超級點擊率、超快響應時間、原始界面。

AlphaStar與職業玩家的較量

《星際爭霸》這款游戲包含三大外星種族:人類、星靈和異蟲。玩家可以從中選擇一個族類開始游戲。目前,我們僅針對星靈一族對AlphaStar進行了訓練,以減少訓練時間和差異。值得一提的是,相同的訓練模式可以也應用到其他兩個種族的訓練上。經過訓練的代理可以在《星際爭霸2》(v4.6.2)的CatalystLE天梯地圖中,實現星靈族與星靈族的較量。

為評估AlphaStar的表現,團隊最初測試了代理對弈玩家TLO(一位頂級職業異蟲玩家和大師級星靈玩家)的表現。AlphaStar以5:0的戰績獲勝,對弈過程中AlphaStar靈活使用了大量單位和建造命令。

“代理的強大水平令我驚訝,”TLO表示,“AlphaStar將眾所周知的策略融會貫通。代理運用的策略,也是我之前從未想到過的。也就是說對于這個游戲,我們或許還有很多玩法沒有探索出來。”

對我們的代理繼續訓練了一周之后,我們讓代理與另一名玩家MaNa進行較量。MaNa不僅是世界頂級的《星際爭霸2》玩家,也是排名前十的最擅長使用星靈族的玩家之一。AlphaStar再次以5:0的戰績獲勝,體現了強大的微觀和宏觀策略技能。

“AlphaStar在每局游戲中采用的操作和不同策略十分令人印象深刻,近乎人類選手般的游戲策略出乎我的意料,”MaNa說,“我這才意識到,自己之前的策略過分依賴失誤和人類反應力,因此這場比賽讓我對游戲有了全新的認識。我們很期待未來的無限可能。”

AlphaStar和其他復雜問題

盡管《星際爭霸》只是一款游戲,但不失為一款較為復雜的游戲。我們認為,AlphaStar背后的技術可以用來解決其他的問題。比如,它的神經網絡架構可以基于不完美的信息,對長時間序列中的可能行為進行建模——因為一局游戲通常長達1個多小時且涉及成千上萬次動作。《星際爭霸》的每一幀都是輸入的一個動作,神經網絡在每一幀動作之后都會對接下來的游戲發展進行預測。根據較長的數據序列進行復雜的預測,是很多現實世界挑戰中的基本問題,比如天氣預報、氣候建模、語言理解等等。AlphaStar項目的學習和發展對幫助這些領域取得顯著進展的可能性,值得期待。

我們還認為,團隊的一些訓練方法或可有助于研究開發安全穩定的人工智能。人工智能的一大挑戰是,系統出錯的方式各種各樣。先前,《星際爭霸》的職業玩家可以通過各種新穎方式誘導代理失誤,輕易擊敗AI系統。AlphaStar采用的基于league模式的創新訓練方式,可以找到最可靠、最不容易出錯的方式。這一創新方式對改進整體AI系統(尤其是在諸如能源等安全至上、且解決復雜邊緣案例十分關鍵的領域)的安全性和穩定性的前景亦值得期待。

實現最高水平的《星際爭霸》對弈代表了人工智能在有史以來最復雜電子游戲中取得的重大突破。我們相信,這些進展,以及AlphaZero和AlphaFold等項目的其他進展,代表著我們在創建人工智能系統之路上的又一大前進。未來終有一日,智能系統將幫助人類解鎖解決世界上一些最重要、最基本之科學問題的創新方式。

【來源:新浪科技】

THE END
廣告、內容合作請點擊這里 尋求合作
ai
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

相關熱點

最后直播的一場比賽中,DeepMind限制了AlphaStar的游戲視角,并在沒有測試的前提下與MANA進行比賽,讓人類終于贏了一場。最終總成績定格在10-1。
業界
近日,在《麻省理工科技評論》、DeepTech深科技聯合主辦的“全球新興科技峰會”后,英偉達副總裁Kimberly Powell(金佰利·鮑威爾)接受了包括第一財經在內的媒體采訪。
業界
中國人工智能學會、國家工信安全中心、華夏幸福產業研究院等四大權威機構、歷史半年完成的重磅報告,給你一個全新的角度了解中國AI產業和學術的創新現狀。
人工智能
近日, LG在2019 CES消費電子大展上推出可卷曲式OLED電視。
家電
人臉識別、語音助手、智能識圖、AI美顏、智慧識屏、隨行翻譯……2018年以來,手機行業搭載AI技術的新賣點層出不窮,究竟哪些才是最常使用的功能?哪些功能是徒增成本、并無實用的“花瓶”?
人工智能
最新文章

相關推薦

1
3
久久精品一区二区三区四区_国产91久久久久久久免费_99免费在线视频_亚洲免费成人网

    9000px;">

      免费在线成人网| 国产精品毛片久久久久久| 久久国产成人午夜av影院| 一区二区三区国产精品| 亚洲欧洲美洲综合色网| 久久久精品免费免费| 欧美v国产在线一区二区三区| 欧美日韩一区二区在线观看视频| 在线欧美小视频| 欧美日韩在线三级| 制服丝袜亚洲网站| 日韩一级视频免费观看在线| 69堂国产成人免费视频| 欧美精品三级日韩久久| 日韩欧美中文字幕精品| 日韩欧美国产午夜精品| 欧美成人激情免费网| 欧美成人欧美edvon| 久久久久久久久久久久电影 | 精品久久久久久久人人人人传媒| 欧美午夜精品一区二区三区| 精品视频在线免费看| 在线电影院国产精品| 日韩欧美专区在线| 精品国产电影一区二区| 亚洲国产电影在线观看| 亚洲精品欧美专区| 五月开心婷婷久久| 国产美女av一区二区三区| 国产在线精品一区在线观看麻豆| 国产成人久久精品77777最新版本| 9久草视频在线视频精品| 在线看不卡av| 日韩精品一区二区在线| 国产精品久久毛片a| 综合久久久久久| 亚洲国产aⅴ成人精品无吗| 日韩电影一区二区三区| 国产成人aaaa| 欧美午夜电影一区| 亚洲精品一区二区三区精华液| 国产精品的网站| 蜜臀91精品一区二区三区| 国产美女久久久久| 在线看不卡av| 中文字幕欧美三区| 亚洲成人你懂的| 国模大尺度一区二区三区| 色网综合在线观看| 精品sm捆绑视频| 亚洲国产精品久久一线不卡| 国产黄色精品视频| 91精品国产色综合久久不卡电影 | 国产伦精品一区二区三区视频青涩 | 国产综合色视频| 色吧成人激情小说| 日本一区二区三区dvd视频在线| 亚洲午夜激情网站| 99国产精品久久久久| 日韩欧美激情四射| 亚洲动漫第一页| 99re8在线精品视频免费播放| 337p粉嫩大胆色噜噜噜噜亚洲 | 国产福利一区二区三区在线视频| 91精品免费观看| 亚洲综合免费观看高清完整版 | 3d成人动漫网站| 亚洲福利一区二区| 99精品热视频| 国产精品色婷婷| 国产成人精品影院| 国产人成亚洲第一网站在线播放| 日本v片在线高清不卡在线观看| 91尤物视频在线观看| 国产精品视频一二| 国产91在线|亚洲| 国产亚洲短视频| 丁香五精品蜜臀久久久久99网站| 久久久亚洲午夜电影| 国内成人自拍视频| 久久亚洲二区三区| 国产精品一区二区在线观看网站 | 91精品国产丝袜白色高跟鞋| 亚洲电影欧美电影有声小说| 日本精品视频一区二区三区| 亚洲欧美日韩国产中文在线| 91蜜桃网址入口| 一区二区三区电影在线播| 色综合亚洲欧洲| 亚洲午夜久久久久久久久电影院| 日本韩国欧美在线| 亚洲人成精品久久久久久| 91同城在线观看| 亚洲777理论| 91精品在线免费| 精品一区二区三区免费播放| 久久久国际精品| 不卡一区在线观看| 亚洲综合久久av| 欧美成人在线直播| 不卡视频免费播放| 一区二区三区精品在线观看| 欧美日韩一区二区三区四区| 久久电影网电视剧免费观看| 中文字幕不卡在线播放| 日本黄色一区二区| 久久99精品国产.久久久久久| 久久久99久久| 在线免费观看视频一区| 美女视频黄频大全不卡视频在线播放| 欧美大片免费久久精品三p| 成人理论电影网| 丝袜亚洲另类欧美| 国产欧美日韩不卡免费| 欧美亚洲动漫精品| 国产一区二区免费视频| 一区二区三区四区不卡视频| 欧美xfplay| 欧美三级乱人伦电影| 国产精品一区在线| 亚洲国产成人高清精品| 国产日产欧美一区二区三区| 欧美调教femdomvk| 国产精品白丝jk白祙喷水网站| 一区二区三区免费观看| 国产欧美日韩在线看| 99久精品国产| 久久国产精品无码网站| 亚洲欧美激情小说另类| 日韩一区二区三区精品视频| 91丨九色丨国产丨porny| 久久成人久久鬼色| 亚洲一区在线看| 国产精品人妖ts系列视频| 日韩视频免费观看高清在线视频| aaa国产一区| 国产麻豆午夜三级精品| 天堂资源在线中文精品| 国产精品夫妻自拍| 精品少妇一区二区三区在线视频| 在线精品视频小说1| 成人午夜精品一区二区三区| 麻豆精品一区二区三区| 午夜亚洲福利老司机| 亚洲码国产岛国毛片在线| 国产精品欧美精品| 26uuu久久综合| 欧美成人猛片aaaaaaa| 欧美一区二区精品在线| 欧美日韩免费不卡视频一区二区三区| 99久久精品久久久久久清纯| 成熟亚洲日本毛茸茸凸凹| 精品无人码麻豆乱码1区2区| 欧美aaa在线| 日韩精品1区2区3区| 五月天婷婷综合| 午夜精品福利一区二区三区av| 一区二区三区精品视频| 亚洲免费资源在线播放| 亚洲色图欧洲色图| 亚洲女同女同女同女同女同69| 国产精品大尺度| 一区免费观看视频| 亚洲黄色小说网站| 一级女性全黄久久生活片免费| 国产日产精品1区| 久久亚洲免费视频| 久久蜜臀精品av| 国产午夜精品福利| 国产精品久久久久一区二区三区| 国产精品美女久久久久久久网站| 国产精品久久午夜夜伦鲁鲁| 中文字幕日韩一区| 亚洲日本免费电影| 亚洲成人在线网站| 琪琪一区二区三区| 国产精品一线二线三线精华| 成人18视频在线播放| 欧美三级日韩在线| 精品少妇一区二区三区| 欧美激情一区在线观看| 亚洲日本韩国一区| 奇米777欧美一区二区| 国内精品久久久久影院薰衣草| 粉嫩13p一区二区三区| 91黄色免费看| 日韩欧美二区三区| 国产精品不卡一区| 午夜电影网一区| 国产成人午夜精品影院观看视频| 欧美精品一区二区三区蜜桃视频| 67194成人在线观看| 久久成人麻豆午夜电影| 丁香六月久久综合狠狠色| 91麻豆福利精品推荐| 欧美喷潮久久久xxxxx| 国产午夜精品一区二区三区四区| 亚洲欧美日韩国产综合| 久久99久久精品欧美| 97精品国产97久久久久久久久久久久|