阿爾法元來了,人類限制了機器的想象力嗎?態(tài)度

    鈦媒體 / 腦極體 / 2017-10-21 08:21
    阿爾法元之所以震撼了整個業(yè)界,是因為當我們以為Master已經(jīng)封神時,它用三天的時間告訴人類,人類以為的最高水平,在機器面前不值一提。人類經(jīng)驗成了阿爾法狗的累贅,甩掉...

    阿爾法元來了,人類限制了機器的想象力嗎?

    誰能想到,我們會在一年之內(nèi)連續(xù)被AlphaGo刷屏兩次?關于阿爾法元如何快速學習成長擊敗AlphaGo Lee和AlphaGo Master的新聞這里就不再贅述,給出兩個關鍵信息,供讀者一起思考。

    一、阿爾法元沒有錄入人類棋譜數(shù)據(jù),單純通過自我對弈,依靠強化學習取得了現(xiàn)在的能力。

    二、阿爾法元的工作和訓練效率都有了很大的提升,僅用了三天的時間就能擊敗原版阿爾法狗,同時在推理時,阿爾法元只用了4塊TPU。

    阿爾法元之所以震撼了整個業(yè)界,是因為當我們以為Master已經(jīng)封神時,它用三天的時間告訴人類,人類以為的最高水平,在機器面前不值一提。人類經(jīng)驗成了阿爾法狗的累贅,甩掉這些,算法可以更快更好的完成任務。

    對于很多人來說,這是一個巨大的打擊:我們引以為傲的大數(shù)據(jù)不僅僅會誤導算法,還會占用更多的計算資源,阻礙了通用人工智能的發(fā)展。

    這篇文章的主要任務,就是來安撫一下驚慌失措的人類。先從第一個問題說起,看看阿爾法元到底是怎么提升計算效率的。

    從監(jiān)督學習到強化學習

    以前在國際象棋的人機對弈中,計算機使用暴力窮舉法推算雙方對峙時的種種可能,通過運算速度取勝。可窮舉法一度曾經(jīng)被認為不適合圍棋,圍棋每走一步就會創(chuàng)造出19×19種可能,運算量太過巨大。

    直到有人開始用卷積神經(jīng)網(wǎng)絡解決圍棋問題,用卷積神經(jīng)網(wǎng)絡擅長的降維降低搜索空間,機器便有了戰(zhàn)勝人類的可能。

    阿爾法元來了,人類限制了機器的想象力嗎?

    在擊敗了柯潔的阿爾法狗大師版本中,應用了整整40層的策略網(wǎng)絡/價值網(wǎng)絡,前者用于確定當前局面,預測下一步行動,價值網(wǎng)絡則用來判斷執(zhí)黑執(zhí)白兩方的勝率。另外,還要加入快速走子系統(tǒng),以在稍微犧牲走棋質(zhì)量的前提下,極高的提升運算速度。最后,再用蒙特卡羅樹搜索算法把以上三者連接起來。

    而阿爾法元則直接將策略網(wǎng)絡和價值網(wǎng)絡相結(jié)合,并且去掉了快速走子系統(tǒng)。也就是說,以往由三部分組成的阿爾法狗在如今直接變成了一個整體。

    簡化之后,策略+價值網(wǎng)絡的輸入特征由48個減少到了17個,加上被刪掉的快速走子系統(tǒng),基本關于人類圍棋的知識都被去掉了。

    阿爾法元來了,人類限制了機器的想象力嗎?

    從圖中可以看到,沒有任何人類知識的阿爾法元,在自我對弈的初期常常出現(xiàn)一些毫無邏輯的詭異棋局,可到了后期,卻總能有出其不意的打法。

    去掉人類已知知識的特征輸入,意味著阿爾法元從監(jiān)督學習走向了強化學習——分裂成兩個一無所知的棋手,開始對弈,出現(xiàn)勝者后用結(jié)果進行訓練,然后繼續(xù)循環(huán)對弈。

    而走向強化學習,不僅僅是因為去掉了人類棋譜的監(jiān)督,還有關于殘差網(wǎng)絡的應用。殘差網(wǎng)絡可以理解為卷積神經(jīng)網(wǎng)絡的深化,簡單來說,就是盡量減少每一層網(wǎng)絡的神經(jīng)元,而把網(wǎng)絡做的更深。結(jié)合阿爾法元從監(jiān)督學習轉(zhuǎn)向強化學習,減少了輸入特征,也利于把整個神經(jīng)網(wǎng)絡做的更加簡單粗暴。

    總之,阿爾法元的重點就在于,去掉人類的圍棋知識所需的計算的資源,把網(wǎng)絡做的更深,好讓阿爾法元在越來越深的網(wǎng)絡中自己發(fā)現(xiàn)這些知識。

    而阿爾法元的確做到了。

    甩掉數(shù)據(jù),通用人工智能就來了嗎?

    所以,阿爾法元效率提升的重點在于,去掉人類數(shù)據(jù)的監(jiān)督,才有可能實現(xiàn)結(jié)構(gòu)的優(yōu)化。

    那么同樣的套路,可以應用在其他領域嗎?

    答案很有可能讓人失望。

    首先,圍棋這種游戲本身就是透明規(guī)則的數(shù)學計算,此前的Master和Lee,無非是在沒法單純使用推理時的權(quán)宜之計。到了其他無法使用通行透明規(guī)則的領域,深度學習可能就沒那么好用了。

    阿爾法元來了,人類限制了機器的想象力嗎?

    今年DeepMind對《星際爭霸》的挑戰(zhàn)就是案例之一,把整個游戲拆分成多個仿真場景,企圖以分布式的模擬訓練解決整體問題。可目前來看,結(jié)果卻不盡如人意。畢竟在不完全信息環(huán)境中,對長期規(guī)劃能力、多智能體協(xié)作能力的考驗都太過嚴苛了。機器都不一定能很好的模仿人類的經(jīng)驗,更不必提完全依靠機器的自己了。

    在強化學習中,最容易出現(xiàn)的情況就是機器只顧獲取單一條件下的獎勵,無法顧及到多任務環(huán)境中的整體進程。

    游戲中尚且如此,那在語音識別、圖像識別等等其他領域中,數(shù)據(jù)的價值就更為重要了?,F(xiàn)在提出強化學習=通用人工智能,還為時尚早。

    所以,沒有必要因為數(shù)學游戲中的失敗就去否定人類存在的價值。用自己短處去和機器的長處相比,才是最沒意義的事。

    人類限制了機器的想象力嗎?

    而提到人類的短處,就不得不說在阿爾法元和Master對弈中發(fā)現(xiàn)的有趣的信息。對典型的,就是在人類的影響下,Master常常走向局部最優(yōu)。而一些圍棋手們在剛剛接觸圍棋時就要學習的打法,阿爾法元卻在訓練的極后期才能發(fā)現(xiàn)。

    用我們常常評論學校教育的話講,就是人類的規(guī)則限制了機器的想象力。

    這一切提醒了我們兩件事,第一,由于人類自身能力所限,我們常常限于局部收斂而不自知,進而會影響機器學習的能力;第二,大數(shù)據(jù)中的信息噪聲不可忽視。

    也就是說,如果總是依靠人類經(jīng)驗和數(shù)據(jù),依靠機器學習的人工智能的水平頂多是一個腦子特別好使人類。

    而阿爾法元的成功,是不是告訴了我們,依靠強化學習繞過大數(shù)據(jù)的局限、甚至是人類本身的局限?

    雖然在很多沒有明確規(guī)則的場景中強化學習還表現(xiàn)乏力,但我們是否可以創(chuàng)造仿真環(huán)境,嘗試用強化學習重新解讀那些我們習以為常的基礎問題?比如分子的組成和運動甚至基礎物理,以此能影響到的材料、生物等等領域,都有著無限的想象空間。

    阿爾法元對通用人工智能的推進雖然有限,卻證實了用物美價廉的強化學習解決更多問題的可能。在未來,我們可以期待更多商業(yè)化的場景,看看強化學習是不是真的能讓機器學習有更多的應用空間。

    作為一個從小就數(shù)學不好的人,我非常坦然的接受了自己的失敗——作為人類,我們的計算能力的確輸了機器一大截。那些通過計算而得來的智慧,顯然也不見得比機器更高明。

    可我們存在的意義,從來不是算數(shù),而是把自己的能力付諸到更高級的系統(tǒng)上,發(fā)揮出更強大的作用。就像我們不曾被計算器打敗一樣,雖然在計算這件事上,阿爾法元青出于藍。可換個角度想想,我們自己作為算法的發(fā)明者,看著自己的造物補足了自己能力上的不足,是不是應該露出造物神一樣的微笑呢?

    【來源:鈦媒體               作者:腦極體



    1.砍柴網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標注作者和來源;2.砍柴網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務必注明文章作者和"來源:砍柴網(wǎng)",不尊重原創(chuàng)的行為砍柴網(wǎng)或?qū)⒆肪控熑危?.作者投稿可能會經(jīng)砍柴網(wǎng)編輯修改或補充。


    閱讀延展



    最新快報

    1
    3
    主站蜘蛛池模板: 成人区人妻精品一区二区不卡| 日韩精品无码一区二区三区免费| 中日韩精品无码一区二区三区 | 国产一区二区精品久久岳| 一区二区高清视频在线观看| 亚洲午夜精品一区二区| 国产色精品vr一区区三区| 精品国产高清自在线一区二区三区 | 久久精品免费一区二区喷潮| 激情内射日本一区二区三区| 国产成人无码精品一区在线观看| 2018高清国产一区二区三区| 亚洲一区二区三区不卡在线播放| 久久久久成人精品一区二区| 日本一区午夜艳熟免费| 人妻无码一区二区视频| 波霸影院一区二区| 国产免费av一区二区三区| 国产伦精品一区二区三区四区 | 国产a久久精品一区二区三区| 国产视频一区二区| 亚洲一区二区三区高清不卡| 国产精品丝袜一区二区三区| 激情一区二区三区| 亚欧成人中文字幕一区| 日韩内射美女人妻一区二区三区 | 中文字幕一区二区三区在线不卡 | 亚洲一区二区三区无码中文字幕| 日韩精品无码久久一区二区三| 亚洲av片一区二区三区| 亚洲一区二区女搞男| 日本中文字幕一区二区有码在线| 无码少妇精品一区二区免费动态| 美女毛片一区二区三区四区| 亚洲午夜一区二区三区| 日本精品一区二区久久久| 好吊视频一区二区三区| 亚洲bt加勒比一区二区| 国产乱码精品一区二区三区| 一区二区三区四区在线播放| 国产剧情国产精品一区|