澎湃新聞記者 徐明徽
在人工智能領域,谷歌和Facebook正在進行著一場比賽,而用人工智能戰勝職業圍棋選手,被視為這場比賽的第一局。
1月28日,《自然》雜志以封面論文形式宣布Google DeepMind公司的人工智能程序 AlphaGo以5:0的比分戰勝歐洲圍棋冠軍樊麾。
谷歌先勝一局。
“人工智能”概念自誕生起一直爭議不斷,但人類依舊在發展人工智能的道路上尋求不斷地突破,在各種棋類游戲中戰勝人類被視為人工智能“智商”的測試方式。
1997年人工智能第一次打敗人類國際象棋選手,2006年后再無人類戰勝過最頂尖的人工智能國際象棋選手。
而圍棋成為了科技大拿們攻堅的下一個城堡——它是典型的人工智能命題,極其困難而充滿著吸引力。
1990年代開始,就出現了如“手談”(中國陳志行教授開發)、“Gun Go”(開源軟件組織GNU開發)為代表的計算機圍棋程序,但這批程序的棋力尚不及人類業余選手初段。
21世紀,以“蒙特卡洛樹搜索”為全新思路的新程序開始在9×9的“小棋盤”實現突破,其中以法國的“MoGo”和“CrazyStone”為代表,棋力基本達到人類職業選手水平。
隨著新程序的思路不斷改進,“CrazyStone”和日本的“Zen”在真正的圍棋比賽上已經能在人類職業棋手讓子的前提下贏得盤面。
近年來,隨著Google與Facebook這樣具有強大研發實力的科技大公司的加入,計算機圍棋界更加風起云涌。經過《自然》雜志的介紹,公眾已經熟知“AlphaGo”。相比Google此時的風光,也在開發人工智能以戰勝人類棋手的Facebook心里可不是好滋味。
這兩家頂尖科技公司早已展開了一場破解圍棋的人工智能競賽,Facebook開發的人工智能Darkforest(黑暗森林)在今年1月的KGS錦標賽獲得了第三名。1月28日下午,Facebook人工智能實驗室負責人Yann LeCun表示:“Darkforest被AlphaGo吊打了。”
開發圍棋人工智能的瓶頸在哪?你可能小時候看過一個宰相向國王求賞的故事:印度寒舍王要獎賞象棋發明人西薩·班·達依爾,西薩看似胃口不大,對國王請求在棋盤的第一個小格內放一粒麥子,第二個小格放二粒,第三格放四粒,以此類推下去直到放滿64個格子。國王沒有意識到指數級增長的威力而欣然答允,然而事后才發現整個國庫的米都倒干凈了仍然無法填滿整個棋盤。西薩的結局是被國王殺掉了。
可以想見,指數級增長可算是大規模計算第一大“攔路虎”了。圍棋有3的361次方種局面,而可觀測到的宇宙,原子數量才10的80次方。
卡耐基梅隆大學機器人系博士、Facebook人工智能組研究員田淵棟曾說過:“圍棋難的地方在于它的估值函數非常不平滑,差一個子盤面就可能天翻地覆,同時狀態空間大,也沒有全局的結構。這兩點加起來,迫使目前計算機只能用窮舉法并且因此進展緩慢。”
谷歌“AlphaGo”的核心是兩種不同的深度神經網絡——“策略網絡”(policy network)和 “價值網絡”(value network)。“策略網絡”負責減少搜索的寬度,“價值網絡”負責減少搜索的深度,它們合作“挑選”出那些比較有前途的棋步,拋棄明顯的差棋,從而將計算量控制在程序可以完成的范圍里,重點分析那些有戲的棋著,本質上和人類棋手所做的一樣。
Facebook的團隊也在幾個月前開始獨立研究圍棋人工智能項目,田淵棟開發的程序“Darkforest”,同樣是將卷積神經網絡和蒙特卡洛樹搜索進行了有機結合。
Yann LeCun在自己的Facebook上發文介紹,第一版的“Darkforest”完全是基于卷積神經網絡,通過有監督模式的訓練讓它來模仿人類選手。研究小組將大量的比賽棋盤格局輸入到卷積神經網絡中,以此來訓練它預測人類選手的下一步走法。
它的輸入是一個帶有注釋的完整的19×19圍棋棋盤,而神經網絡輸出的是一個代表著人類專業棋手每一步走法概率分布的棋盤地圖。這充分利用了卷積神經網絡的模式識別能力,而這種能力在圖像中的物體識別、人臉識別和語音識別方面的成功早就得到了證明。
2015年11月,田淵棟在International Conference on Learning Representations(ICLR,機器學習領域的著名期刊和會議)上提交了論文,稱“Darkforest”已達到了圍棋五段的水平。
與Facebook公開發表研究進展不同,Google的研究工作顯然更加保密。
2015年12月初,Google DeepMind負責人Hassabis在接受對外采訪時,就圍棋算法問題表示自己還不能談論此事,“但幾個月后,會給公眾一個大驚喜。”此時,Google已經將“AlphaGo”的研究論文投稿至《自然》雜志。
就在《自然》刊出“AlphaGo”論文的前一天,2016年1月27日,Facebook對去年11月刊發的論文進行了更新。新論文描述了“Darkforest”的最新版本“Darkforest3”,該程序已經在KGS服務器上運營了一個多月,并取得了成人組第五的排名。這個排名意味著它已經成為全美國最好的前100名選手之一,也步入了世界最頂尖圍棋人工智能之列。
1月28日,《自然》刊出Google DeepMind “AlphaGo”的論文。而Yann LeCun在Facebook上寫道:“AlphaGo的水平比Darkforest高出了6-7個等級。”
從圍棋算法上來看,田淵棟在知乎上介紹,“AlphaGo”的策略網絡和“Darkforest”采取的辦法是一樣的“谷歌的做法充分利用了大數據+深度學習的優勢,而幾乎完全沒有用到圍棋的領域知識,若是以后棋力再往上走,我也不會驚訝。”
“Darkforest”敗給“AlphaGo”,也因為Facebook對其的資源投入無法與Google相比。田淵棟表示,Google發表在《自然》上的文章署名作者就有20位,明顯下了血本,第一位David Silver是計算機圍棋和強化學習的頂級專家,第二作者作者Aja Huang也寫過多年圍棋軟件。而研發“AlphaGo”的小組成員只有田淵棟本人和另一位同事。此外Google可以投入的計算資源也絕非2、3人的小團隊可以比擬的。
Yann LeCun和扎克伯格還是對“Darkforest表示了高度贊揚,Yann LeCun表示:“這個項目是由我們一個小團隊僅花了幾個月時間開發出來的,沒有投入任何圍棋專家資源(除了比賽錄像數據庫),這是對機器學習威力的一次偉大證明。”
在Facebook的個人主頁上,Yann LeCun還微妙地表示,Facebook對研究的態度一直是“盡早發布,時常發布”,研究團隊彼此盡早交換研究成果,能夠更快促進科學進步。
對于業界熱捧“AlphaGo”的態度,也有不同聲音出現。《人工智能學家》主編劉鋒博士1月28日在科學網發言,認為從科學實驗的統計學角度來看,要求實驗對象必須達到一定數量,進行多次獨立實驗,才能相對確保結果的穩定性和可靠性。“谷歌在這篇論文中出現了奇怪的現象。對其他圍棋程序選取了眾多測試對象,并進行了495次實驗,但對人類測試者,卻只選取了一位職業圍棋二段選手,而不是測試多位不同等級的圍棋選手。”
劉峰認為,“AlphaGo”也應該像“Darkforest”一樣,放到互聯網平臺接受大眾挑戰。“我們并不惡意推測谷歌使用強大影響力影響參與測試的圍棋選手,讓他(他們)沒有全力應對,但這一點也的確是可能的實驗漏洞之一。”
劉峰的疑惑并非毫無道理,不少棋友認為,這場比賽不足以體現樊麾的真實水平。微信公眾號《喆理圍棋》的棋手李喆六段就該疑問與樊麾進行了詢問,樊麾對此回答:“電腦是沒有心理負擔的,而人有。”
今年3月,“AlphaGo”將于世界冠軍李世石對戰,這無疑會是一場世界矚目的戰役。不論“AlphaGo”是否能再次戰勝人類頂級職業選手,但它已經讓我們認識到:人工智能的神經網絡運用能力遠超過早前的預期,勢必將對人類未來的生活產生深遠的影響。
人工智能已經不再是科幻小說中的內容,如今我們大多數人生活中已經開始在使用它們。語音搜索、可穿戴設備、無人駕駛技術等都采取了人工智能的基本形式,神經網絡最終能夠縮小機器和人類之間的差距,未來人們能夠教會人工智能更多的東西。
扎克伯格的2016年個人目標就是創建一個人工智能助手。“類似《鋼鐵俠》中的人工智能助手賈維斯。我開始準備了解現有的技術,并將教會人工智能助手理解我的語音,讓它學會控制家中的一切,比如音樂、燈光、溫度等。我還計劃教會助手識別朋友們的面孔,當朋友們按門鈴時,它會讓他們進入。”扎克伯格在其Facebook個人主頁寫道。
Google對于人工智能的探索比Facebook邁的步子更大一些。目前,Google的自動駕駛汽車已經完成了總計70萬英里的高速公路無人駕駛巡航里程。去年7月,Google推出了100輛原型車來執行小規模的市區道路測試,這是自動駕駛行業首次進行的規模化城市道路測試。
此外在圖形識別和語言識別上,Google也取得了重大進展,提高了系統對語音信息的存儲和處理能力,并能夠使用上下文、物理定位及其他方式對談話者的真正含義進行預測,就像人在談話時大腦所做的一樣。
要想在與Google的“軍備之戰”中不落后風,Facebook新年還需加碼了。而在中國,以BAT(百度Baidu、阿里巴巴Alibaba、騰訊Tencent)為代表的互聯網巨頭,他們著急嗎?