范江懷/解放軍報
——從“阿爾法圍棋”戰勝世界冠軍看人工智能在軍事領域的影響
“阿爾法圍棋”完勝世界冠軍李世石的對弈,成了近日人們關注的焦點。據悉,第一盤棋就有超過一億人觀看了直播。而有關這場人機大戰的話題,一時間更是充斥著網上論壇和街頭巷尾。
誰是最大的贏家?
AlphaGo 4:1勝李世石,人機圍棋大戰巔峰對決至此落幕。不過關于人工智能與圍棋的故事仍在延續,更多的人機對決,或許不久便將到來。 視覺中國 圖
賽前,人們普遍看好世界冠軍李世石,盡管他已不在競技的巔峰狀態,畢竟實力還在。但令人沒想到的是,李世石如此不堪一擊。
電腦戰勝了人腦,人們想到了,但沒有想到來的這么快。于是,有人擔憂甚至是恐懼。當然也有人興奮:人工智能贏了棋,人類贏得了未來!其理由是:戰勝李世石的“阿爾法圍棋”是由人研發的。
電腦戰勝了人腦,會給人類帶來什么樣的革命性變化?這不是本文想探討的話題。人類當然是可以贏得未來,但不等于你就能贏得未來。換句話說,這場人機大戰誰是最大的贏家?
是電腦?是“阿爾法圍棋”?是谷歌研發團隊?是英國人?據悉,研發“阿爾法圍棋”的是一家僅有50多人的英國小公司。僅僅是觀看了這個小公司的一次演示,谷歌公司就毫不遲疑以4億英鎊的重金收購了這家英國的小公司——這是發生在2013年的事。
僅僅過了兩年多的時間,一個具有里程碑意義的事件就發生了:人類4000年的圍棋歷史,被“阿爾法圍棋”改寫,開辟了新紀元。
里程碑事件的背后,總會有一個推手。這次人機大戰也概莫能外。人機大戰之前,筆者在《人機大戰,戰爭最好的預實踐?》一文中提到,當年IMB研發戰勝國際象棋頂級大師卡斯帕羅夫的“更深的藍”,就得到了美國國防部的資助。話到此處,誰是此次人機大戰最大的贏家,不說大家也“懂得”。
科學技術每一次劃時代的進步,都會造福于人類,但也有可能禍害人類。比如火藥,比如核能,這關鍵要看誰在用,用的目的是干什么?
美國康奈爾大學教授、人工智能專家巴特·塞爾曼在談到“人工智能威脅論”時說,開發人工智能有一定的風險,但人工智能研究界已經開始研究所謂的人工智能安全。這些將要開發出來的系統將對人類保持友好,并與人類合作,我對此相當有信心。除了特定軍事應用,開發“敵對人工智能”不符合任何人的利益。
什么是世界強國?站在科技最前沿的國家才能成為世界強國。軍隊也是如此,你擁有世界最先進的科技,才有可能成為世界一流的軍隊。所以,搶占高科技的制高點,一直是大國和強國的必修課。
電腦戰勝人腦,我們不一定要恐懼,但一定要警惕。
真正的對手在哪兒?
戰爭(比賽)的勝負不取決于沖在最前面的人,而是取決于后面的團隊;不完全取決于打仗(比賽)的過程,而是取決于準備打仗(比賽)的過程。 視覺中國 圖
在人機大戰前兩盤的比賽中,李世石輸的嘎嘣脆。韓國媒體就坐不住了,替李世石喊冤,說比賽不公平,稱“阿爾法圍棋”后面擁有無數個“指教者”。
此話有點強詞奪理,但也不無道理。李世石對付的確實不是一個人,而是一支高智商的研發團隊。
在這次人機大戰之前,體育界的人士大多看好李世石,而科技界的人士卻大多看好“阿爾法圍棋”。有比較冷靜的專業人士就說過,這場人機大戰的勝負,其實在開賽之前就已經決定了。這當然沒有什么貓膩和君子協定。李世石確實是一個人在戰斗。
把賽場和戰場對接一下,你就會發現有著驚人的相似之處。
僅舉一個最新的戰例:美軍海豹突擊隊擊斃本·拉登的“海神之矛”行動。從表面上看,沖在最前面的只是24個特種兵,而在他們的后面,有一個龐大的團隊:天上有提供信息的衛星,海上有負責接應的航母,陸地有軍事基地進行支援,華盛頓有全知的指揮中心……前面有24個人在作戰,后面卻有24的N次方的人員在幫忙。這樣的戰斗行動能不取得成功嗎?
不管是人機大戰也好,“海神之矛”的戰斗行動也罷,都在印證著這么一個道理:戰爭(比賽)的勝負不取決于沖在最前面的人,而是取決于后面的團隊;不完全取決于打仗(比賽)的過程,而是取決于準備打仗(比賽)的過程。
如果明白了這么一個道理,1∶4落敗的李世石也應該感到釋然。
所以,我們說“人機大戰是戰爭最好的預實踐”一點也不牽強。這實際上也給我們提出了一個課題,我們的資源和力量是用在培養一個世界冠軍上呢,還是用于培養一支有創新能力的研發團隊上;是用在一線呢,還是二線甚至三線四線。據悉,谷歌公司只有10%的人負責賺錢,90%的人負責胡思亂想去搞創新,而“阿爾法圍棋”就是他們胡思亂想貪玩的結晶。
不管是冷兵器時代,還是機械化時代,在前方打仗靠的是“人海戰術”,解決問題需要“集中優勢兵力”。信息化戰爭不再打“人海戰術”,大兵團廝殺的場景難于再現,但就整個戰爭而言,用兵并不見得少,相反有可能還多,只不過是用在最前沿的兵大大減少了,用兵的位置發生了乾坤大挪移。未來戰爭無人化、網絡化和非接觸的作戰模式,參與者會變得更多,有時你真的不知道對手是誰、藏在哪兒?
我們天天念叨“制勝機理”?想想其實也很簡單,就是“把正確的人用在正確的地方”。
當“孫子”還是當“老子”?
據悉,人機大戰的第一盤棋就有超過一億人觀看了直播。 視覺中國 圖
“阿爾法圍棋”能完勝世界冠軍,與以往下棋的程序最大的不同,就是它善于學習,而且具備了深度學習的能力。
人類學習的速度和容量,是無法企及電腦的。一個棋手一年只能下1000多盤棋,“阿爾法圍棋”一天就能下100萬盤棋。“阿爾法圍棋”的“腦袋”里裝了15萬職業棋手的棋譜、上百萬業余棋手的棋譜,并且自我對弈了3000萬盤棋。人腦裝的棋譜,估計連電腦的零頭都不到。
賽前,很多人曾戲謔地把人工智能圍棋程序稱為“阿爾法狗”,當這只“狗”在前三盤完勝李世石之后,很多人便立馬改口稱“阿爾法老師”了。從學習能力上來說,電腦在一些方面已經遠超人腦,“阿爾法圍棋”戰勝世界冠軍也沒有什么可奇怪的。
在互聯網上流傳這么一句名言: 研究兵法最多成為“孫子”,無為而治卻能成為“老子”。
我們跟著李世石學圍棋,最多只能成為一時的世界冠軍;但如果能像“阿爾法圍棋”那樣擁有強大的學習能力,能博采眾長地學習所有世界冠軍的經驗和長處,那就能成為高處不勝寒的頂尖高手。
賽場和戰場雖然有不同的運行法則,但制勝機理很多則是相通的。比如學習。
人類雖然不可能具備電腦的某些學習能力,但以計算機為核心的信息技術,為人類的學習創造了優越的學習條件和無限可能。過去,我們只能在戰爭中學習戰爭,現在可以在電腦模擬的近似實戰環境下學習戰爭,推演未來戰爭的攻防模式和發展趨勢。科學家們現在在教會電腦如何學習,今后我們將在擅長學習的電腦幫助下拓展我們的學習。
當然,我們也必須看到,戰場上的學習和賽場上的學習又有很多不同。“阿爾法圍棋”可以輕而易舉地獲得眾多圍棋高手的棋譜,可在軍事層面上,你想要獲得對手訓練、演習乃至作戰方面的相關數據,難上加難!軍事領域的學習一定程度上是在“摸著石頭學習”。
一位金融家曾經深有感觸地說,財富不是最重要的,時間才是,學習才是。
怎么學,跟誰學,學什么,這是一個問題。在信息化的時代,最緊迫的任務就是學會如何學習。因為,學習能力決定了創新能力,創新能力則決定了一個人或者一個團隊的實力——這應該是人機大戰給我們最大的啟迪。
人機如何融合?
人機大戰結束后,不少業內人士都在分析電腦和人腦下棋的優劣長短。
說到“阿爾法圍棋”的長處,中國圍棋等級分第一人柯潔在看了比賽后就直言,“阿爾法圍棋”“能分清大小,這點非常厲害”。具備了在下棋時進行價值判斷的能力,這是“阿爾法圍棋”此次能夠戰勝李世石的一個重要因素。
電腦的長處是顯而易見的:學習能力強大、計算能力強大、記憶能力強大,而且行事不會受到情緒影響,不會犯錯。但電腦和人比,缺乏的是想象力和創造力,沒有好惡是非的觀念和喜怒哀樂的情感。
人機大戰尚未結束,就有人說用“阿爾法圍棋”的技術用來炒股、用來看病,肯定也能“大獲全勝”。事實是,人工智能技術在很多領域已經開始發揮作用,但絕不是像人們想象的那么簡單。人在電腦的幫助下會變得更加強大,但電腦失去了人的支持,很難有所作為。這實際上帶來的是一個大家一直在探索的問題:人機如何取長補短融合成一體?
在現實社會中,我們已經離不開電腦了,信息技術無處不在。但不可否認,這只是一個“人機交互”的時代。人類要跨入“人機融合”的最高境界,一方面,人工智能技術需要再上一個臺階,另一方面,人類自己則需要強化“人機合一”的意識而非恐懼的擔憂。在“阿爾法圍棋”戰勝世界圍棋冠軍后,人們在“人機融合”方面變得更為迫切。在金融、醫療、體育領域如此,在軍事領域更是如此。
若干年前,美軍就致力于用巴頓的戰術與蓋茨的技術有機地結合,幫助指揮官去尋找戰場取勝的方法和手段。在純技術層面上,美國在新世紀之初就開始探討“腦機接口”技術軍事應用,投入巨資研究武器與人相互作用機理,研發能馳騁未來戰場的“機器戰士”。
未來戰爭是在信息體系支撐下進行的,只有解決好人機融合這一核心問題,才能占據著戰場的主動,贏得現代戰爭最后的勝利。
最大的挑戰在人機融合,最大的機遇也在人機融合。對照人機大戰這面鏡子,我們的指戰員在人機融合方面做得還遠遠不夠。