-
陳經(jīng):人類智能堡壘圍棋突然被谷歌智能攻破了,靠的是策略判斷和暴力搜索兩手都硬
關(guān)鍵字: 谷歌人工智能職業(yè)二段圍棋圍棋AI人工智能AlphaGoAlphaGo電腦圍棋樊麾從人工智能技術(shù)發(fā)展上看,DeepMind使用了“深度學(xué)習(xí)”技術(shù),而非象俞斌估計的和職業(yè)高手合作。電腦通過海量學(xué)習(xí)人類高手的棋譜,用深度神經(jīng)網(wǎng)絡(luò)快速模擬出人的招法,下出來的棋就很象人了。樊麾二段說:“如果沒人告訴我,我會想對手下得有一點怪,但肯定是個很強的棋手,一個真正的人”。
樊麾二段
Facebook的圍棋人工智能程序Darkforest就是用這種辦法,不靠搜索,只用深度學(xué)習(xí)這一招就很快達到了之前研究者多年無法實現(xiàn)的棋力,扎克伯格1月27號正好發(fā)文介紹了這個進展。由于棋力還略低于Zen、Crazystone,所以不算是巨大的突破。
而DeepMind小組在搜索技術(shù)上取得了更大突破。跟Darkforest相似,AlphaGo用一個深度神經(jīng)網(wǎng)絡(luò)(policy network,“策略網(wǎng)絡(luò)”)減少搜索的選點,象人類高手一樣,只考慮少數(shù)幾個可能的選點。此外,他們還建立了另一個深度神經(jīng)網(wǎng)絡(luò)(value network,“值網(wǎng)絡(luò)”),象人類高手一樣,思考到某個局面就有了結(jié)論,不必象之前的蒙特卡洛模擬那樣下到終局,極大地減小了搜索的深度。
DeepMind引入的另一個逆天的高招是,讓圍棋人工智能自己和自己下,總結(jié)經(jīng)驗,自我不斷提高!這個技術(shù)2015年2月就在Nature上發(fā)表了,標題是《玩游戲的軟件從神經(jīng)科學(xué)中吸取經(jīng)驗》(Game-playing software holds lessons for neuroscience)。
這個人工智能自學(xué)習(xí)的要點是,不需要告訴電腦人類的經(jīng)驗,就讓它自己玩這些電腦游戲,只是給出玩的分數(shù)。電腦看著分數(shù)不斷糾正自己的策略,最后就發(fā)展出比人類還強的電游技術(shù)。這次的AlphaGo也用了這個技術(shù),這又是比其它電腦圍棋程序強的地方。從Nature的文章看,DeepMind的絕招是,用50臺電腦讓AlphaGo不斷和自己對弈,下了3000萬盤棋!然后每盤棋選取一個局面(不多選,以避免同一盤棋中不同局面之間的相關(guān)性),根據(jù)這盤棋的最終結(jié)果判斷局勢優(yōu)劣。這樣獲得了3000萬個訓(xùn)練數(shù)據(jù),用于訓(xùn)練生成“值網(wǎng)絡(luò)”。暴力生成這么多數(shù)據(jù)需要海量的計算資源和投入,確實只有谷歌這樣的大公司敢想敢做。可以看出他們的戰(zhàn)略是智能和蠻力兩手抓,兩手都要硬,哪個合適就用哪個,并且互相幫助。
通過這樣三招,DeepMind小組確實在圍棋人工智能上取得了巨大突破。而且研究方法的潛力很大,從這個方向上走,最終象“更深的藍”一樣戰(zhàn)勝人類最高手是完全可以想象的。一個月前,DeepMind小組就報告說圍棋人工智能取得了巨大突破,會戰(zhàn)勝人類,但當(dāng)時棋迷與職業(yè)棋手并未留意?,F(xiàn)在有了棋譜,又有了技術(shù)細節(jié),就顯得可信多了。
職業(yè)棋手李喆在微博上說:
“Google的圍棋AI已具有職業(yè)水準。從棋譜初步判斷是頂尖棋手讓先-讓先倒貼的水平,離戰(zhàn)勝人類還有一小段距離。但這是三個月前的棋譜...以Google機器學(xué)習(xí)堆數(shù)據(jù)的速度,今年三月對決李世石相當(dāng)值得期待。”
如果象報道的那樣,2016年三月AlphaGo真的挑戰(zhàn)韓國棋手李世石(過去十年獲得世界冠軍最多的棋手),這說明Google對AlphaGo非常有信心,認為三個月的時間就能進步到戰(zhàn)勝頂尖高手了。DeepMind小組認為,電腦圍棋的優(yōu)勢在于一天可以下100萬盤棋,而且一直保持水平穩(wěn)定,而人類能下的棋和能打的棋譜很有限,時間長了還會疲勞出錯。
圍棋世界冠軍李世石九段
我認為這次電腦是真的有可能在圍棋上戰(zhàn)勝人類。樊麾在非正式對局中兩次中盤勝AlphaGo,可見AlphaGo也是會認輸?shù)模皇怯肋h纏斗到終局,而且樊麾是有擊敗AlphaGo的棋力的,在正式比賽中可能是太緊張技術(shù)變形了。如果李世石象樊麾二段一樣心態(tài)失衡露出大破綻,肯定會被電腦抓住輸?shù)簟<词剐⌒膽?yīng)付,電腦也會有勝機。即使只贏李世石一盤,也是了不起的成就。最終,電腦以穩(wěn)定的概率戰(zhàn)勝職業(yè)棋手將在一二年內(nèi)實現(xiàn)。
這無疑是人工智能領(lǐng)域的巨大突破,預(yù)示著機器將在棋類這項“智力運動”上徹底戰(zhàn)勝人類。圍棋這個人類自以為還能堅固防守五十年以上的堡壘,在引發(fā)了人工智能研究領(lǐng)域的巨大興趣后,被機器出人意料地迅速突破了。
當(dāng)然正如深度學(xué)習(xí)技術(shù)的發(fā)明人、DeepMind小組的Hassabis所言,人工智能真正的挑戰(zhàn)是“泛化”的能力。人工智能在圍棋上達到的超高能力,并不能轉(zhuǎn)移到其它任務(wù)上去。
Demis Hassabis,深度學(xué)習(xí)技術(shù)發(fā)明人,Google DeepMind 的CEO,AlphaGo的20位作者之一
但是從目前達到的成就來看,人工智能帶來的社會革命也許真的快來了。對于人工智能“奇點革命”有興趣的可以參考:
對于我個人,會象許多業(yè)余棋迷一樣,非常希望Google能把AlphaGo商業(yè)化推向市場。這會是圍棋學(xué)習(xí)的一個革命:隨時隨地有最高等級的選手教你下棋。所以,暫時歡呼吧!
致謝:感謝風(fēng)云學(xué)會會長袁嵐峰博士(@中科大胡不歸 )的寶貴意見。
本文系觀察者網(wǎng)獨家稿件,文章內(nèi)容純屬作者個人觀點,不代表平臺觀點,未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。
-
本文僅代表作者個人觀點。
- 請支持獨立網(wǎng)站,轉(zhuǎn)發(fā)請注明本文鏈接:
- 責(zé)任編輯:李楚悅
-
操心中國,美國“黑手”又要伸向馬來西亞和泰國 評論 27特朗普要求“大搞特搞”,美團體急了:沒中國不行 評論 107“美國人,真正該擔(dān)心的時候到了” 評論 152“美國政府像青少年,拿信用卡揮霍,直到…” 評論 140最新聞 Hot
-
操心中國,美國“黑手”又要伸向馬來西亞和泰國
-
“特朗普要想訪華,先把臺灣問題說清楚”
-
“對以色列感到憤怒和警惕,沙特將與伊朗保持和解”
-
特朗普又給日本背后捅刀,逼得臺積電沒法了…
-
“大而美”法案通過,馬斯克表態(tài)
-
朱時茂自曝被騙錢,“我還是反詐大使”
-
英F-35“趴窩”印度機場20天,快被“玩壞”了…
-
特朗普要求“大搞特搞”,美團體急了:沒中國不行
-
“美國人,真正該擔(dān)心的時候到了”
-
涉及中國,韓企與美國“一拍即合”
-
歐洲學(xué)者:現(xiàn)在,中國能不能反過來幫幫我們?
-
印度“硬剛”:將報復(fù)美國
-
“歐洲同行都覺得,未來十年誰將主導(dǎo)已無懸念,不會是美國”
-
普京:全世界都想進入中國市場
-
馬斯克:對!全面公布所有文件
-
美方恢復(fù)出口,“不是恩賜也不是讓步,是我們斗爭來的”
-