在线看mv影片网站入口,在线天堂www网,最近免费中文字幕

APP下載

掃一掃

下載觀察者APP

陳經(jīng)：人類智能堡壘圍棋突然被谷歌智能攻破了，靠的是策略判斷和暴力搜索兩手都硬
- 陳經(jīng)風(fēng)云學(xué)會會員，《中國的官辦經(jīng)濟》
分享到：

2016-01-28 16:16:25 字號：A- A A+ 來源：觀察者網(wǎng)

關(guān)鍵字: 谷歌人工智能職業(yè)二段圍棋圍棋AI人工智能AlphaGoAlphaGo電腦圍棋樊麾

從人工智能技術(shù)發(fā)展上看，DeepMind使用了“深度學(xué)習(xí)”技術(shù)，而非象俞斌估計的和職業(yè)高手合作。電腦通過海量學(xué)習(xí)人類高手的棋譜，用深度神經(jīng)網(wǎng)絡(luò)快速模擬出人的招法，下出來的棋就很象人了。樊麾二段說：“如果沒人告訴我，我會想對手下得有一點怪，但肯定是個很強的棋手，一個真正的人”。

樊麾二段

Facebook的圍棋人工智能程序Darkforest就是用這種辦法，不靠搜索，只用深度學(xué)習(xí)這一招就很快達到了之前研究者多年無法實現(xiàn)的棋力，扎克伯格1月27號正好發(fā)文介紹了這個進展。由于棋力還略低于Zen、Crazystone，所以不算是巨大的突破。

而DeepMind小組在搜索技術(shù)上取得了更大突破。跟Darkforest相似，AlphaGo用一個深度神經(jīng)網(wǎng)絡(luò)（policy network，“策略網(wǎng)絡(luò)”）減少搜索的選點，象人類高手一樣，只考慮少數(shù)幾個可能的選點。此外，他們還建立了另一個深度神經(jīng)網(wǎng)絡(luò)（value network，“值網(wǎng)絡(luò)”），象人類高手一樣，思考到某個局面就有了結(jié)論，不必象之前的蒙特卡洛模擬那樣下到終局，極大地減小了搜索的深度。

DeepMind引入的另一個逆天的高招是，讓圍棋人工智能自己和自己下，總結(jié)經(jīng)驗，自我不斷提高！這個技術(shù)2015年2月就在Nature上發(fā)表了，標題是《玩游戲的軟件從神經(jīng)科學(xué)中吸取經(jīng)驗》（Game-playing software holds lessons for neuroscience）。

這個人工智能自學(xué)習(xí)的要點是，不需要告訴電腦人類的經(jīng)驗，就讓它自己玩這些電腦游戲，只是給出玩的分數(shù)。電腦看著分數(shù)不斷糾正自己的策略，最后就發(fā)展出比人類還強的電游技術(shù)。這次的AlphaGo也用了這個技術(shù)，這又是比其它電腦圍棋程序強的地方。從Nature的文章看，DeepMind的絕招是，用50臺電腦讓AlphaGo不斷和自己對弈，下了3000萬盤棋！然后每盤棋選取一個局面（不多選，以避免同一盤棋中不同局面之間的相關(guān)性），根據(jù)這盤棋的最終結(jié)果判斷局勢優(yōu)劣。這樣獲得了3000萬個訓(xùn)練數(shù)據(jù)，用于訓(xùn)練生成“值網(wǎng)絡(luò)”。暴力生成這么多數(shù)據(jù)需要海量的計算資源和投入，確實只有谷歌這樣的大公司敢想敢做。可以看出他們的戰(zhàn)略是智能和蠻力兩手抓，兩手都要硬，哪個合適就用哪個，并且互相幫助。

通過這樣三招，DeepMind小組確實在圍棋人工智能上取得了巨大突破。而且研究方法的潛力很大，從這個方向上走，最終象“更深的藍”一樣戰(zhàn)勝人類最高手是完全可以想象的。一個月前，DeepMind小組就報告說圍棋人工智能取得了巨大突破，會戰(zhàn)勝人類，但當(dāng)時棋迷與職業(yè)棋手并未留意?，F(xiàn)在有了棋譜，又有了技術(shù)細節(jié)，就顯得可信多了。

職業(yè)棋手李喆在微博上說：

“Google的圍棋AI已具有職業(yè)水準。從棋譜初步判斷是頂尖棋手讓先-讓先倒貼的水平，離戰(zhàn)勝人類還有一小段距離。但這是三個月前的棋譜...以Google機器學(xué)習(xí)堆數(shù)據(jù)的速度，今年三月對決李世石相當(dāng)值得期待。”

如果象報道的那樣，2016年三月AlphaGo真的挑戰(zhàn)韓國棋手李世石（過去十年獲得世界冠軍最多的棋手），這說明Google對AlphaGo非常有信心，認為三個月的時間就能進步到戰(zhàn)勝頂尖高手了。DeepMind小組認為，電腦圍棋的優(yōu)勢在于一天可以下100萬盤棋，而且一直保持水平穩(wěn)定，而人類能下的棋和能打的棋譜很有限，時間長了還會疲勞出錯。

圍棋世界冠軍李世石九段

我認為這次電腦是真的有可能在圍棋上戰(zhàn)勝人類。樊麾在非正式對局中兩次中盤勝AlphaGo，可見AlphaGo也是會認輸?shù)模皇怯肋h纏斗到終局，而且樊麾是有擊敗AlphaGo的棋力的，在正式比賽中可能是太緊張技術(shù)變形了。如果李世石象樊麾二段一樣心態(tài)失衡露出大破綻，肯定會被電腦抓住輸?shù)簟＜词剐⌒膽?yīng)付，電腦也會有勝機。即使只贏李世石一盤，也是了不起的成就。最終，電腦以穩(wěn)定的概率戰(zhàn)勝職業(yè)棋手將在一二年內(nèi)實現(xiàn)。

這無疑是人工智能領(lǐng)域的巨大突破，預(yù)示著機器將在棋類這項“智力運動”上徹底戰(zhàn)勝人類。圍棋這個人類自以為還能堅固防守五十年以上的堡壘，在引發(fā)了人工智能研究領(lǐng)域的巨大興趣后，被機器出人意料地迅速突破了。

當(dāng)然正如深度學(xué)習(xí)技術(shù)的發(fā)明人、DeepMind小組的Hassabis所言，人工智能真正的挑戰(zhàn)是“泛化”的能力。人工智能在圍棋上達到的超高能力，并不能轉(zhuǎn)移到其它任務(wù)上去。

Demis Hassabis，深度學(xué)習(xí)技術(shù)發(fā)明人，Google DeepMind 的CEO，AlphaGo的20位作者之一

但是從目前達到的成就來看，人工智能帶來的社會革命也許真的快來了。對于人工智能“奇點革命”有興趣的可以參考：

人工智能革命：通向超級智能之路人類永生或滅絕

對于我個人，會象許多業(yè)余棋迷一樣，非常希望Google能把AlphaGo商業(yè)化推向市場。這會是圍棋學(xué)習(xí)的一個革命：隨時隨地有最高等級的選手教你下棋。所以，暫時歡呼吧！

致謝：感謝風(fēng)云學(xué)會會長袁嵐峰博士（@中科大胡不歸）的寶貴意見。

本文系觀察者網(wǎng)獨家稿件，文章內(nèi)容純屬作者個人觀點，不代表平臺觀點，未經(jīng)授權(quán)，不得轉(zhuǎn)載，否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn，每日閱讀趣味文章。

首頁上一頁 1 2 余下全文
標簽圍棋人工智能算法 nature
- 請支持獨立網(wǎng)站，轉(zhuǎn)發(fā)請注明本文鏈接：
- 責(zé)任編輯:李楚悅
搜索

   觀察者頭條查看全部

操心中國，美國“黑手”又要伸向馬來西亞和泰國評論 27

特朗普要求“大搞特搞”，美團體急了：沒中國不行評論 107

“美國人，真正該擔(dān)心的時候到了” 評論 152

直播：算法向善——共話AI與人類命運共同體未來評論 8

“美國政府像青少年，拿信用卡揮霍，直到…” 評論 140

   風(fēng)聞 · 24小時最熱查看全部

   最新視頻查看全部
最新聞 Hot
快訊

成人免费午夜在线观看,伊人久久精品,一区二区三区精品

陳經(jīng)：人類智能堡壘圍棋突然被谷歌智能攻破了，靠的是策略判斷和暴力搜索兩手都硬

操心中國，美國“黑手”又要伸向馬來西亞和泰國

“特朗普要想訪華，先把臺灣問題說清楚”

“對以色列感到憤怒和警惕，沙特將與伊朗保持和解”

特朗普又給日本背后捅刀，逼得臺積電沒法了…

“大而美”法案通過，馬斯克表態(tài)

朱時茂自曝被騙錢，“我還是反詐大使”

英F-35“趴窩”印度機場20天，快被“玩壞”了…

特朗普要求“大搞特搞”，美團體急了：沒中國不行

“美國人，真正該擔(dān)心的時候到了”

涉及中國，韓企與美國“一拍即合”

歐洲學(xué)者：現(xiàn)在，中國能不能反過來幫幫我們？

印度“硬剛”：將報復(fù)美國

“歐洲同行都覺得，未來十年誰將主導(dǎo)已無懸念，不會是美國”

普京：全世界都想進入中國市場

馬斯克：對！全面公布所有文件

美方恢復(fù)出口，“不是恩賜也不是讓步，是我們斗爭來的”

陳經(jīng)：人類智能堡壘圍棋突然被谷歌智能攻破了，靠的是策略判斷和暴力搜索兩手都硬

陳經(jīng)：人類智能堡壘圍棋突然被谷歌智能攻破了，靠的是策略判斷和暴力搜索兩手都硬