-
陳經(jīng):感謝AlphaGo對(duì)圍棋的貢獻(xiàn),人機(jī)纏斗剛剛開(kāi)始
關(guān)鍵字: AlphaGo谷歌AlphaGoAlphaGo對(duì)戰(zhàn)李世石AlphaGo李世石人機(jī)大戰(zhàn)但另一方面,圍棋也將通過(guò)人類(lèi)高手與機(jī)器的反復(fù)纏斗,以一種前所未有的方式展示其自身的魅力。AlphaGo與李世石的五盤(pán)人機(jī)大戰(zhàn),只是一個(gè)開(kāi)始。不少新聞分析說(shuō),圍棋人工智能將很快全面戰(zhàn)勝人類(lèi),我認(rèn)為這是不正確的。
理論上來(lái)說(shuō),因?yàn)榻俚拇嬖?,圍棋是一種“上下文有關(guān)文法”,同樣一個(gè)局面,前一招是不是提劫,后續(xù)邏輯就會(huì)完全不一樣(按中國(guó)規(guī)則禁止全局同形再現(xiàn),有更多形式的“上下文有關(guān)”,但最常見(jiàn)的是劫)。而國(guó)際象棋、中國(guó)象棋等棋種是“上下文無(wú)關(guān)文法”,當(dāng)前局面如何形成的不影響后面結(jié)果。圍棋的復(fù)雜性,廣為人知的是狀態(tài)空間數(shù)比國(guó)際象棋多100多個(gè)0。但是從圍棋藝術(shù)和計(jì)算機(jī)算法角度來(lái)看,這種“上下文有關(guān)”造成的復(fù)雜性,遠(yuǎn)遠(yuǎn)超乎人的想象。下棋的人都知道,劫是讓圍棋的境界與藝術(shù)性大大升華的一個(gè)東西?;贛CTS的國(guó)際象棋程序,因?yàn)椤吧舷挛臒o(wú)關(guān)”,可以用多次模擬完美逼近看似很大的搜索空間。但是在圍棋上,“上下文有關(guān)”的劫,因?yàn)榭梢栽谌P(pán)任何一處找劫,MCTS算法的分枝數(shù)量瞬間爆炸,對(duì)搜索質(zhì)量造成毀滅性的打擊。這還只是一些簡(jiǎn)單的劫爭(zhēng)。如果再考慮緩氣劫、兩手劫、連環(huán)劫、多劫循環(huán),可以說(shuō)圍棋搜索算法僅僅只摸到打劫的邊,根本沒(méi)有深入劫爭(zhēng)問(wèn)題的核心。
可以想象將圍棋盤(pán)擴(kuò)大到21路,狀態(tài)空間數(shù)又多幾十個(gè)0,AlphaGo訓(xùn)練之后在劃分地盤(pán)這個(gè)核心能力上還是可以超過(guò)人類(lèi),并不怕?tīng)顟B(tài)空間增多。但是就算棋盤(pán)縮小到17路,AlphaGo也還是不喜歡打劫。只要還是MCTS算法框架,面對(duì)劫爭(zhēng)程序開(kāi)發(fā)者想過(guò)各種處理辦法,都沒(méi)能很好應(yīng)對(duì)復(fù)雜的劫爭(zhēng)。谷歌團(tuán)隊(duì)也不太可能在這個(gè)問(wèn)題上取得突破性進(jìn)展。
可以非常有把握地說(shuō),打劫的能力將是人類(lèi)遠(yuǎn)遠(yuǎn)強(qiáng)于圍棋程序的地方。但是這個(gè)問(wèn)題上機(jī)器也不是沒(méi)有出路,AlphaGo就向我們展示了如何通過(guò)避開(kāi)劫爭(zhēng)分枝來(lái)控制局面。人類(lèi)如何通過(guò)行棋,將機(jī)器逼得不得不打劫,會(huì)是一個(gè)很有意思的技術(shù)問(wèn)題。從圍棋理論上來(lái)說(shuō),一方不怕打劫,一方拼命避劫,總是善于打劫的一方有利一些,高手善打劫。人類(lèi)最高水平的棋手打劫能力是9段,機(jī)器的打劫能力可能只有業(yè)余3段。按AlphaGo把劫材走光的風(fēng)格,它不可能是一個(gè)劫爭(zhēng)高手。但是人類(lèi)高手也沒(méi)有這樣的經(jīng)驗(yàn),如果將一個(gè)不配合的卻棋藝高超的對(duì)手逼入劫爭(zhēng)。
在對(duì)于非確定地域的價(jià)值估計(jì)上,AlphaGo可以通過(guò)幾百萬(wàn)次收完算子的統(tǒng)計(jì)模擬,對(duì)人類(lèi)有著壓倒性的技術(shù)優(yōu)勢(shì)。表現(xiàn)出來(lái)就是大局觀非常好,人類(lèi)最高水平是9段,AlphaGo可能有13段。
在封閉式局部的戰(zhàn)斗中,AlphaGo對(duì)人類(lèi)最高水平也仍然有優(yōu)勢(shì)。因?yàn)槿祟?lèi)存在算不清、得失判斷不清的問(wèn)題。這方面的能力對(duì)比AlphaGo是10段,人類(lèi)是9段。
在多個(gè)頭緒關(guān)聯(lián)的開(kāi)放式接觸戰(zhàn)中,不需要引入劫爭(zhēng)的復(fù)雜,AlphaGo的搜索模塊也會(huì)碰到不小的麻煩。因?yàn)轭^緒多,對(duì)殺結(jié)果決定勝敗,只有人類(lèi)高手能理清邏輯,找到正確的行棋路線(xiàn)圖。在這種復(fù)雜盤(pán)面,AlphaGo的三大搜索武器,價(jià)值網(wǎng)絡(luò)、快速走子策略、策略網(wǎng)絡(luò)全都失靈,就會(huì)忽然出現(xiàn)怪異的行棋選擇。這是人類(lèi)戰(zhàn)勝機(jī)器最有希望的領(lǐng)域,人類(lèi)是9段,機(jī)器只有業(yè)余5段。
在局部區(qū)域的定型手法中,AlphaGo出現(xiàn)了不保留變化早早定型的傾向。有些局面還會(huì)過(guò)早把手段使出來(lái),以目數(shù)絕對(duì)虧損收?qǐng)?。這都是小問(wèn)題。而人類(lèi)心理狀態(tài)不穩(wěn)定,很難做到持續(xù)穩(wěn)定地發(fā)揮出最高水平,是一個(gè)大問(wèn)題。
總體來(lái)說(shuō),AlphaGo和人類(lèi)高手風(fēng)格迥然不同。事先分析,AlphaGo和人類(lèi)高手各有所長(zhǎng),交鋒起來(lái)看點(diǎn)十足。AlphaGo會(huì)的,是在實(shí)戰(zhàn)中最經(jīng)常使用的。以大局觀為基礎(chǔ)的行棋方向選擇,是行棋中最常用最實(shí)用的本事,AlphaGo遠(yuǎn)超人類(lèi)。在局部接觸戰(zhàn)中,AlphaGo擁有類(lèi)似于窮舉的戰(zhàn)斗力,人類(lèi)占不到便宜(虧目是AlphaGo為了提升勝率的小bug行為,明知?dú)⒉贿^(guò)也下。真正對(duì)它有利的戰(zhàn)斗,它不會(huì)放過(guò))。這兩項(xiàng)本事都是最常用的,所以AlphaGo平時(shí)行棋就帶有一種獨(dú)特的魅力,時(shí)不時(shí)讓人類(lèi)驚嘆它的判斷力與創(chuàng)造力。人類(lèi)如果在這兩項(xiàng)技術(shù)上和AlphaGo斗爭(zhēng),將毫無(wú)勝算,甚至差距會(huì)越拉越大。
而人類(lèi)需要有意地將局面引入對(duì)自己這方有利的格局中。通過(guò)劫爭(zhēng),復(fù)雜盤(pán)面多處頭緒關(guān)聯(lián)分析,在適合于自己的戰(zhàn)場(chǎng)將AlphaGo擊潰。人類(lèi)互相之間針?shù)h相對(duì),很容易到達(dá)這種局面。然而AlphaGo會(huì)有意繞過(guò)劫爭(zhēng)分枝,搶先定型簡(jiǎn)化局勢(shì)。
雙方這樣各有所長(zhǎng),又特點(diǎn)鮮明,持續(xù)纏斗起來(lái)會(huì)非?;鸨袋c(diǎn)十足。我非常期待,職業(yè)棋手們能夠普遍了解AlphaGo的特性,制定正確的迎戰(zhàn)策略。而雙方又無(wú)疑會(huì)互相學(xué)習(xí),試圖減輕自己的弱點(diǎn),學(xué)習(xí)對(duì)方的長(zhǎng)處。如谷歌可能會(huì)通過(guò)持續(xù)訓(xùn)練與研發(fā),將AlphaGo的弱點(diǎn)隱藏得更深。而人類(lèi)一方面加強(qiáng)自己的大局觀與局部手段,另一方面又動(dòng)腦筋去使出手段將局面引導(dǎo)入劫爭(zhēng)、復(fù)雜盤(pán)面。從圍棋藝術(shù)發(fā)展來(lái)看,這會(huì)是一個(gè)非常激動(dòng)人心的歷史機(jī)遇。
因此,要非常感謝谷歌研發(fā)出了AlphaGo這么一個(gè)威力強(qiáng)大又十分有趣的好東西。人類(lèi)與機(jī)器激動(dòng)人心的纏斗不會(huì)很快結(jié)束,雙方的優(yōu)勢(shì)與弱點(diǎn)都會(huì)長(zhǎng)期存在。圍棋作為計(jì)算機(jī)算法“完全信息博弈”問(wèn)題中當(dāng)之無(wú)愧的皇冠,會(huì)進(jìn)一步展示出它真正的魅力,不會(huì)一下子被突破,很長(zhǎng)時(shí)間內(nèi)還會(huì)是核心難題。人類(lèi)也會(huì)不斷向機(jī)器學(xué)習(xí)它擅長(zhǎng)的領(lǐng)域,提高自己的技藝。圍棋歷史上又一次意義巨大的革命已經(jīng)在發(fā)生。
本文系觀察者網(wǎng)獨(dú)家稿件,文章內(nèi)容純屬作者個(gè)人觀點(diǎn),不代表平臺(tái)觀點(diǎn),未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。
-
本文僅代表作者個(gè)人觀點(diǎn)。
- 請(qǐng)支持獨(dú)立網(wǎng)站,轉(zhuǎn)發(fā)請(qǐng)注明本文鏈接:
- 責(zé)任編輯:陳佳靜
-
操心中國(guó),美國(guó)“黑手”又要伸向馬來(lái)西亞和泰國(guó) 評(píng)論 91特朗普要求“大搞特搞”,美團(tuán)體急了:沒(méi)中國(guó)不行 評(píng)論 124“美國(guó)人,真正該擔(dān)心的時(shí)候到了” 評(píng)論 174直播:算法向善——共話(huà)AI與人類(lèi)命運(yùn)共同體未來(lái) 評(píng)論 8“美國(guó)政府像青少年,拿信用卡揮霍,直到…” 評(píng)論 142最新聞 Hot
-
操心中國(guó),美國(guó)“黑手”又要伸向馬來(lái)西亞和泰國(guó)
-
“特朗普要想訪(fǎng)華,先把臺(tái)灣問(wèn)題說(shuō)清楚”
-
“對(duì)以色列感到憤怒和警惕,沙特將與伊朗保持和解”
-
特朗普又給日本背后捅刀,逼得臺(tái)積電沒(méi)法了…
-
“大而美”法案通過(guò),馬斯克表態(tài)
-
朱時(shí)茂自曝被騙錢(qián),“我還是反詐大使”
-
英F-35“趴窩”印度機(jī)場(chǎng)20天,快被“玩壞”了…
-
特朗普要求“大搞特搞”,美團(tuán)體急了:沒(méi)中國(guó)不行
-
“美國(guó)人,真正該擔(dān)心的時(shí)候到了”
-
涉及中國(guó),韓企與美國(guó)“一拍即合”
-
歐洲學(xué)者:現(xiàn)在,中國(guó)能不能反過(guò)來(lái)幫幫我們?
-
印度“硬剛”:將報(bào)復(fù)美國(guó)
-
“歐洲同行都覺(jué)得,未來(lái)十年誰(shuí)將主導(dǎo)已無(wú)懸念,不會(huì)是美國(guó)”
-
普京:全世界都想進(jìn)入中國(guó)市場(chǎng)
-
馬斯克:對(duì)!全面公布所有文件
-
美方恢復(fù)出口,“不是恩賜也不是讓步,是我們斗爭(zhēng)來(lái)的”
快訊- 精準(zhǔn)醫(yī)療迎來(lái)“關(guān)鍵年”,AI如何重塑人類(lèi)生命健康格局?
- “家庭主義者”盧特尼克,把歐盟鴿了
- “全國(guó)經(jīng)濟(jì)最強(qiáng)鎮(zhèn)”黨委書(shū)記,擬提拔
- “全球最大上市船企 ”來(lái)了
- 江蘇:縣級(jí)以下禁止開(kāi)發(fā)政務(wù)服務(wù)APP
- “中國(guó)足協(xié)球員自薦系統(tǒng)”超2.5萬(wàn)人注冊(cè),303人進(jìn)入備選庫(kù)
- 縣政協(xié)原主席董莉莉,追求低級(jí)趣味
- 浙江漁船納悶:交管為啥呼叫中國(guó)臺(tái)灣漁船?
-