當(dāng)前位置: 首頁 » 行業(yè)資訊 » 機(jī)器人»AlphaGo并未攻克圍棋難題，人類未來仍有希望

AlphaGo并未攻克圍棋難題，人類未來仍有希望

發(fā)布日期：2017-05-24 來源：雷鋒網(wǎng) 瀏覽次數(shù)：795

核心提示：　　5月23日AlphaGo2.0版本在人機(jī)圍棋競(jìng)賽中以1/4子的微弱優(yōu)勢(shì)克服了柯潔，一方面持續(xù)彰顯了人工智能的壯大，但也讓人們對(duì)AlphaGo和人工智能有了新的熟悉。先說出結(jié)論，再看剖析。　　1.在圍棋這個(gè)項(xiàng)目上AlphaGo今朝

　　5月23日AlphaGo2.0版本在人機(jī)圍棋競(jìng)賽中以1/4子的微弱優(yōu)勢(shì)克服了柯潔，一方面持續(xù)彰顯了人工智能的壯大，但也讓人們對(duì)AlphaGo和人工智能有了新的熟悉。先說出結(jié)論，再看剖析。

　　1.在圍棋這個(gè)項(xiàng)目上AlphaGo今朝走在了人類的后面，但并沒有完整霸占圍棋這項(xiàng)活動(dòng)。它只是經(jīng)由過程深度進(jìn)修找到了一個(gè)比人類熟悉更優(yōu)的解，但不是最優(yōu)解。最優(yōu)解沒法找到，即使用盡地球上一切的資本。從專業(yè)的角度來說，就是用深度進(jìn)修去切近親近了一個(gè)強(qiáng)化進(jìn)修中的價(jià)值斷定函數(shù)，然后再跟蒙特卡洛搜刮樹聯(lián)合的辦法（詳細(xì)詳解可參看《鄭宇：一張圖解ALphaGo道理及弱點(diǎn)》，不再反復(fù)）。既然人工智能和人類都不克不及找到最優(yōu)解，如今說哪一方曾經(jīng)完整完全的掉敗還早。

　　2. 人類也是在提高的，我們也不要低估了人類后天的疾速（小樣本）進(jìn)修才能，這點(diǎn)AlphaGo基于如今的進(jìn)修辦法還做不到。短時(shí)間來看人獲勝幾率小，但久遠(yuǎn)來看（將來5-10年）人還無機(jī)會(huì)，由于人也有很強(qiáng)的進(jìn)修才能，可以從大批跟AlphaGo的棋戰(zhàn)的棋局中疾速進(jìn)修。而即使再給AlphaGo1億副棋譜，再添加一萬塊GPU，假如照樣基于現(xiàn)有的進(jìn)修系統(tǒng)，它提高的速度也終將放緩，由于新增的棋譜和盤算資本絕對(duì)于2x10171這個(gè)搜刮空間來講只是九牛一毫。我們對(duì)人腦的懂得還遠(yuǎn)不如對(duì)圍棋的熟悉，這外面還有很年夜的未知數(shù)。

　　3. 今朝人類職業(yè)棋手跟AlphaGo的差距也就在一個(gè)貼目標(biāo)程度，沒有年夜家想象的那末年夜。其實(shí)這個(gè)貼目標(biāo)差距（按中國尺度7目半），退職業(yè)棋手看來，曾經(jīng)長短常年夜的差距了。許多職業(yè)高手，進(jìn)入官子階段后發(fā)明本身還落伍對(duì)方7-8目，就會(huì)自動(dòng)投子認(rèn)輸了。許多經(jīng)由過程數(shù)子來決議輸贏的競(jìng)賽，勝負(fù)常常都在1-2目之間（好比柯潔就輸給AlphaGo半目）。不然會(huì)被其他專業(yè)棋手笑話，本身落伍那末多都不曉得，點(diǎn)空才能太弱了。

　　要能真正客不雅、精確的對(duì)待這個(gè)成績急須要較強(qiáng)的人工智能專業(yè)常識(shí)，也須要必定的圍棋功底。上面先改正網(wǎng)上認(rèn)知的一些誤區(qū)：

　　誤區(qū)一：AlphaGo可讓人類頂尖棋手4個(gè)子，AlphaGo2.0可讓上一個(gè)版本4-5個(gè)子。

　　要清除這個(gè)誤會(huì)，起首要跟年夜家普及一下圍棋常識(shí)：在圍棋里“讓對(duì)方兩個(gè)子”和“贏對(duì)方2個(gè)子”有著天地之別。這點(diǎn)關(guān)于下圍棋的人不消多說，但我明天才認(rèn)識(shí)到，許多吃瓜大眾一向認(rèn)為這就是一回事。難怪網(wǎng)上會(huì)傳播以上的毛病談吐。

　　讓對(duì)方兩個(gè)子：在圍棋里讓2子是說讓一方先在棋盤上放上2個(gè)棋子（棋子只能放在星位），然后對(duì)剛剛開端走。這兩個(gè)子在棋戰(zhàn)之初的價(jià)值偉大，關(guān)于專業(yè)棋手來說，每一個(gè)棋子價(jià)值至多在10目以上（這是最守舊估量了）。讓兩子相當(dāng)于至多先讓出去對(duì)方20多目標(biāo)地皮。因?yàn)槠灞P是無限的，假如不克不及在前面的競(jìng)賽中，在無限的空間里贏回這20多目，那就是讓子掉敗了。并且讓子數(shù)越多，被讓方取得的價(jià)值不單是線性增加的，由于子力之間會(huì)構(gòu)成合營，獲得更年夜的好處。好比說，讓四子，其價(jià)值便可能遠(yuǎn)不止40目了。

　　贏對(duì)方2個(gè)子：是指兩邊下完后，贏的一方比輸?shù)囊环蕉喑?個(gè)子。假如依照吃住對(duì)方一個(gè)子算兩目標(biāo)辦法來算，那2個(gè)子只相當(dāng)于4目。AlphaGo贏了柯潔1/4子，就相當(dāng)于半目棋子罷了。

　　所以“讓對(duì)方兩個(gè)子”和“贏對(duì)方2個(gè)子”弗成同年而語。假如真的有圍棋之神存在（既他必定能找到最優(yōu)解，我們?nèi)耸菦]有愿望下過他的），普通頂尖專業(yè)棋手以為他們跟這個(gè)神的差距在讓2-3子之間。因?yàn)锳lphaGo可以被證實(shí)不克不及包管找到最優(yōu)解，所以他離神還有必定的間隔。是以，說AlphaGo可讓人類頂尖棋手4個(gè)子，這的確就是天方夜談。

　　誤區(qū)二：AlphaGo也會(huì)下出一些顯著欠好的招數(shù)，是由于他自我斷定情勢(shì)占優(yōu)，而抓緊了本身的請(qǐng)求。

　　AlphaGo的搜刮戰(zhàn)略就是優(yōu)先對(duì)獲勝幾率比擬年夜的分支停止更多的深度搜刮，這個(gè)戰(zhàn)略在任什么時(shí)候候都不會(huì)轉(zhuǎn)變，也不克不及轉(zhuǎn)變。他不會(huì)認(rèn)為本身優(yōu)勢(shì)了就下出緩手。下得欠好的時(shí)刻是由于其價(jià)值斷定原來就是一個(gè)近似，并且搜刮空間也不克不及窮盡，得不到最優(yōu)解，是以，有時(shí)估量還不錯(cuò)的棋，其實(shí)紛歧定是真的最好的下法，AlphaGo涌現(xiàn)這類不穩(wěn)固狀態(tài)是正常的。這也是人類善存的愿望地點(diǎn)。固然人類也有本身的弱點(diǎn)，如疲憊、情感動(dòng)搖等，人也會(huì)斷定掉誤。并且棋局很長，有些之前不太好的棋，經(jīng)由前面的變更（包含不是預(yù)感中的變更）有能夠會(huì)釀成好棋。所以，不是一切的毛病，都邑直接影響到競(jìng)賽的成果。并且如今年夜家仿佛有點(diǎn)怕AlphaGo了，即使是AlphaGo下出一招欠好的棋，年夜家更多的是疑惑本身的程度（是否是我們沒看懂啊？），而選擇信任AlphaGo的“深謀遠(yuǎn)慮“。

　　誤區(qū)三：AlphaGo可以賡續(xù)自進(jìn)修，重新的棋局里獲得經(jīng)歷，疾速晉升本身。

　　AlphaGo的體系因?yàn)閰?shù)異常多，須要年夜量的數(shù)據(jù)來練習(xí)，新增的幾幅棋譜對(duì)進(jìn)步它的棋力起不就任何感化。并且AlphaGo在做參數(shù)調(diào)劑時(shí)是針對(duì)一年夜批數(shù)據(jù)的全體優(yōu)化，也必需對(duì)許多棋譜做批量處置，練習(xí)時(shí)光異常長，弗成能在很短時(shí)光內(nèi)年夜幅晉升本身的程度。即使是統(tǒng)一組練習(xí)棋譜，參數(shù)調(diào)劑辦法紛歧樣也會(huì)練習(xí)出棋力程度差別較年夜的體系。其實(shí)AlphaGo是經(jīng)由過程自我棋戰(zhàn)來生成許多棋譜，然后應(yīng)用棋譜中的（兩個(gè)持續(xù)的）盤面跟最初的輸贏對(duì)應(yīng)關(guān)系練習(xí)出價(jià)值收集來。這里只是借用了一下強(qiáng)化進(jìn)修的框架來練習(xí)深度神經(jīng)收集的參數(shù)罷了，重要進(jìn)獻(xiàn)照樣深度進(jìn)修的近似才能帶來的（處理了傳統(tǒng)強(qiáng)化進(jìn)修針對(duì)龐雜情況和舉措狀況沒法求解的困難）。是以，AlphaGo并沒有年夜家想象的那種自我博弈就可以本身賡續(xù)提高的才能。

　　誤區(qū)四：AlphaGo會(huì)有意放水輸失落一局競(jìng)賽。

　　這個(gè)沒有能夠。要想輸還不克不及輸?shù)哪悄┖每春惋@著，是一件異常難辦的工作，能夠比贏棋還要難。在模子練習(xí)好以后，AlphaGo可以或許暫時(shí)修改的只要在搜刮部門投入的資本若干（搜刮多年夜的空間）可以修改。縮減的太小，簡(jiǎn)直不會(huì)有太年夜變更，但假如縮減太多，就會(huì)下出一些異常初級(jí)的棋來。這點(diǎn)從技巧角度來說很難掌握。

　　誤區(qū)五：盤算機(jī)的盤算才能必定比人強(qiáng)，所以不要去跟AlphaGo比盤算，應(yīng)當(dāng)把局勢(shì)簡(jiǎn)略化，防止龐雜的戰(zhàn)役。

　　AlphaGo依附的是一種基于樹的搜刮算法，碰到龐雜局勢(shì)搜刮空間變年夜，對(duì)將來勝負(fù)的價(jià)值斷定也會(huì)變難。是以，人算不外來的龐雜局勢(shì)，對(duì)AlphaGo來講也很艱苦。假如局勢(shì)太簡(jiǎn)略，機(jī)械可以異常好的盤算出比擬優(yōu)的解，人類棋手加倍沒有愿望。是以，把局勢(shì)弄龐雜，人類棋手才有愿望獲勝，固然這個(gè)對(duì)人類也提出了更年夜的挑釁。

　　總結(jié)

　　基于人類今朝對(duì)圍棋的熟悉和懂得，現(xiàn)階段依然會(huì)輸給人工智能。我其實(shí)不是認(rèn)為柯潔有愿望可以或許博得前面的競(jìng)賽，但人類也在提高，經(jīng)由過程跟AlphaGo的棋戰(zhàn)，人類也在從新熟悉圍棋。只需人類的思惟和文明在賡續(xù)提高，人就有能夠在將來5-10年里經(jīng)由過程賡續(xù)的進(jìn)修遇上以后的AlphaGo。固然，AlphaGo也會(huì)提高，但它還不是圍棋之神，也沒有霸占圍棋這個(gè)困難。假如現(xiàn)有的進(jìn)修辦法沒有周全的改革，其提高的速度也會(huì)漸漸放緩。基于此斟酌，人類還會(huì)無機(jī)會(huì)。當(dāng)人們對(duì)圍棋有了更深刻的懂得以后，又會(huì)設(shè)計(jì)出更好的人工智能算法。二者其實(shí)其實(shí)不抵觸，相反相成，相互增進(jìn)，不論誰輸誰贏都是人類文明提高的表現(xiàn)。人類的智能也將一直走在機(jī)械的后面，而不會(huì)被機(jī)械代替。

下一篇：PK阿里
上一篇：POWERLINK已獲批為IEEE工業(yè)硬實(shí)時(shí)通信標(biāo)準(zhǔn)

[ 行業(yè)資訊搜索 ] [ 加入收藏 ] [ 告訴好友 ] [ 打印本文 ] [ 關(guān)閉窗口 ]

同類行業(yè)資訊

共0條 [查看全部] 相關(guān)評(píng)論

展會(huì)更多+

第26屆上海國際清	2025數(shù)控機(jī)床與金
2025中國(上海)機(jī)	2025武漢國際工業(yè)

視頻更多+

中舟智能固守科技	玉灃科技：精研滑
新松機(jī)器人自動(dòng)化	羅克韋爾自動(dòng)化（

亞洲自動(dòng)化與機(jī)器人網(wǎng) - 版權(quán)所有

• 首批人形機(jī)器人技術(shù)國標(biāo)立項(xiàng)	• 首個(gè)人形機(jī)器人應(yīng)用示范區(qū)有望落地廣州
• 從搬箱子到分揀！人形機(jī)器人工業(yè)領(lǐng)域10-20萬臺(tái)	• 美的人形機(jī)器人5月進(jìn)廠，下半年進(jìn)入線下門店
• 港仔機(jī)器人實(shí)現(xiàn)資本與科技合璧以標(biāo)準(zhǔn)化推動(dòng)人	• “量產(chǎn)元年” 人形機(jī)器人加速落地多場(chǎng)景
• 動(dòng)易科技完成超億元天使輪融資，將發(fā)布首款全尺	• 浙江溫嶺：生產(chǎn)機(jī)器人供市場(chǎng)
• 緯鈦機(jī)器人完成近億元融資，聚焦機(jī)器人仿生感知	• 這項(xiàng)國家標(biāo)準(zhǔn)由越疆機(jī)器人參與牽頭定制，已正式

天堂色网-天堂色综合-天堂社区在线观看-天堂社区在线视频-天天操网-天天操网站

我的供應(yīng)

我的求購

商鋪管理

工業(yè)機(jī)器人及行業(yè)應(yīng)用

智能機(jī)器人

工業(yè)自動(dòng)化

智能裝備

AlphaGo并未攻克圍棋難題，人類未來仍有希望