天堂色网-天堂色综合-天堂社区在线观看-天堂社区在线视频-天天操网-天天操网站

 
當(dāng)前位置: 首頁 » 行業(yè)資訊 » 機(jī)器人»AlphaGo并未攻克圍棋難題,人類未來仍有希望
   

AlphaGo并未攻克圍棋難題,人類未來仍有希望

 46.1K
     [點(diǎn)擊復(fù)制]
放大字體  縮小字體 發(fā)布日期:2017-05-24   來源:雷鋒網(wǎng)   瀏覽次數(shù):795
核心提示:  5月23日AlphaGo2.0版本在人機(jī)圍棋競(jìng)賽中以1/4子的微弱優(yōu)勢(shì)克服了柯潔,一方面持續(xù)彰顯了人工智能的壯大,但也讓人們對(duì)AlphaGo和人工智能有了新的熟悉。先說出結(jié)論,再看剖析。  1.在圍棋這個(gè)項(xiàng)目上AlphaGo今朝

  5月23日AlphaGo2.0版本在人機(jī)圍棋競(jìng)賽中以1/4子的微弱優(yōu)勢(shì)克服了柯潔,一方面持續(xù)彰顯了人工智能的壯大,但也讓人們對(duì)AlphaGo和人工智能有了新的熟悉。先說出結(jié)論,再看剖析。

  1.在圍棋這個(gè)項(xiàng)目上AlphaGo今朝走在了人類的后面,但并沒有完整霸占圍棋這項(xiàng)活動(dòng)。它只是經(jīng)由過程深度進(jìn)修找到了一個(gè)比人類熟悉更優(yōu)的解,但不是最優(yōu)解。最優(yōu)解沒法找到,即使用盡地球上一切的資本。從專業(yè)的角度來說,就是用深度進(jìn)修去切近親近了一個(gè)強(qiáng)化進(jìn)修中的價(jià)值斷定函數(shù),然后再跟蒙特卡洛搜刮樹聯(lián)合的辦法(詳細(xì)詳解可參看《鄭宇:一張圖解ALphaGo道理及弱點(diǎn)》,不再反復(fù))。既然人工智能和人類都不克不及找到最優(yōu)解,如今說哪一方曾經(jīng)完整完全的掉敗還早。

  2. 人類也是在提高的,我們也不要低估了人類后天的疾速(小樣本)進(jìn)修才能,這點(diǎn)AlphaGo基于如今的進(jìn)修辦法還做不到。短時(shí)間來看人獲勝幾率小,但久遠(yuǎn)來看(將來5-10年)人還無機(jī)會(huì),由于人也有很強(qiáng)的進(jìn)修才能,可以從大批跟AlphaGo的棋戰(zhàn)的棋局中疾速進(jìn)修。而即使再給AlphaGo1億副棋譜,再添加一萬塊GPU,假如照樣基于現(xiàn)有的進(jìn)修系統(tǒng),它提高的速度也終將放緩,由于新增的棋譜和盤算資本絕對(duì)于2x10171這個(gè)搜刮空間來講只是九牛一毫。我們對(duì)人腦的懂得還遠(yuǎn)不如對(duì)圍棋的熟悉,這外面還有很年夜的未知數(shù)。

  3. 今朝人類職業(yè)棋手跟AlphaGo的差距也就在一個(gè)貼目標(biāo)程度,沒有年夜家想象的那末年夜。其實(shí)這個(gè)貼目標(biāo)差距(按中國尺度7目半),退職業(yè)棋手看來,曾經(jīng)長短常年夜的差距了。許多職業(yè)高手,進(jìn)入官子階段后發(fā)明本身還落伍對(duì)方7-8目,就會(huì)自動(dòng)投子認(rèn)輸了。許多經(jīng)由過程數(shù)子來決議輸贏的競(jìng)賽,勝負(fù)常常都在1-2目之間(好比柯潔就輸給AlphaGo半目)。不然會(huì)被其他專業(yè)棋手笑話,本身落伍那末多都不曉得,點(diǎn)空才能太弱了。

  要能真正客不雅、精確的對(duì)待這個(gè)成績急須要較強(qiáng)的人工智能專業(yè)常識(shí),也須要必定的圍棋功底。上面先改正網(wǎng)上認(rèn)知的一些誤區(qū):

  誤區(qū)一:AlphaGo可讓人類頂尖棋手4個(gè)子,AlphaGo2.0可讓上一個(gè)版本4-5個(gè)子。

  要清除這個(gè)誤會(huì),起首要跟年夜家普及一下圍棋常識(shí):在圍棋里“讓對(duì)方兩個(gè)子”和“贏對(duì)方2個(gè)子”有著天地之別。這點(diǎn)關(guān)于下圍棋的人不消多說,但我明天才認(rèn)識(shí)到,許多吃瓜大眾一向認(rèn)為這就是一回事。難怪網(wǎng)上會(huì)傳播以上的毛病談吐。

  讓對(duì)方兩個(gè)子: 在圍棋里讓2子是說讓一方先在棋盤上放上2個(gè)棋子(棋子只能放在星位),然后對(duì)剛剛開端走。這兩個(gè)子在棋戰(zhàn)之初的價(jià)值偉大,關(guān)于專業(yè)棋手來說,每一個(gè)棋子價(jià)值至多在10目以上(這是最守舊估量了)。讓兩子相當(dāng)于至多先讓出去對(duì)方20多目標(biāo)地皮。因?yàn)槠灞P是無限的,假如不克不及在前面的競(jìng)賽中,在無限的空間里贏回這20多目,那就是讓子掉敗了。并且讓子數(shù)越多,被讓方取得的價(jià)值不單是線性增加的,由于子力之間會(huì)構(gòu)成合營,獲得更年夜的好處。好比說,讓四子,其價(jià)值便可能遠(yuǎn)不止40目了。

  贏對(duì)方2個(gè)子:是指兩邊下完后,贏的一方比輸?shù)囊环蕉喑?個(gè)子。假如依照吃住對(duì)方一個(gè)子算兩目標(biāo)辦法來算,那2個(gè)子只相當(dāng)于4目。AlphaGo贏了柯潔1/4子,就相當(dāng)于半目棋子罷了。

  所以“讓對(duì)方兩個(gè)子”和“贏對(duì)方2個(gè)子”弗成同年而語。假如真的有圍棋之神存在(既他必定能找到最優(yōu)解,我們?nèi)耸菦]有愿望下過他的),普通頂尖專業(yè)棋手以為他們跟這個(gè)神的差距在讓2-3子之間。因?yàn)锳lphaGo可以被證實(shí)不克不及包管找到最優(yōu)解,所以他離神還有必定的間隔。是以,說AlphaGo可讓人類頂尖棋手4個(gè)子,這的確就是天方夜談。

  誤區(qū)二:AlphaGo也會(huì)下出一些顯著欠好的招數(shù),是由于他自我斷定情勢(shì)占優(yōu),而抓緊了本身的請(qǐng)求。

  AlphaGo的搜刮戰(zhàn)略就是優(yōu)先對(duì)獲勝幾率比擬年夜的分支停止更多的深度搜刮,這個(gè)戰(zhàn)略在任什么時(shí)候候都不會(huì)轉(zhuǎn)變,也不克不及轉(zhuǎn)變。他不會(huì)認(rèn)為本身優(yōu)勢(shì)了就下出緩手。下得欠好的時(shí)刻是由于其價(jià)值斷定原來就是一個(gè)近似,并且搜刮空間也不克不及窮盡,得不到最優(yōu)解,是以,有時(shí)估量還不錯(cuò)的棋,其實(shí)紛歧定是真的最好的下法,AlphaGo涌現(xiàn)這類不穩(wěn)固狀態(tài)是正常的。這也是人類善存的愿望地點(diǎn)。固然人類也有本身的弱點(diǎn),如疲憊、情感動(dòng)搖等,人也會(huì)斷定掉誤。并且棋局很長,有些之前不太好的棋,經(jīng)由前面的變更(包含不是預(yù)感中的變更)有能夠會(huì)釀成好棋。所以,不是一切的毛病,都邑直接影響到競(jìng)賽的成果。并且如今年夜家仿佛有點(diǎn)怕AlphaGo了,即使是AlphaGo下出一招欠好的棋,年夜家更多的是疑惑本身的程度(是否是我們沒看懂啊?),而選擇信任AlphaGo的“深謀遠(yuǎn)慮“。

  誤區(qū)三:AlphaGo可以賡續(xù)自進(jìn)修,重新的棋局里獲得經(jīng)歷,疾速晉升本身。

  AlphaGo的體系因?yàn)閰?shù)異常多,須要年夜量的數(shù)據(jù)來練習(xí),新增的幾幅棋譜對(duì)進(jìn)步它的棋力起不就任何感化。并且AlphaGo在做參數(shù)調(diào)劑時(shí)是針對(duì)一年夜批數(shù)據(jù)的全體優(yōu)化,也必需對(duì)許多棋譜做批量處置,練習(xí)時(shí)光異常長,弗成能在很短時(shí)光內(nèi)年夜幅晉升本身的程度。即使是統(tǒng)一組練習(xí)棋譜,參數(shù)調(diào)劑辦法紛歧樣也會(huì)練習(xí)出棋力程度差別較年夜的體系。其實(shí)AlphaGo是經(jīng)由過程自我棋戰(zhàn)來生成許多棋譜,然后應(yīng)用棋譜中的(兩個(gè)持續(xù)的)盤面跟最初的輸贏對(duì)應(yīng)關(guān)系練習(xí)出價(jià)值收集來。這里只是借用了一下強(qiáng)化進(jìn)修的框架來練習(xí)深度神經(jīng)收集的參數(shù)罷了,重要進(jìn)獻(xiàn)照樣深度進(jìn)修的近似才能帶來的(處理了傳統(tǒng)強(qiáng)化進(jìn)修針對(duì)龐雜情況和舉措狀況沒法求解的困難)。是以,AlphaGo并沒有年夜家想象的那種自我博弈就可以本身賡續(xù)提高的才能。

  誤區(qū)四:AlphaGo會(huì)有意放水輸失落一局競(jìng)賽。

  這個(gè)沒有能夠。要想輸還不克不及輸?shù)哪悄┖每春惋@著,是一件異常難辦的工作,能夠比贏棋還要難。在模子練習(xí)好以后,AlphaGo可以或許暫時(shí)修改的只要在搜刮部門投入的資本若干(搜刮多年夜的空間)可以修改。縮減的太小,簡(jiǎn)直不會(huì)有太年夜變更,但假如縮減太多,就會(huì)下出一些異常初級(jí)的棋來。這點(diǎn)從技巧角度來說很難掌握。

  誤區(qū)五:盤算機(jī)的盤算才能必定比人強(qiáng),所以不要去跟AlphaGo比盤算,應(yīng)當(dāng)把局勢(shì)簡(jiǎn)略化,防止龐雜的戰(zhàn)役。

  AlphaGo依附的是一種基于樹的搜刮算法,碰到龐雜局勢(shì)搜刮空間變年夜,對(duì)將來勝負(fù)的價(jià)值斷定也會(huì)變難。是以,人算不外來的龐雜局勢(shì),對(duì)AlphaGo來講也很艱苦。假如局勢(shì)太簡(jiǎn)略,機(jī)械可以異常好的盤算出比擬優(yōu)的解,人類棋手加倍沒有愿望。是以,把局勢(shì)弄龐雜,人類棋手才有愿望獲勝,固然這個(gè)對(duì)人類也提出了更年夜的挑釁。

  總結(jié)

  基于人類今朝對(duì)圍棋的熟悉和懂得,現(xiàn)階段依然會(huì)輸給人工智能。我其實(shí)不是認(rèn)為柯潔有愿望可以或許博得前面的競(jìng)賽,但人類也在提高,經(jīng)由過程跟AlphaGo的棋戰(zhàn),人類也在從新熟悉圍棋。只需人類的思惟和文明在賡續(xù)提高,人就有能夠在將來5-10年里經(jīng)由過程賡續(xù)的進(jìn)修遇上以后的AlphaGo。固然,AlphaGo也會(huì)提高,但它還不是圍棋之神,也沒有霸占圍棋這個(gè)困難。假如現(xiàn)有的進(jìn)修辦法沒有周全的改革,其提高的速度也會(huì)漸漸放緩。基于此斟酌,人類還會(huì)無機(jī)會(huì)。當(dāng)人們對(duì)圍棋有了更深刻的懂得以后,又會(huì)設(shè)計(jì)出更好的人工智能算法。二者其實(shí)其實(shí)不抵觸,相反相成,相互增進(jìn),不論誰輸誰贏都是人類文明提高的表現(xiàn)。人類的智能也將一直走在機(jī)械的后面,而不會(huì)被機(jī)械代替。

 
 
 
[ 行業(yè)資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關(guān)閉窗口 ]
 
 
展會(huì)更多+
視頻更多+
點(diǎn)擊排行
 
網(wǎng)站首頁 | 網(wǎng)站地圖 | 排名推廣 | 廣告服務(wù) | 積分換禮 | 網(wǎng)站留言 | RSS訂閱
主站蜘蛛池模板: 一级成人a免费视频 | 午夜网站在线观看免费网址免费 | 国产视频网站在线观看 | 91精品国产品国语在线不卡 | 成人精品一区二区www | 日本高清视频wwww色 | 18free性欧美另类hd | 欧美亚洲综合另类成人 | 欧美性v视频播放 | 91麻豆最新在线人成免费观看 | 97国产大学生情侣11在线视频 | 国产一级特黄 | 国产成人精品三级91在线影院 | 伦理剧在线播放 | 99精品免费视频 | 爆操欧美 | 亚洲作爱视频 | 国产欧美专区在线观看 | 欧美影片一区二区三区 | 激情综合久久 | 欧美成人午夜不卡在线视频 | 黄色在线不卡 | 国产黄色片在线播放 | 在线观看视频免费 | 最刺激黄a大片免费观看下截 | 欧美精品亚洲精品日韩专区 | 午夜影院一区 | 日韩欧美中字 | 91在线公开视频 | 久久国产成人精品国产成人亚洲 | 亚洲va欧美va| 青草草在线视频 | 91一级片 | 中国xxxx真实自拍hd | 国产精品嫩草影院奶水 | 五月天婷婷久久 | 亚洲视频在线观 | 在线一区三区四区产品动漫 | 丝袜紧身裙国产在线播放 | 婷婷人人爽人人爽人人片 | 男人操女人在线观看 |