日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

AlphaGo的神奇全靠它,詳解人工神經(jīng)網(wǎng)絡(luò)!( 二 )


經(jīng)過(guò)這兩個(gè)階段的訓(xùn)練,神經(jīng)網(wǎng)絡(luò)就可以同圍棋業(yè)余愛(ài)好者下一盤不錯(cuò)的棋了 。但對(duì)于職業(yè)來(lái)講,它還有很長(zhǎng)的路要走 。在某種意義上 , 它并不思考每一手之后的幾步棋 , 而是通過(guò)對(duì)未來(lái)結(jié)果的推算來(lái)決定下在哪里 。為了達(dá)到職業(yè)級(jí)別 , AlphaGp需要一種新的估算方法 。
為了克服這一障礙,研究人員采取的辦法是讓它反復(fù)的和自己進(jìn)行對(duì)戰(zhàn),以此來(lái)使其不斷其對(duì)于勝利的估算能力 。盡可能的提高每一步的獲勝概率 。(在實(shí)踐中,AlphaGo對(duì)這個(gè)想法進(jìn)行了稍微復(fù)雜的調(diào)整 。)然后,AlphaGo再結(jié)合多線程來(lái)使用這一方法進(jìn)行下棋 。
我們可以看到,AlphaGo的評(píng)估系統(tǒng)并沒(méi)有基于太多的圍棋知識(shí),通過(guò)分析現(xiàn)有的無(wú)數(shù)場(chǎng)比賽的棋譜,以及無(wú)數(shù)次的自我對(duì)戰(zhàn)練習(xí) , AlphaGo的神經(jīng)網(wǎng)絡(luò)進(jìn)行了數(shù)以十億計(jì)的微小調(diào)整,即便每次只是一個(gè)很小的增量改進(jìn) 。這些調(diào)整幫助AlphaGp建立了一個(gè)估值系統(tǒng),這和那些出色圍棋選手的直覺(jué)相似,對(duì)于棋盤上的每一步棋都了如指掌 。
此外AlphaGo也使用搜索和優(yōu)化的思想,再加上神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)功能,這兩者有助于找到棋盤上更好的位置 。這也是目前AlphaGo能夠高水平發(fā)揮的原因 。
3神經(jīng)網(wǎng)絡(luò)的延伸和限制回頂部
神經(jīng)網(wǎng)絡(luò)的延伸和限制
神經(jīng)網(wǎng)絡(luò)的這種能力也可以被用在其他方面,比如讓神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)一種藝術(shù)風(fēng)格,然后再將這種風(fēng)格應(yīng)用到其他圖像上 。這種想法很簡(jiǎn)單:首先讓神經(jīng)網(wǎng)絡(luò)接觸到大量的圖像,然后來(lái)確認(rèn)這些圖像的風(fēng)格,接著將新的圖像帶入這種風(fēng)格 。
這雖然不是偉大的藝術(shù),但它仍然是一個(gè)顯著的利用神經(jīng)網(wǎng)絡(luò)來(lái)捕捉直覺(jué)并且應(yīng)用在其他地方的例子 。
在過(guò)去的幾年中,神經(jīng)網(wǎng)絡(luò)在許多領(lǐng)域被用來(lái)捕捉直覺(jué)和模式識(shí)別 。許多項(xiàng)目使用神經(jīng)這些網(wǎng)絡(luò),涉及的任務(wù)如識(shí)別藝術(shù)風(fēng)格或好的視頻游戲的發(fā)展戰(zhàn)略 。但也有非常不同的網(wǎng)絡(luò)模擬的直覺(jué)驚人的例子,比如語(yǔ)音和自然語(yǔ)言 。
由于這種多樣性,我看到AlphaGo本身不是一個(gè)革命性的突破,而是作為一個(gè)極其重要的發(fā)展前沿:建立系統(tǒng),可以捕捉的直覺(jué)和學(xué)會(huì)識(shí)別模式的能力 。此前計(jì)算機(jī)科學(xué)家們已經(jīng)做了幾十年,沒(méi)有取得長(zhǎng)足的進(jìn)展 。但現(xiàn)在,神經(jīng)網(wǎng)絡(luò)的成功已經(jīng)大大擴(kuò)大,我們可以利用電腦攻擊范圍內(nèi)的潛在問(wèn)題 。
事實(shí)上,目前現(xiàn)有的神經(jīng)網(wǎng)絡(luò)的理解能力是非常差的 。神經(jīng)網(wǎng)絡(luò)很容易被愚弄 。用神經(jīng)網(wǎng)絡(luò)識(shí)別圖像是一個(gè)不錯(cuò)的手段 。但是實(shí)驗(yàn)證明,通過(guò)對(duì)圖像進(jìn)行細(xì)微的改動(dòng),就可以愚弄圖像 。例如,下面的圖像左邊的圖是原始圖 , 研究人員對(duì)中間的圖像進(jìn)行了微小的調(diào)整后,神經(jīng)網(wǎng)絡(luò)就無(wú)法區(qū)分了 , 就將原圖顯示了出來(lái) 。
【AlphaGo的神奇全靠它,詳解人工神經(jīng)網(wǎng)絡(luò)!】另一個(gè)限制是 , 現(xiàn)有的系統(tǒng)往往需要許多模型來(lái)學(xué)習(xí) 。例如 , AlphaGo從150000場(chǎng)對(duì)戰(zhàn)來(lái)學(xué)習(xí) 。這是一個(gè)很龐大額度數(shù)字!很多情況下,顯然無(wú)法提供如此龐大的模型案例 。

推薦閱讀