久久久国产一区二区_国产精品av电影_日韩精品中文字幕一区二区三区_精品一区二区三区免费毛片爱

 找回密碼
 注冊(cè)會(huì)員

QQ登錄

只需一步,快速開(kāi)始

搜索
查看: 4128|回復(fù): 6

人工智能終于在圍棋游戲上擊敗人類(lèi)

[復(fù)制鏈接]
1#
發(fā)表于 2016-2-18 19:04:36 | 只看該作者 |正序?yàn)g覽 |閱讀模式
據(jù)日本共同社1月28日?qǐng)?bào)道,英國(guó)《自然》雜志當(dāng)?shù)貢r(shí)間27日發(fā)文稱(chēng),美國(guó)google公司旗下的人工智能(AI)開(kāi)發(fā)商“DeepMind”(位于英國(guó))研發(fā)的圍棋電腦軟件“AlphaGo”(阿爾法圍棋)打敗了職業(yè)棋手,開(kāi)創(chuàng)全球先河。  圍棋下法復(fù)雜,一般認(rèn)為圍棋的對(duì)弈軟件開(kāi)發(fā)比國(guó)際象棋和日本將棋更難,此次憑借人工智能新技術(shù)大幅提高了判斷力。開(kāi)發(fā)人員等召開(kāi)記者會(huì)時(shí)稱(chēng)“正因?yàn)橐?guī)則單純才很難做,可應(yīng)用于疾病圖像的診斷等需要判斷情況的場(chǎng)合”。; P( y4 h; a. S& {; M; O) T) K
  與“AlphaGo”一較高下的棋手是2013年至2015年的歐洲圍棋冠軍、生于中國(guó)的樊麾。2015年10月,雙方以正式比賽中使用的十九路棋盤(pán)進(jìn)行了無(wú)讓子的5局較量,“AlphaGo”贏(yíng)得滿(mǎn)堂紅。- \7 K6 _" }2 a+ g; A# X% u9 x. M: u4 U* w
  今年3月,“AlphaGo”將挑戰(zhàn)全球頂級(jí)的韓國(guó)九段棋手李世石,獎(jiǎng)金是100萬(wàn)美金。李世石表示:“(人工智能)厲害得讓人吃驚,聽(tīng)說(shuō)一直在進(jìn)化,不過(guò)我有信心取勝。”6 V  \  X/ [7 [1 ^2 g# A
  圍棋因?yàn)槠浞浅?fù)雜,之前最強(qiáng)的圍棋軟件基本上連業(yè)余棋手都無(wú)法戰(zhàn)勝,而google改變了思路,通過(guò)機(jī)器學(xué)習(xí)的方式提高AI,并且直接戰(zhàn)勝了圍棋職業(yè)棋手,如果今年3月份的比賽李世石戰(zhàn)敗的話(huà),人類(lèi)最后一個(gè)能戰(zhàn)勝人工智能的棋類(lèi)游戲就將終結(jié)了。
( i- \( o) ]) ~/ z  p* k+ t& T1952年計(jì)算機(jī)掌握了第一款游戲——井字棋 (也稱(chēng)三連棋),接下來(lái)是1994年的西洋跳棋,1997年,“深藍(lán)”贏(yíng)得了國(guó)際象棋比賽,國(guó)際象棋AI第一次打敗頂尖的人類(lèi);2006年,人類(lèi)最后一次打敗頂尖的國(guó)際象棋AI。歐美傳統(tǒng)里的頂級(jí)人類(lèi)智力試金石,在電腦面前終于一敗涂地,應(yīng)了四十多年前計(jì)算機(jī)科學(xué)家的預(yù)言。
; N& C$ H4 e1 f9 b6 o  J  至少還有東方,人們自我安慰道。圍棋AI長(zhǎng)期以來(lái)舉步維艱,頂級(jí)AI甚至不能打敗稍強(qiáng)的業(yè)余選手。長(zhǎng)期以來(lái),圍棋仍然是橫亙?cè)谌斯ぶ悄苎芯空呙媲暗碾y題:計(jì)算機(jī)的圍棋水平只能達(dá)到業(yè)余選手的程度。這似乎也合情合理:國(guó)際象棋中,平均每回合有35種可能,一盤(pán)棋可以有80回合;相比之下,圍棋每回合有250種可能,一盤(pán)棋可以長(zhǎng)達(dá)150回合。這一巨大的數(shù)目,足以令任何蠻力窮舉者望而卻步——而人類(lèi),我們相信,可以憑借某種難以復(fù)制的算法跳過(guò)蠻力,一眼看到棋盤(pán)的本質(zhì)。
+ J' g! E" K$ h. a' q7 {; b! n  但是,無(wú)論人怎么想,這樣的局面當(dāng)然不可能永遠(yuǎn)延續(xù)下去。就在今天,國(guó)際頂尖期刊《自然》報(bào)道了google研究者開(kāi)發(fā)的新圍棋AI。這款名為“阿爾法圍棋”(AlphaGo)的人工智能,在沒(méi)有任何讓子的情況下以5:0完勝歐洲冠軍,職業(yè)圍棋二段樊麾。/ p" k9 y# ?/ r8 m6 F& I: W) e
AI下圍棋到底有多難?
  }+ E( r' _: S$ M  計(jì)算圍棋是個(gè)極其復(fù)雜的問(wèn)題,比國(guó)際象棋要困難得多。圍棋最大有3361 種局面,大致的體量是10170,而已經(jīng)觀(guān)測(cè)到的宇宙中,原子的數(shù)量才1080。國(guó)際象棋最大只有2155種局面,稱(chēng)為香農(nóng)數(shù),大致是1047。/ d$ w! b+ p+ ]2 ~4 c, H4 l
  面對(duì)任何棋類(lèi),一種直觀(guān)又偷懶的思路是暴力列舉所有能贏(yíng)的方案,這些方案會(huì)形成一個(gè)樹(shù)形地圖。AI只要根據(jù)這個(gè)地圖下棋就能永遠(yuǎn)勝利。然而,圍棋一盤(pán)大約要下150步,每一步有250種可選的下法,所以粗略來(lái)說(shuō),要是AI用暴力列舉所有情況的方式,圍棋需要計(jì)算250150種情況,大致是10360。相對(duì)的,國(guó)際象棋每盤(pán)大約80步,每一步有35種可選下法,所以只要算3580種情況,大概是10124。無(wú)論如何,枚舉所有情況的方法不可行,所以研究者們需要用巧妙的方法來(lái)解決問(wèn)題,他們選擇了模仿人類(lèi)大師的下棋方式。" T9 u4 x4 Y. F5 {! F  y+ T7 ^
  機(jī)器學(xué)習(xí)  b; x. A. Q9 H( o
  研究者們祭出了終極殺器——“深度學(xué)習(xí)”(Deep Learning)。深度學(xué)習(xí)是目前人工智能領(lǐng)域中最熱門(mén)的科目,它能完成筆跡識(shí)別,面部識(shí)別,駕駛自動(dòng)汽車(chē),自然語(yǔ)言處理,識(shí)別聲音,分析生物信息數(shù)據(jù)等非常復(fù)雜的任務(wù)。
  b" D/ R5 M" w! l9 ?  傳統(tǒng)的人工智能方法是將所有可能的走法構(gòu)建成一棵搜索樹(shù) ,但這種方法對(duì)圍棋并不適用。所以在征服圍棋的過(guò)程中,google決定另辟蹊徑,將高級(jí)搜索樹(shù)與深度神經(jīng)網(wǎng)絡(luò)結(jié)合在一起。這些神經(jīng)網(wǎng)絡(luò)通過(guò)12個(gè)處理層傳遞對(duì)棋盤(pán)的描述,這些處理層包含數(shù)百萬(wàn)個(gè)類(lèi)似于神經(jīng)的連接點(diǎn)。其中一個(gè)神經(jīng)網(wǎng)絡(luò)“策略網(wǎng)絡(luò)”(policy network)選擇下一步走法,另一個(gè)神經(jīng)網(wǎng)絡(luò)“價(jià)值網(wǎng)絡(luò)”(value network)預(yù)測(cè)比賽勝利者。  s' F1 L5 t. ~( N, z
  google用人類(lèi)圍棋高手的三千萬(wàn)步圍棋走法訓(xùn)練神經(jīng)網(wǎng)絡(luò),直至神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)人類(lèi)走法的準(zhǔn)確率達(dá)到57%。不過(guò)google的目標(biāo)是擊敗最優(yōu)秀的人類(lèi)棋手,而不止是模仿他們。為了做到這一點(diǎn),AlphaGo學(xué)習(xí)自行研究新戰(zhàn)略,在它的神經(jīng)網(wǎng)絡(luò)之間運(yùn)行了數(shù)千局圍棋,利用反復(fù)試驗(yàn)調(diào)整連接點(diǎn),這個(gè)流程也稱(chēng)為鞏固學(xué)習(xí)(reinforcement learning)。
4 f# B# b1 D, f; ^& o$ j  {8 i  {9 L6 t

$ p0 f! @. D( B( U; Q- V. v, JAlphaGo 的核心是兩種不同的深度神經(jīng)網(wǎng)絡(luò)。“策略網(wǎng)絡(luò)”(policy network)和 “值網(wǎng)絡(luò)”(value network)。它們的任務(wù)在于合作“挑選”出那些比較有前途的棋步,拋棄明顯的差棋,從而將計(jì)算量控制在計(jì)算機(jī)可以完成的范圍里,本質(zhì)上和人類(lèi)棋手所做的一樣。/ s" G* S, i7 P5 o% w; h& s
  其中,“值網(wǎng)絡(luò)”負(fù)責(zé)減少搜索的深度——AI會(huì)一邊推算一邊判斷局面,局面明顯劣勢(shì)的時(shí)候,就直接拋棄某些路線(xiàn),不用一條道算到黑;而“策略網(wǎng)絡(luò)”負(fù)責(zé)減少搜索的寬度——面對(duì)眼前的一盤(pán)棋,有些棋步是明顯不該走的,比如不該隨便送子給別人吃。將這些信息放入一個(gè)概率函數(shù),AI就不用給每一步以同樣的重視程度,而可以重點(diǎn)分析那些有戲的棋著。
# v' {$ S8 b& H) DAlphaGo利用這兩個(gè)工具來(lái)分析局面,判斷每種下子策略的優(yōu)劣,就像人類(lèi)棋手會(huì)判斷當(dāng)前局面以及推斷未來(lái)的局面一樣。這樣AlphaGo在分析了比如未來(lái)20步的情況下,就能判斷在哪里下子贏(yíng)的概率會(huì)高。* q: k6 L* N, B2 H
  研究者們用許多專(zhuān)業(yè)棋局訓(xùn)練AI,這種方法稱(chēng)為監(jiān)督學(xué)習(xí)(supervised learning),然后讓AI和自己對(duì)弈,這種方法稱(chēng)為強(qiáng)化學(xué)習(xí)(reinforcement learning),每次對(duì)弈都能讓AI棋力精進(jìn)。然后他就能戰(zhàn)勝冠軍啦!
9 c5 h6 k# v; V. R; F" J# q& |  人類(lèi)在下棋時(shí)有一個(gè)劣勢(shì),在長(zhǎng)時(shí)間比賽后,他們會(huì)犯錯(cuò),但機(jī)器不會(huì)。而且人類(lèi)或許一年能玩1000局,但機(jī)器一天就能玩100萬(wàn)局。所以AlphaGo只要經(jīng)過(guò)了足夠的訓(xùn)練,就能擊敗所有的人類(lèi)選手。. W2 q! f* I+ ~7 H. p
人工智能研究者面對(duì)這樣的成就當(dāng)然欣喜。深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等技術(shù)完全可以用于更廣泛的領(lǐng)域。比如最近很火的精準(zhǔn)治療,我們可以訓(xùn)練它們判斷哪些治療方案對(duì)某個(gè)特定的人有效。* C' M6 B5 y0 g3 [: @5 r( w
  但是,圍棋畢竟不僅僅是一項(xiàng)智力成就。就像十多年前的國(guó)際象棋一樣,圍棋必定也會(huì)引發(fā)超出本領(lǐng)域之外的討論。等到計(jì)算機(jī)能在圍棋上秒殺人類(lèi)的時(shí)候,圍棋是不是就變成了一種無(wú)聊的游戲?人類(lèi)的智力成就是不是就貶值了?AI還將在其他層面上繼續(xù)碾壓人類(lèi)嗎?傳統(tǒng)認(rèn)為AI不可能完成的任務(wù)是否也都將被逐一打破?人類(lèi)最后是會(huì)進(jìn)入AI烏托邦還是被AI淘汰呢?2 u, _! S' S- A# t1 w) B
  沒(méi)人知道答案。但有一點(diǎn)毫無(wú)疑問(wèn):AI一定會(huì)進(jìn)入我們的生活,我們不可能躲開(kāi)。這一接觸雖然很可能悄無(wú)聲息,但意義或許不亞于我們第一次接觸外星生命。人工智能如果能實(shí)現(xiàn)自我學(xué)習(xí),那將是一件很可怕的事情,因?yàn)闄C(jī)器學(xué)習(xí)的速度遠(yuǎn)遠(yuǎn)高于人類(lèi)學(xué)習(xí)的速度,史蒂芬·霍金曾警告說(shuō)“一旦經(jīng)過(guò)人類(lèi)的開(kāi)發(fā),人工智能將會(huì)自行發(fā)展,以加速度重新設(shè)計(jì)自己。由于受到緩慢的生物演化的限制,人類(lèi)不能與之競(jìng)爭(zhēng),最終將會(huì)被代替”: q- T# [; }7 ~* D

9 x2 ?% |8 v5 N3 L  b7 {1 s6 P
( H0 h! ~- t0 q/ g

本帖子中包含更多資源

您需要 登錄 才可以下載或查看,沒(méi)有賬號(hào)?注冊(cè)會(huì)員

×
回復(fù)

使用道具 舉報(bào)

7#
發(fā)表于 2016-3-9 12:08:17 | 只看該作者
學(xué)習(xí)學(xué)習(xí) 呵呵
6#
發(fā)表于 2016-2-19 21:45:45 | 只看該作者
電腦走的是程序,是一種按照公式的邏輯推理,是死的,人是有反饋,思考,執(zhí)行,這個(gè)全過(guò)程的,機(jī)器人就是COPY前人的經(jīng)驗(yàn),人可以COPY,也可以創(chuàng)新
5#
發(fā)表于 2016-2-19 21:45:35 | 只看該作者
電腦走的是程序,是一種按照公式的邏輯推理,是死的,人是有反饋,思考,執(zhí)行,這個(gè)全過(guò)程的,機(jī)器人就是COPY前人的經(jīng)驗(yàn),人可以COPY,也可以創(chuàng)新
4#
發(fā)表于 2016-2-18 20:06:02 | 只看該作者
額,感覺(jué)沒(méi)什么,畢竟是程序么。。。
3#
發(fā)表于 2016-2-18 19:56:31 | 只看該作者
不同意樓上的想法,沒(méi)人說(shuō)機(jī)器完全替代人。但是每次技術(shù)進(jìn)步后,對(duì)人的需求就變少了。
2#
發(fā)表于 2016-2-18 19:38:45 | 只看該作者
據(jù)說(shuō)樊麾跑到中國(guó)來(lái)的話(huà),只有業(yè)余4段水平,棋局在百度貼吧有詳細(xì)拆解,水平確實(shí)不高,見(jiàn)鏈接 http://tieba.baidu.com/p/4329163733?pn=1
, C8 D0 @$ G5 k, t- L! F
/ y: c1 R, s) M8 d% i碰上了李世石,電腦估計(jì)會(huì)慘敗
  Y/ {- i. X: l5 N% e4 f, F1 ?
  t% {- N$ H9 w4 N+ Q其實(shí)對(duì)于人工智能,我們大可不必驚慌,數(shù)學(xué)上有個(gè)NP完全問(wèn)題,就說(shuō)明了計(jì)算機(jī)的計(jì)算能力是有極限的,很多問(wèn)題計(jì)算機(jī)都解決不了

本版積分規(guī)則

Archiver|手機(jī)版|小黑屋|機(jī)械社區(qū) ( 京ICP備10217105號(hào)-1,京ICP證050210號(hào),浙公網(wǎng)安備33038202004372號(hào) )

GMT+8, 2025-8-23 22:55 , Processed in 0.090394 second(s), 20 queries , Gzip On.

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回復(fù) 返回頂部 返回列表