久久久国产一区二区_国产精品av电影_日韩精品中文字幕一区二区三区_精品一区二区三区免费毛片爱
機械社區(qū)
標題:
人工智能終于在圍棋游戲上擊敗人類
[打印本頁]
作者:
寂靜天花板
時間:
2016-2-18 19:04
標題:
人工智能終于在圍棋游戲上擊敗人類
據日本共同社1月28日報道,英國《自然》雜志當地時間27日發(fā)文稱,美國google公司旗下的人工智能(AI)開發(fā)商“DeepMind”(位于英國)研發(fā)的圍棋電腦軟件“AlphaGo”(阿爾法圍棋)打敗了職業(yè)棋手,開創(chuàng)全球先河。 圍棋下法復雜,一般認為圍棋的對弈軟件開發(fā)比國際象棋和日本將棋更難,此次憑借人工智能新技術大幅提高了判斷力。開發(fā)人員等召開記者會時稱“正因為規(guī)則單純才很難做,可應用于疾病圖像的診斷等需要判斷情況的場合”。
; R! o3 @ ?$ G6 \
與“AlphaGo”一較高下的棋手是2013年至2015年的歐洲圍棋冠軍、生于中國的樊麾。2015年10月,雙方以正式比賽中使用的十九路棋盤進行了無讓子的5局較量,“AlphaGo”贏得滿堂紅。
* w4 d1 {) N& i1 J! f
今年3月,“AlphaGo”將挑戰(zhàn)全球頂級的韓國九段棋手李世石,獎金是100萬美金。李世石表示:“(人工智能)厲害得讓人吃驚,聽說一直在進化,不過我有信心取勝。”
4 z: b( @, r, S: ]3 E3 q: k
圍棋因為其非常復雜,之前最強的圍棋軟件基本上連業(yè)余棋手都無法戰(zhàn)勝,而google改變了思路,通過機器學習的方式提高AI,并且直接戰(zhàn)勝了圍棋職業(yè)棋手,如果今年3月份的比賽李世石戰(zhàn)敗的話,人類最后一個能戰(zhàn)勝人工智能的棋類游戲就將終結了。
3 F7 S' {. y/ W5 T; i7 h" m8 c- }
1952年計算機掌握了第一款游戲——井字棋 (也稱三連棋),接下來是1994年的西洋跳棋,1997年,“深藍”贏得了國際象棋比賽,國際象棋AI第一次打敗頂尖的人類;2006年,人類最后一次打敗頂尖的國際象棋AI。歐美傳統(tǒng)里的頂級人類智力試金石,在電腦面前終于一敗涂地,應了四十多年前計算機科學家的預言。
# W- q' `5 C- i4 Z7 w6 ^: w
至少還有東方,人們自我安慰道。圍棋AI長期以來舉步維艱,頂級AI甚至不能打敗稍強的業(yè)余選手。長期以來,圍棋仍然是橫亙在人工智能研究者面前的難題:計算機的圍棋水平只能達到業(yè)余選手的程度。這似乎也合情合理:國際象棋中,平均每回合有35種可能,一盤棋可以有80回合;相比之下,圍棋每回合有250種可能,一盤棋可以長達150回合。這一巨大的數目,足以令任何蠻力窮舉者望而卻步——而人類,我們相信,可以憑借某種難以復制的算法跳過蠻力,一眼看到棋盤的本質。
$ Y- q& S, f5 i3 f$ j
但是,無論人怎么想,這樣的局面當然不可能永遠延續(xù)下去。就在今天,國際頂尖期刊《自然》報道了google研究者開發(fā)的新圍棋AI。這款名為“阿爾法圍棋”(AlphaGo)的人工智能,在沒有任何讓子的情況下以5:0完勝歐洲冠軍,職業(yè)圍棋二段樊麾。
; y& P; p+ u9 L& G
AI下圍棋到底有多難?
! |3 k/ D7 c" \/ \# [
計算圍棋是個極其復雜的問題,比國際象棋要困難得多。圍棋最大有3361 種局面,大致的體量是10170,而已經觀測到的宇宙中,原子的數量才1080。國際象棋最大只有2155種局面,稱為香農數,大致是1047。
, `& E$ _" d \7 w& C# ~
面對任何棋類,一種直觀又偷懶的思路是暴力列舉所有能贏的方案,這些方案會形成一個樹形地圖。AI只要根據這個地圖下棋就能永遠勝利。然而,圍棋一盤大約要下150步,每一步有250種可選的下法,所以粗略來說,要是AI用暴力列舉所有情況的方式,圍棋需要計算250150種情況,大致是10360。相對的,國際象棋每盤大約80步,每一步有35種可選下法,所以只要算3580種情況,大概是10124。無論如何,枚舉所有情況的方法不可行,所以研究者們需要用巧妙的方法來解決問題,他們選擇了模仿人類大師的下棋方式。
& J, q, \# s5 T9 w6 v; l H* x% p
機器學習
7 S9 ^5 F* _5 @! S0 S1 ?
研究者們祭出了終極殺器——“深度學習”(Deep Learning)。深度學習是目前人工智能領域中最熱門的科目,它能完成筆跡識別,面部識別,駕駛自動汽車,自然語言處理,識別聲音,分析生物信息數據等非常復雜的任務。
; M, G5 U1 K4 R# V ?2 m
傳統(tǒng)的人工智能方法是將所有可能的走法構建成一棵搜索樹 ,但這種方法對圍棋并不適用。所以在征服圍棋的過程中,google決定另辟蹊徑,將高級搜索樹與深度神經網絡結合在一起。這些神經網絡通過12個處理層傳遞對棋盤的描述,這些處理層包含數百萬個類似于神經的連接點。其中一個神經網絡“策略網絡”(policy network)選擇下一步走法,另一個神經網絡“價值網絡”(value network)預測比賽勝利者。
8 U/ T( Z E7 q: }
google用人類圍棋高手的三千萬步圍棋走法訓練神經網絡,直至神經網絡預測人類走法的準確率達到57%。不過google的目標是擊敗最優(yōu)秀的人類棋手,而不止是模仿他們。為了做到這一點,AlphaGo學習自行研究新戰(zhàn)略,在它的神經網絡之間運行了數千局圍棋,利用反復試驗調整連接點,這個流程也稱為鞏固學習(reinforcement learning)。
& Q i) E+ |* T0 u8 e
[6 [7 w8 L: }! d/ I+ N- |
[attach]378674[/attach]
# J) }9 }* Q2 V6 V* E
AlphaGo 的核心是兩種不同的深度神經網絡?!安呗跃W絡”(policy network)和 “值網絡”(value network)。它們的任務在于合作“挑選”出那些比較有前途的棋步,拋棄明顯的差棋,從而將計算量控制在計算機可以完成的范圍里,本質上和人類棋手所做的一樣。
7 K# N0 C$ d+ z! f' a( H7 V
其中,“值網絡”負責減少搜索的深度——AI會一邊推算一邊判斷局面,局面明顯劣勢的時候,就直接拋棄某些路線,不用一條道算到黑;而“策略網絡”負責減少搜索的寬度——面對眼前的一盤棋,有些棋步是明顯不該走的,比如不該隨便送子給別人吃。將這些信息放入一個概率函數,AI就不用給每一步以同樣的重視程度,而可以重點分析那些有戲的棋著。
% K5 n& g6 H! W% x: \/ q+ O
AlphaGo利用這兩個工具來分析局面,判斷每種下子策略的優(yōu)劣,就像人類棋手會判斷當前局面以及推斷未來的局面一樣。這樣AlphaGo在分析了比如未來20步的情況下,就能判斷在哪里下子贏的概率會高。
& o# ^- G% V- l4 ]- W ]
研究者們用許多專業(yè)棋局訓練AI,這種方法稱為監(jiān)督學習(supervised learning),然后讓AI和自己對弈,這種方法稱為強化學習(reinforcement learning),每次對弈都能讓AI棋力精進。然后他就能戰(zhàn)勝冠軍啦!
, R+ O3 c: `5 K6 D8 ~8 `
人類在下棋時有一個劣勢,在長時間比賽后,他們會犯錯,但機器不會。而且人類或許一年能玩1000局,但機器一天就能玩100萬局。所以AlphaGo只要經過了足夠的訓練,就能擊敗所有的人類選手。
( Y# Y' D4 o* @4 z4 i& Y: ?! q6 x
人工智能研究者面對這樣的成就當然欣喜。深度學習和強化學習等技術完全可以用于更廣泛的領域。比如最近很火的精準治療,我們可以訓練它們判斷哪些治療方案對某個特定的人有效。
! f! g, G# Q6 r% ~1 ?
但是,圍棋畢竟不僅僅是一項智力成就。就像十多年前的國際象棋一樣,圍棋必定也會引發(fā)超出本領域之外的討論。等到計算機能在圍棋上秒殺人類的時候,圍棋是不是就變成了一種無聊的游戲?人類的智力成就是不是就貶值了?AI還將在其他層面上繼續(xù)碾壓人類嗎?傳統(tǒng)認為AI不可能完成的任務是否也都將被逐一打破?人類最后是會進入AI烏托邦還是被AI淘汰呢?
' F$ \+ y1 f+ N2 ]2 J$ v
沒人知道答案。但有一點毫無疑問:AI一定會進入我們的生活,我們不可能躲開。這一接觸雖然很可能悄無聲息,但意義或許不亞于我們第一次接觸外星生命。人工智能如果能實現自我學習,那將是一件很可怕的事情,因為機器學習的速度遠遠高于人類學習的速度,史蒂芬·霍金曾警告說“一旦經過人類的開發(fā),人工智能將會自行發(fā)展,以加速度重新設計自己。由于受到緩慢的生物演化的限制,人類不能與之競爭,最終將會被代替”
# A/ K& O3 c4 g& V. o1 c) a
5 n; n" C2 A0 l4 b4 T& G; n
- P' h% P; M0 @' G
作者:
crazypeanut
時間:
2016-2-18 19:38
據說樊麾跑到中國來的話,只有業(yè)余4段水平,棋局在百度貼吧有詳細拆解,水平確實不高,見鏈接 http://tieba.baidu.com/p/4329163733?pn=1
4 W1 L, s6 H4 G- J9 f5 }
, L+ ]0 Y/ E# Z
碰上了李世石,電腦估計會慘敗
$ T! X) D* S9 W X" G4 F- X% N
. P8 K1 l6 I1 H
其實對于人工智能,我們大可不必驚慌,數學上有個NP完全問題,就說明了計算機的計算能力是有極限的,很多問題計算機都解決不了
作者:
黃海是我
時間:
2016-2-18 19:56
不同意樓上的想法,沒人說機器完全替代人。但是每次技術進步后,對人的需求就變少了。
作者:
niulean
時間:
2016-2-18 20:06
額,感覺沒什么,畢竟是程序么。。。
作者:
迷茫的維修
時間:
2016-2-19 21:45
電腦走的是程序,是一種按照公式的邏輯推理,是死的,人是有反饋,思考,執(zhí)行,這個全過程的,機器人就是COPY前人的經驗,人可以COPY,也可以創(chuàng)新
作者:
迷茫的維修
時間:
2016-2-19 21:45
電腦走的是程序,是一種按照公式的邏輯推理,是死的,人是有反饋,思考,執(zhí)行,這個全過程的,機器人就是COPY前人的經驗,人可以COPY,也可以創(chuàng)新
作者:
usuallyto
時間:
2016-3-9 12:08
學習學習 呵呵
歡迎光臨 機械社區(qū) (http://www.ytsybjq.com/)
Powered by Discuz! X3.5