昨天,在中國烏鎮舉行的“人機終極對弈”第一局中,當今世界排名第一的中國圍棋選手柯潔,以四分之一子惜敗于 Google 旗下的人工智能程序 AlphaGo。
雖然這個結果并不意外,早前,中國棋圣聶衛平表示柯潔會被0:3擊潰。古力九段認為,如果柯潔發揮出100%的狀態,那么他也許有5%的勝率。李開復直言“人類勝率0%”。
但此次對弈具有劃時代的意義,其中也不乏很多有意思的地方。甚至接下來至27號的幾天內,還有令人期待特別設置的人機配對賽和團隊賽,對弈最終結果目前還存在一定的變數。
先讓我們回顧一下昨天這局棋。
人機對弈
按照比賽規則,柯潔和 AlphaGo 各有三個小時的時間。柯潔執黑先行,而來自 DeepMind 的黃士杰(Aja Huang)博士則負責替 AlphaGo 落子。
在現場的比賽中,整體的節奏比預想中的要快很多,尤其是 AlphaGo,它的平均出子時間為 30 秒左右。
現場解說的職業八段棋手張璇和職業九段棋手常昊多次用“高效、果斷”來評價它的表現,并多次出現“有意思”、“沒想到”等評語。
而柯潔的應對狀況比較多變,有時會立刻下子,有時也會因白棋相對“出乎意料”的下法陷入長時間思考。
在比賽開局階段,雙方均表現得比較強硬。進入中盤之后,雙方在用時上的差距越拉越大,柯潔比 AlphaGo 多用了 1 個小時。雖然柯潔努力下出了不少好棋,比如第 97 步,但 AlphaGo 始終沒有出現失誤,牢牢把持著局面。
在清華 ai 團隊的勝率判斷中,柯潔與 AlphaGo 的勝率比例也基本維持在 45%:55%左右。
在關子階段,下至 4 小時左右,研究室內的眾世界冠軍基本都認定柯潔小敗成定局。而過程中柯潔也多次出現抓頭發之類的糾結小動作。
最終,這盤棋柯潔輸了四分之一子,這是圍棋中最小的差距,半目的設置是為了避免用整數出現雙方平目和棋的情況出現。
據職業棋手分析,雖然柯潔拼命廝殺,但最后的1/4子并不是黑白雙方的實際差距。實際上不是半目而是更多,但也沒有夸張到兩個子的說法。
因為研究棋理,就像探究客觀真理,當然要追求最佳,也就是最大收益;而實戰,因為贏多贏少都是贏,所以完全可以追求穩健。
而AlphaGo模型設定為取最高勝率的后續下法為實際下法,所以實戰中這個模型在封閉空間中可能導致非最佳下法,但一般情況下不影響勝負。
賽前,柯潔曾說:“這次能代表人類出戰是我的榮幸,我將盡全力去爭勝,一決勝負,抱有必勝的信念和必死的決心,不輕易言敗。”
無論如何,輸棋的結果并不影響這個20歲少年的優秀,至少福妹是服氣的!
人不輕狂枉少年
1997年出生的柯潔最初被大眾所熟知,就是在2016 年 3 月,AlphaGo 首次挑戰韓國棋手李世石時,放出狂言:“就算阿法狗贏了李世石,它也贏不了我。”
當時的柯潔自2015年1月至2016年1月,在一年內奪得第2屆百靈杯世界圍棋公開賽冠軍、第20屆三星杯世界圍棋公開賽冠軍、第2屆夢百合杯世界圍棋公開賽冠軍,成為世界上最年輕的圍棋三冠王。
并在2016年3月5日,將自己與李世石的大賽交鋒紀錄擴大為8贏2輸。直至目前,柯潔的圍棋等級分也排在世界第一位。
▲右李世石
但遺憾的是,當時李世石以1:4不幸敗北。其實在李世石輸掉第三盤后,柯潔也不得不承認計算機的實力強大,并表示“跟AlphaGo下的話,同樣的條件下,我輸的可能性非常大”。
不少媒體抓住的只有他的狂言,甚至昨天輸棋之后,王思聰在@棋士柯潔的微博底下評論↓↓
群眾的眼睛都是雪亮的,看底下網友的回復就能看出大家對于柯潔的態度。連許多日本吃瓜群眾也稱柯潔為“溫柔年輕的圍棋第一人”。
尤其是,王思聰評論的這條微博其實是柯潔大戰前夕的感言,一番對圍棋的熱愛與“風蕭蕭兮易水寒”的離別之情躍然字上,這場人機大戰,大家“且看且珍惜”↓↓
狗不再是那只狗
柯潔在昨天的賽后接受采訪也稱:“AlphaGo是太厲害了,我輸得沒什么脾氣。”那這只“狗”到底是有多厲害呢?
在2016年3月李世石之戰后,同年12月,神秘棋手“Master”登錄中國弈城圍棋網,以每天十盤的速度接連擊敗中外各大頂尖棋手,取得了空前絕后的60連勝。
人們耳熟能詳的職業棋手如古力、常昊等紛紛被斬落馬下,柯潔也不幸成為它的手下敗將。
2017年1月4日,AlphaGo團隊公布“Master”背后正是升級版AlphaGo的這一事實。迄今為止的公開賽事中,AlphaGo VS 人類圍棋選手,戰績已達70勝1負。
▲哈薩比斯
負責AlphaGo項目的DeepMind公司于2010年由杰米斯·哈薩比斯(Demis Hassabis)博士、沙恩·萊吉(Shane Legg)博士和穆斯塔法·蘇雷曼(Mustafa Suleyman)共同創立。在2014年DeepMind被谷歌以4億美元收購。
最初AlphaGo在只用原始像素和游戲得分作為輸入數據的情況下,學會了包括《乓》(Pong)和《打磚塊》(Breakout)在內的多種游戲的玩法,并達到了超人的水平。后來一步步向圍棋巔峰挑戰。
▲深藍 VS 卡斯帕羅夫
要知道當年戰勝卡斯帕羅夫的深藍,在國際象棋棋盤上,能夠發生的不同可能大約是 10 的 46 次方,而在圍棋面前就是小巫見大巫了,圍棋共有 19X19 個落棋點,加上不同的落字方式,全部可能大約是 10 的 174 次方左右。
圍棋可能的下法(10^174)已經超過已知宇宙中所有原子數目的總和(10^80)。巨大的變數和可能性,讓圍棋棋道幾乎成為一門玄學。
而戰勝李世石的AlphaGo 1.0支撐它棋力的秘訣有三個:深度神經網絡、監督/強化學習、蒙特卡羅樹搜索。
? 深度神經網絡
深度神經網絡是包含超過一個認知層的計算機神經網絡。對于人工智能而言,世界是被用數字的方式呈現的。人們將人工智能設計出不同的“層”,來解決不同層級的認知任務。這種具備許多“層”的神經網絡,被稱為深度神經網絡。
AlphaGo包含兩種深度神經網絡:價值網絡和策略網絡。價值網絡使得AlphaGo能夠明晰局勢的判斷,左右全局“戰略”,拋棄不合適的路線;策略網絡使得AlphaGo能夠優化每一步落子,左右局部“戰術”,減少失誤。
? 監督/強化學習
監督學習和強化學習是機器學習方式的不同種類。監督學習是指機器通過人類輸入的信息進行學習,而加強學習是指機器自身收集環境中的相關信息作出判斷,并綜合成自己的“經驗”。
在初始階段,AlphaGo收集研究者輸入的3000萬部棋局數據,學習人類棋手的下法,形成自己獨特的判斷方式。之后,在自我博弈一百萬多次,以及每一次與人類棋手對弈中,AlphaGo都能并根據結果來總結并生成新的范式,實現自我提高。
? 蒙特卡洛樹搜索
▲ AlphaGo中的蒙特卡羅樹搜索流程。圖源:Nature
蒙特卡洛樹是一種搜索算法。AI在利用它進行決策判斷時,會從根結點開始不斷選擇分支子結點,通過不斷的決策使得游戲局勢向AI預測的最優點移動,直到模擬游戲勝利。
AI每一次的選擇都會同時產生多個可能性,它會進行仿真運算,推斷出可能的結果再做出決定。
如果說,跟李世石下棋的AlphaGo版本號是V18,那和柯潔下棋的則是V60。DeepMind把AlphaGo粗略分成幾個版本:
第一代 是擊敗樊麾的AlphaGo Fan。與Zen/Crazy Stone等之前的圍棋軟件相比,棋力要高出4子。
第二代 是擊敗李世石的AlphaGo Lee。與上一代相比,棋力高出3子。
第三代 是柯潔如今的對手,也是年初60連勝的:AlphaGo Master。相比于擊敗李世石的版本,棋力又再次提升3子。
根據公開資料,此次與柯潔對戰的AlphaGo技術原理與之前又有著巨大的不同,其中最厲害的在于,新的策略/價值網絡強化在“上一代AlphaGo成為下一代的老師”。
兩臺白癡機器,遵守走棋和獲勝規則,從隨機走棋開始日夜切磋,總結經驗,不斷批評和自我批評,實現自我超越。這畫面想想就出一陣冷汗……
創始人哈薩比斯表示:“AlphaGo也能用在其他的領域,比如在制藥、醫療等方面,都可以使用人工智能來解決疑難問題。”目前它幫助谷歌減少了40%在機房冷卻系統上的花費。
他們還希望能夠與英國國家電網合作,利用人工智能將英國的能耗減少10%。并希望在醫療領域結合,在一定準確率的情況下,給予醫生診療判定方面的輔助。
新時代的投資機會
AlphaGo是一個標志。它的誕生,意味著人們對人工智能的探索已經到達了一個新的階段。
據VentureScanner統計,2014年人工智能領域全球投資額為10億美元,同比增長近50%。2015全球人工智能公司共獲得近12億美元的投資,這個數字放在過去20年全年投資總額來看,已經超過了其中17年全年投資總額。
預計2020年全球人工智能市場規模預計超千億。在未來10年甚至更久的時間里,人工智能將是眾多智能產業技術和應用發展的突破點。
由國家發改委、科技部、工信部、中央網信辦制定的《“互聯網+”人工智能三年行動實施方案》日前正式印發,計劃到2018年,基本建立人工智能的產業、服務和標準化體系,實現核心技術突破,培育若干全球領先的人工智能骨干企業,形成千億級的人工智能市場應用規模。
事實上,人工智能的行業應用早已開始:當瀏覽淘寶時,淘貨將針對你的瀏覽和購買記錄,推送你可能喜歡的商品;支付寶已經根據您的個人購買記錄等建立了個人征信……
作為A股人工智能龍頭,科大訊飛(002230)在以“從能聽會說到能理解會思考”為目標的訊飛超腦項目上持續加大投入,保持了人工智能的核心技術上的領先地位。
神州泰岳(300002)瞄準語義理解領域,推出的專利產品“DINFO-OEC非結構化大數據分析挖掘模型”,已成為中國銀行業的優先選擇平臺。
領域內還可關注海康威視(002415)、華宇軟件(300271)、遠方光電(300306)、思創醫惠(300078)、工大高新(600701)、賽為智能(300044)等等。
重要的是未來
雖然汽車被創造,但依然不減博爾特百米飛人的厲害。
相信圍棋這項有兩千多年歷史的運動的魅力,也仍然會持久地存續下去,甚至在柯潔及眾多棋士的努力下,將會吸引更多的年輕人來學習這項富有智慧的古老運動。
就像著名日本動畫《棋魂》中所說:
千年雖過,黑白二色依然讓我迷醉!
千年雖逝,棋子拍落的金石之音仍是震撼我心!
千年滄桑,世事變遷,不變的是棋盤上驚心動魄的撕殺,棋士內心的執著,還有……對圍棋恒古不滅的熱情!
千年放浪,閱盡沉浮人生,不變的是我,醉心于棋盤上的千變萬化,依戀于相知相伴的幸福,以及對神之一手永無停息的追逐!
而AlphaGo和它的同伴們又能走多遠?這個需要時間來檢驗,不得不承認,新的時代在不顧及你我的情緒下來臨,這種跳脫于人類進化外的全新歷程,又會發生什么動人的故事呢?
也許未來,“人”不再是血肉之軀,而是一種思維,一種智慧……這是最壞的時代,這是最好的時代。
??猜你喜歡:
《穿五星紅旗蹭紅毯 愛國還是炒作?》
《32歲前一無所有,現在身家500億》
《成熟的人從不會這樣發微信》
*理財有風險,投資需謹慎

還沒有評論,來說兩句吧...