選自 BackChannel
作者:Steven Levy
機器之心編譯
參與:盛威、黃清緯、吳攀、Gabrielle、李亞洲
如果你想在每一個產(chǎn)品中都使用人工智能,你最好重新訓(xùn)練一支程序員大軍。
Carson Holgate 正在接受忍者訓(xùn)練。
這不是武俠世界——她已經(jīng)做到了。26歲的 Holgate 得到了第二條跆拳道黑帶。這次是算法黑帶。好幾個星期 Holgate 都沉浸在一個程序中,這場比身體上的格斗更強大的訓(xùn)練教授她的是機器學(xué)習(xí)(ML)。谷歌 Android 部門的工程師 Holgate 是今年機器學(xué)習(xí)忍者項目(Machine Learning Ninja Program)的18名程序員之一,該項目從他們的團隊中挑選有天賦的程序員參加,以《安德的游戲》的模式進行訓(xùn)練,來教授給他們?nèi)斯ぶ悄芗夹g(shù)。即使這會讓他們寫的軟件更難以理解。
Carson Holgate,谷歌工程師,正在機器學(xué)習(xí)忍者訓(xùn)練中
「我們的口號是,你想成為機器學(xué)習(xí)忍者嗎?」幫忙管理這個項目的谷歌機器學(xué)習(xí)團隊的產(chǎn)品經(jīng)理 Christine Robson 說 。「我們邀請谷歌的員工加入機器學(xué)習(xí)團隊,與導(dǎo)師坐在一起,花6個月時間研究機器學(xué)習(xí),同時做一些項目,并從項目實踐中學(xué)習(xí)經(jīng)驗。」
對于約四年前帶著計算機科學(xué)和數(shù)學(xué)學(xué)士學(xué)位來到谷歌的 Holgate 來說,這是一個掌握軟件領(lǐng)域最熱門的分支的機會:使用學(xué)習(xí)算法(學(xué)習(xí)者)并用大量數(shù)據(jù)來「教授」軟件完成任務(wù)。多年來,機器學(xué)習(xí)被認(rèn)為是一種只屬于少數(shù)精英的學(xué)科。但現(xiàn)在這個時代結(jié)束了,最近的結(jié)果表明:由模仿生物大腦運作方式的神經(jīng)網(wǎng)絡(luò)驅(qū)動的機器學(xué)習(xí),是賦予計算機以人類力量甚至超人力量的正確途徑。谷歌致力于在內(nèi)部擴張精英團隊,并期望將其變成一種常態(tài)。對于像 Holgate 這樣的工程師,忍者項目是躋身技術(shù)前沿的機會——從最優(yōu)秀的工程師那里學(xué)習(xí)最先進的技術(shù)。「這些人正構(gòu)建著荒唐的模型并且擁有博士學(xué)位。」她掩飾不住聲音中的畏怯。她甚至得慢慢接受這個項目將其學(xué)生稱為「忍者」的事實。「起初,我很害怕,但是我學(xué)會接受了它,」她說。
谷歌 60000 名員工中幾乎有一半是工程師,所以這是個小項目。但是該項目象征著這家公司的認(rèn)知轉(zhuǎn)換。雖然長久以來機器學(xué)習(xí)就是谷歌技術(shù)的一部分,而谷歌已經(jīng)雇傭了不少該領(lǐng)域頂級專家,但是這家公司從 2016 年開始似乎變得對這項技術(shù)更感興趣了。在去年年底的一次電話會議上,谷歌總裁 Sundar Pichai 提出了這家公司的新愿景:「機器學(xué)習(xí)是核心,是我們重新思考我們所做的事情的變革方式。我們正想盡辦法將它應(yīng)用到我們所有產(chǎn)品中:搜索、廣告、YouTube 或應(yīng)用商店。我們?nèi)蕴幱诔跗陔A段,但你可以發(fā)現(xiàn),我們正在以系統(tǒng)化的方式將機器學(xué)習(xí)應(yīng)用到所有的地方。
顯然,如果谷歌想在它所有的產(chǎn)品中應(yīng)用機器學(xué)習(xí),它需要掌握這項與傳統(tǒng)編程方式完全不同的技術(shù)的工程師。正如 Peter Domingos 在機器學(xué)習(xí)領(lǐng)域非常受歡迎的《The Master Algorithm》一書中所寫的,「機器學(xué)習(xí)是一項朝陽技術(shù),是一種自我構(gòu)建的技術(shù)。」編寫出這樣一個系統(tǒng)你需要做如下工作:識別正確的數(shù)據(jù),選擇正確的算法,確保你構(gòu)建了成功運行的正確條件,最后相信這個系統(tǒng)的工作能力(當(dāng)然這對于程序員來說很困難)。
「用這種方式思考如何解決問題的人越多,我們就會做得越好,」谷歌的機器學(xué)習(xí)團隊領(lǐng)導(dǎo)者 Jeff Dean 說。他估計現(xiàn)在在谷歌的 25000 名工程師中,只有幾千人精通機器學(xué)習(xí)。或許是百分之十。他希望這個比例接近百分之百。「如果每個工程師都至少有一些機器學(xué)習(xí)的知識就好了,」他說。
他認(rèn)為這會變成現(xiàn)實嗎?
「我們正打算嘗試,」他說。
經(jīng)過多年,John Giannandrea 已經(jīng)是谷歌機器學(xué)習(xí)領(lǐng)域的關(guān)鍵人物,另外他最近還成為了谷歌搜索部門的負(fù)責(zé)人。但是 2010 年來谷歌的時候,他對于機器學(xué)習(xí)或神經(jīng)網(wǎng)絡(luò)并沒有太多了解。2011 年左右,一些來自神經(jīng)信息處理系統(tǒng)峰會(Neural Information Processing Systems ,簡稱 NIPS)的新聞讓他感到非常震撼:似乎在每年的 NIPS 上,總有一些團隊會宣布使用機器學(xué)習(xí)顛覆此前一直難以突破的問題,比如翻譯,語言識別,或視覺問題等。令人驚訝的事情正在發(fā)生。「我第一次聽說這個 NIPS 峰會時,它并不出名,」他說。「但是在過去的三年里,這個領(lǐng)域從學(xué)術(shù)到工業(yè)的參會者數(shù)量激增。去年大約有 6000 人參加。」
Jeff Dean : 谷歌權(quán)威計算機科學(xué)家
這不僅促進了神經(jīng)網(wǎng)絡(luò)算法的發(fā)展,也帶來了來自摩爾定律效應(yīng)的更強大的計算能力,還有從谷歌、Facebook 等企業(yè)的海量用戶行為中獲取的數(shù)據(jù)也出現(xiàn)了指數(shù)級增長 ,機器學(xué)習(xí)不斷提高的新時代開始了。Giannandrea 與一些人一樣,相信機器學(xué)習(xí)是谷歌的關(guān)鍵。與他持有相同意見的還有谷歌大腦(Google Brain)的聯(lián)合創(chuàng)始人 Dean ,谷歌大腦是谷歌長期研究部門 Google X (現(xiàn)在就是簡單稱為 X)發(fā)起的神經(jīng)網(wǎng)絡(luò)項目。
谷歌迫不及待地?fù)肀C器學(xué)習(xí)的熱情不僅僅意味著編程技術(shù)的轉(zhuǎn)變,更是對科技作出的鄭重承諾——承諾將賦予計算機從未擁有過的高超能力。這項技術(shù)的最前沿是受到大腦結(jié)構(gòu)啟發(fā)的圍繞復(fù)雜的神經(jīng)網(wǎng)絡(luò)構(gòu)建的「深度學(xué)習(xí)」算法。谷歌大腦是深度學(xué)習(xí)上的努力嘗試,而谷歌 2014 年 1 月以 5 億美元買下的人工智能企業(yè) DeepMind 同樣把重點放在研究深度學(xué)習(xí)上。打敗圍棋世界冠軍的 AlphaGo 系統(tǒng)就是 DeepMind 設(shè)計的,這粉碎了人們對智能機器表現(xiàn)的期待,引發(fā)了對可怕的智能機器和殺人機器人的一波又一波的擔(dān)憂。
對于「人工智能將會殺死我們」陣營,雖然 Giannandrea 不屑一顧地將他們看作不太了解情況的 Cassandra 先知(希臘神話中不被人相信的女先知),但 Giannandrea 同樣認(rèn)定,不管是在醫(yī)療診斷還是在汽車駕駛領(lǐng)域,機器學(xué)習(xí)系統(tǒng)都將會是顛覆性的。雖然機器學(xué)習(xí)不會取代人類,但它會改變?nèi)诵浴?
Giannandrea 舉例說明了機器學(xué)習(xí)的力量,比如 Google Photos, 這款產(chǎn)品的定義特征是一種奇特的——甚至讓人煩擾——的能力,即要將用戶特別指出的某物的圖像定位出來。讓我看看邊境牧羊犬的圖片。「人們第一次體驗這種能力的時候,他們會認(rèn)為正發(fā)生著一些不同的事情,因為計算機不再只是通過計算為你生成推薦內(nèi)容,或者建議你看什么視頻了。」Giannandrea 說,「事實上計算機正在理解圖片中的內(nèi)容。」他解釋道,通過這個學(xué)習(xí)過程,計算機「知道了」邊境牧羊犬長什么樣子,還會找到這種類型的狗在小時候、年老的時候、毛發(fā)長的時候和剪毛后的照片。當(dāng)然,人也可以做到這點。但沒有一個人能夠?qū)?100 萬個樣本分類和同時識別出 1 萬種狗的品種。但機器學(xué)習(xí)系統(tǒng)可以。系統(tǒng)學(xué)到了一個品種,就能用同樣的技術(shù)識別剩下的 9999 種。「這是個真正新的領(lǐng)域。」Giannandrea 說,「在某些狹窄領(lǐng)域內(nèi),你可以看到一些人認(rèn)為這些學(xué)習(xí)系統(tǒng)實現(xiàn)了超人級的表現(xiàn)。」
不可否認(rèn)的是,谷歌一直都很理解機器學(xué)習(xí)的概念,谷歌的創(chuàng)始人更是追隨人工智能力量一生的信徒。谷歌產(chǎn)品中已經(jīng)融入了機器學(xué)習(xí),雖然最近神經(jīng)網(wǎng)絡(luò)的關(guān)注度更高一些。(早期的機器學(xué)習(xí)經(jīng)常依賴于一種更直接的統(tǒng)計方法。)
事實上,谷歌給工程師教授機器學(xué)習(xí)的內(nèi)部課程已經(jīng)超過十年時間了。2005 年初,當(dāng)時負(fù)責(zé)搜索業(yè)務(wù)的 Peter Norvig 向研究科學(xué)家 David Pablo Cohn 建議,他應(yīng)該調(diào)查谷歌是否可以采用卡耐基梅隆大學(xué)組織的項目中的在線課堂。Cohn 的結(jié)論是,只有谷歌自己才能教授這樣的內(nèi)部課堂,因為谷歌的運營規(guī)模遠遠超過其他機構(gòu)(可能國防部除外)。因此,Norvig 在 43 號樓(搜索團隊當(dāng)時的總部)預(yù)訂了一個大房間,每周三舉行一次兩小時的會議,就連 Jeff Dean 也參加了幾次。「那是全世界最好的課堂。」Cohn 說,「他們都是比我更優(yōu)秀的工程師!」這個課程火了,局面甚至有些失控,印度班加羅爾辦公室的人直熬到下半夜才能打進預(yù)訂電話。幾年以后,一些谷歌人一起將這些課程做成了短視頻,不再進行現(xiàn)場會議。Cohn 相信,這可能是 MOOC (大規(guī)模開放式在線課程)的前身。接下來的幾年里,谷歌還進行了其它幾次機器學(xué)習(xí)訓(xùn)練的嘗試,但這些嘗試缺乏條理和連續(xù)性。2010 年 Cohn 離開谷歌之前曾說,谷歌的機器學(xué)習(xí) 「突然變成了第一要務(wù)。」
Cohn 的這句話直到2012年才真正付諸實踐,Giannandrea 當(dāng)時有個想法,要「弄一大堆做這個的人」,把他們放到一棟單獨的樓里,已經(jīng)從 X 部門「畢業(yè)的」谷歌大腦(Google Brain)也加入了這個團隊。「我們將很多團隊整個搬過來,讓他們在一座樓里工作,還買了個很棒的新咖啡機。」他說,「之前研究所謂的感知(perception)——即聲音、語音理解等——的人現(xiàn)在要跟之前研究語言的人一起探討。」
漸漸地,能夠體現(xiàn)工程師在機器學(xué)習(xí)方面的付出的谷歌流行產(chǎn)品越來越多。因為主要的機器學(xué)習(xí)領(lǐng)域包括視覺、語音、聲音識別、翻譯,因此毫不奇怪地,機器學(xué)習(xí)成為了語音搜索、翻譯、照片等的關(guān)鍵部分。更讓人關(guān)注的工作是讓機器學(xué)習(xí)無處不在。Jeff Dean 是 Big Table 和 MapReduce 等顛覆性系統(tǒng)的共同創(chuàng)建者。他說,他和他的團隊開始進一步理解機器學(xué)習(xí),正在以更加雄心勃勃的方式進行探索。「之前,我們可能會在一個系統(tǒng)中的幾個子組件中采用機器學(xué)習(xí)」他說,「現(xiàn)在。我們其實在用機器學(xué)習(xí)取代整套系統(tǒng),而不是為每個部分構(gòu)建更好的機器學(xué)習(xí)模型。」Dean 說,如果他要在今天重寫谷歌的基礎(chǔ)架構(gòu),那么架構(gòu)的很多內(nèi)容將不是用編碼,而是用學(xué)習(xí)獲得。
Greg Corrado, Google Brain 的聯(lián)合創(chuàng)建者, 與產(chǎn)品組一起工作將人工智能添進他們的軟件中
同時,機器學(xué)習(xí)還讓之前不可想象的產(chǎn)品功能成為了可能。比如,去年11月新發(fā)布了 Gmail 的智能回復(fù)(Smart Replies)功能。剛開始,谷歌大腦項目的聯(lián)合創(chuàng)始人 Greg Corrado 與 Gmail 工程師 Bálint Miklós 進行了一次對話。Corrado 之前曾與 Gmail 團隊合作過,一起研究在垃圾郵件檢測和郵件分類中機器學(xué)習(xí)算法的使用,但 Miklós 提出了一個更激進的方法。如果團隊發(fā)明通過機器學(xué)習(xí)自動為郵件生成回復(fù)的方法,讓移動用戶免于在小鍵盤上敲下回復(fù)的麻煩,這怎么樣?「我當(dāng)時其實驚呆了,這個提議看起來太瘋狂了。」Corrado 說,「但后來我覺得,我們或許可以用正在做的神經(jīng)網(wǎng)絡(luò)預(yù)測技術(shù)實現(xiàn)這一點。而且一旦我們意識到存在可能,我們就必須去嘗試。」
谷歌讓 Corrado 和他自己的的團隊,以及 Gmail 團隊保持緊密合作,這更增加了實現(xiàn)的可能性。機器學(xué)習(xí)專家進入產(chǎn)品組的做法越來越普遍。「機器學(xué)習(xí)既是一門科學(xué),也是一門藝術(shù),」Corrado 說,「就像做飯一樣,雖然涉及到化學(xué)原理,但是要做一些真正有趣的事情,你必須要知道如何將面前的配料結(jié)合起來。」
用于語言理解的傳統(tǒng)人工智能方法取決于系統(tǒng)中嵌入的語言規(guī)則,但這個項目中,與所有現(xiàn)代的機器學(xué)習(xí)一樣,該系統(tǒng)被填喂了足夠用于自學(xué)的數(shù)據(jù),就像孩子一樣,「我不是跟著語言學(xué)家學(xué)習(xí)說話,而是通過聽別人說話學(xué)會的。」Corrado 說。
然而,使智能回復(fù)真正可行的是:這種成功可以很輕松地定義成——不是創(chuàng)造一個只會和用戶調(diào)情式聊天的虛擬的 Scarlett Johansson(指電影《她》中的智能操作系統(tǒng)) ,而是真實生活郵件的合理回復(fù)。「成功就像是,用戶覺得機器生成的備選回復(fù)是有用的,可以用作自己真正的回復(fù)。」他說。因此不管用戶是不是點擊了機器建議的回復(fù),這些系統(tǒng)都能進行訓(xùn)練。
然而,該團隊開始測試智能回復(fù) 的時候,用戶注意到一件奇怪的事:系統(tǒng)經(jīng)常建議不合時宜的浪漫的回復(fù)。「其中一個失敗的模式就是,它在不知如何回復(fù)的任何時候,總會歇斯底里地傾向于說『我愛你』。」」Corrado 說,「這不是軟件漏洞,而是我們錯誤地讓它做了這件事。」該程序某種程度上學(xué)會了人類行為微妙的一面:「比如,你在走投無路的時候,說『我愛你』就會是一個很好的防御策略。」Corrado 后來幫助將團隊的這種熱情緩和下來。
去年 11 月發(fā)布的智能回復(fù)取得了成功——現(xiàn)在 Gmail Inbox 應(yīng)用的用戶通常不用自己打一個字,從三封推薦的郵件選擇一封就可以完成回復(fù)。這些推薦郵件的內(nèi)容經(jīng)常合乎情理得不可思議。手機 Inbox 用戶發(fā)送的回復(fù)中十分之一都是機器學(xué)習(xí)系統(tǒng)創(chuàng)建的。「這個產(chǎn)品能夠成功,我多少還是有些吃驚的」 ,Corrado 大笑著說。
在谷歌證明機器學(xué)習(xí)高效性的實例組成的稠密圖(dense graph)中,Smart Replies 只是其中的一個數(shù)據(jù)點而已。但是當(dāng)機器學(xué)習(xí)成為搜索業(yè)務(wù)的重要部分的時候,或許轉(zhuǎn)折點才終于到來。搜索業(yè)務(wù)是谷歌的旗艦產(chǎn)品,是占據(jù)谷歌幾乎所有收入的金庫。某種程度上,搜索一直都基于人工智能。但很多年來,該公司最珍貴的算法,這個曾為我們帶來「ten blue links(回復(fù)谷歌搜索請求的十條藍色鏈接)」的算法,注定是機器學(xué)習(xí)算法的重中之重。「因為搜索是谷歌一個非常大的組成部分,搜索的排序能力也取得了高速的進化,很多人都懷疑你是否能改變這個局面。 」Giannandrea 說。
某種程序上,這是一種文化抵制——這是讓控制狂一樣的大師級黑客采用禪式風(fēng)格的機器學(xué)習(xí)方法上存在的普遍挑戰(zhàn)的頑固縮影。Amit Singhal 久負(fù)盛名的搜索大師曾是傳奇計算機科學(xué)家 Gerald Salton 的助手。Salton 在文檔檢索方面的開創(chuàng)性工作啟迪了 Singhal 幫助修改了 Brin 和 Page 的研究生代碼,將其變?yōu)榭梢詳U展用于當(dāng)今網(wǎng)絡(luò)時代的程序。(這使他進入了「檢索者(retriever)」學(xué)院。)他從這些 20 世紀(jì)方法中梳理出了驚人的結(jié)果,并且有人懷疑是他將一些學(xué)習(xí)者帶入了這個相當(dāng)于谷歌命脈的復(fù)雜系統(tǒng)。「在谷歌的前兩年,我在搜索質(zhì)量部門工作,用機器學(xué)習(xí)提升排序能力。」David Pablo Cohn 說。「結(jié)果證明,Amit 的機構(gòu)是世界上最好的一個,我們對 Amit 大腦中所有的東西都進行了硬編碼,并取得了進一步進步。沒有別的方法能超越他的了。」
2014 年初,谷歌的機器學(xué)習(xí)大師認(rèn)為需要有所改變。「我們與排序團隊進行了一系列討論。」Dean 說,「我們說,我們應(yīng)該至少嘗試下這個東西,看看是否會有收獲。」Dean 團隊設(shè)想的那個實驗,后來證明對搜索能力至關(guān)重要:排序中的一個文件和查詢請求的匹配程度會有多好(根據(jù)用戶是否點擊進行計算)。「我們可能只是說了句,試著根據(jù)這個神經(jīng)網(wǎng)絡(luò)計算出這個額外分?jǐn)?shù)吧,看看它有沒有用。」
結(jié)果是有用的,該系統(tǒng)現(xiàn)在是搜索的一部分,名為 Rank Brain ,于 2015 年 4 月上線。谷歌還是秉持它以往的特色,在該系統(tǒng)究竟如何提升搜索性能上含糊不清(一些和長尾效應(yīng)相關(guān)的東西?模糊請求的更好解讀?),但 Dean 說,「 Rank Brain 融入到了每次查詢中」,而且「或許不是在每次查詢中,但也是大量查詢中」都影響了實際的排名。另外,該系統(tǒng)效果顯著。谷歌搜索在計算排名時使用的幾百個「信號(signal)」(用戶的地理位置,或頁面的頭條與查詢的文本相匹配都可能是信號)中,Rank Brain 的有用性排名第三。
「我們成功使用機器學(xué)習(xí)將搜索做得更好了,這對公司來說是有重要價值的,」Giannandrea 說:「這引起了很多人的關(guān)注。」華盛頓大學(xué)教授、《The Master Algorithm》的作者 Peter Domingos 用另外的方式說到:「這種戰(zhàn)斗一直存在于檢索者和機器學(xué)習(xí)人之間,機器學(xué)習(xí)者最終贏得了這場戰(zhàn)斗。」
谷歌的新挑戰(zhàn)是轉(zhuǎn)換其工程團隊以使大家都熟悉機器學(xué)習(xí)——哪怕不擅長機器學(xué)習(xí)。這是現(xiàn)在其它許多公司也在追求的目標(biāo),尤其是 Facebook,該公司和谷歌一樣是機器學(xué)習(xí)和深度學(xué)習(xí)領(lǐng)域的巨鱷。對這一領(lǐng)域內(nèi)應(yīng)屆畢業(yè)生的招聘競爭是很激烈的,谷歌力圖維持其早期的領(lǐng)導(dǎo)地位;多年來,學(xué)術(shù)界都有一個笑話:即使谷歌不需要,也在聘用最頂級的學(xué)生,而這只是為了避免他們?nèi)ジ偁帉κ帜抢铩#ㄟ@個笑話錯過了這個點:谷歌確實需要他們。)Domingos 說:「我的學(xué)生,不管是誰,總是會收到谷歌的 offer。」而這件事變得更激烈了:就在上周,谷歌宣布其將會在蘇黎世開設(shè)一個全新的機器學(xué)習(xí)研究實驗室,那會有一大堆工作崗位需要填補。
但因為學(xué)術(shù)項目還尚未產(chǎn)出大量機器學(xué)習(xí)專家,所以對工作人員進行再訓(xùn)練是必要的。而這并不總是一件簡單的事,尤其是在谷歌這樣的公司——有很多一生時間都在用傳統(tǒng)編程實現(xiàn)「魔法」的世界級的工程師。
機器學(xué)習(xí)需要不同的思維方式。人們變成編程大師通常是因為他們是從通過實現(xiàn)對編程系統(tǒng)的完全控制中成長起來的。機器學(xué)習(xí)還需要掌握一定的數(shù)學(xué)和統(tǒng)計學(xué),而這是很多編程者,甚至是那些能將程序壓縮到讓人吃驚的長度的瘋狂黑客們都從來不屑于學(xué)習(xí)的東西。
Christine Robson 的工作是向谷歌人和機器學(xué)習(xí)技術(shù)領(lǐng)域內(nèi)的外部人士灌輸這個概念
這也需要相當(dāng)程度的耐心。「機器學(xué)習(xí)模型并不是一段靜態(tài)的代碼——你要不斷給它填喂數(shù)據(jù)。」Robson 說,「我們不斷更新模型和學(xué)習(xí)、增加更多數(shù)據(jù),還有比如像是調(diào)整我們未來做出預(yù)測的方式。它讓人感覺就是一個活生生的、有呼吸的東西。這是不同類型的工程開發(fā)。」
「實際上這是一個使用不同的算法進行實驗的學(xué)科,或關(guān)于哪個訓(xùn)練數(shù)據(jù)集在你的使用案例上工作效果真正好的學(xué)科。」Giannandrea 說,盡管他已是搜索的掌控者,但他仍然認(rèn)為在內(nèi)部傳播機器學(xué)習(xí)的福音仍然是他工作的一部分。「計算機科學(xué)的部分不會走遠。但對數(shù)學(xué)和統(tǒng)計學(xué)的關(guān)注會更多,而對編寫五十萬行代碼的關(guān)注則會減少。」
至于谷歌,這一障礙可以通過聰明的再訓(xùn)練而跳過。「在訓(xùn)練的一天結(jié)束時,這些模型中所使用的數(shù)學(xué)就不再那么復(fù)雜了,」Dean 說,「對于我們在谷歌雇傭的大部分工程師而言,這都是可以實現(xiàn)的。」
為了進一步幫助日益增長的機器學(xué)習(xí)專家團隊,谷歌打造了一套強大的工具幫助工程師在訓(xùn)練算法時選擇正確的模型,并加速訓(xùn)練和提煉的過程。這些工具中最強大的是 TensorFlow,一個能加速神經(jīng)網(wǎng)絡(luò)構(gòu)建過程的系統(tǒng)。TensorFLow 由谷歌大腦團隊開發(fā),Dean 與他的同事 Rajat Monga 共同參與了其發(fā)明;它能通過規(guī)范系統(tǒng)開發(fā)中通常很乏味和深奧的細節(jié)來幫助機器學(xué)習(xí)變得大眾化——尤其是 2015 年 12 月谷歌將其開放給公眾之后。
盡管對人工智能社區(qū)散播的這種利他主義行為讓谷歌遭受痛苦,但它也承認(rèn)熟悉其內(nèi)部機器學(xué)習(xí)工具的新一代程序員對谷歌的招聘來說是相當(dāng)好的。(懷疑者指出谷歌開源 TensorFlow 是為了追趕 Facebook,F(xiàn)acebook 在 2015 年 1 月公開發(fā)布了用于早期機器學(xué)習(xí)系統(tǒng)的深度學(xué)習(xí)模塊 Torch。)盡管如此,TensorFlow 的特點加上谷歌的認(rèn)可,使其很快就成為了機器學(xué)習(xí)編程圈子里的一個最愛。據(jù) Giannandrea 說,當(dāng)谷歌提供其第一個在線 TensorFlow 課程時,有 75,000 萬人報名。
谷歌仍然為它自己的程序員保留了很多好東西。在內(nèi)部,該公司有一個可能無可比擬的補充機器學(xué)習(xí)的工具箱,Tensor Processing Unit(張量處理單元,TPU),其中最重要的是這個創(chuàng)新公司他們已經(jīng)使用了多年,但直到最近才宣布出來。TPU 是一種專為運行機器學(xué)習(xí)語言程序而優(yōu)化過的微處理器芯片,就像圖形處理單元(GPU)是專門為加速屏幕上像素的計算這一單一目而設(shè)計的一樣。該公司的巨型數(shù)據(jù)中心的服務(wù)器里恐怕已有成千上萬個 TPU 了(可能只有上帝和 Larry Page 知道有多少)。通過賦予其神經(jīng)網(wǎng)絡(luò)運算以超能力,TPU 已經(jīng)給谷歌帶來了巨大的優(yōu)勢。Dean 說:「如果沒有它,我們完成不了 RankBrain。」
但由于谷歌最大的需求是設(shè)計和完善這些系統(tǒng)的人,就像該公司正在緊鑼密鼓地完善其軟件訓(xùn)練工具一樣,它也在瘋狂地打磨其訓(xùn)練機器學(xué)習(xí)工程師的實驗。它們的范圍從小到大。后一類包括快餐式的兩天「使用 TensorFlow 的機器學(xué)習(xí)速成班」,包含了幻燈片和練習(xí)。谷歌希望這只是初步嘗試,工程師隨后會尋找資源從而學(xué)習(xí)更多。Dean 說:「我們已經(jīng)有數(shù)千人報名這個課程的下一次開課。」
其它還有一些較小的工作也在將外部人士吸引到谷歌的機器學(xué)習(xí)中。今春早些時候,谷歌啟動了 Brain Residency 項目,該項目的目的是為了將有前途的外部人士帶進谷歌大腦團隊內(nèi)部進行為期一年的密集訓(xùn)練。「我們將其稱之為你的深度學(xué)習(xí)事業(yè)起跳的開始,」幫助管理該項目的 Roboson 說。盡管初始項目中來自不同學(xué)科的 27 位機器學(xué)習(xí)學(xué)員中可能會有一些最終會留在谷歌,但其所聲稱的該班級的目的是將他們放歸到野外,使用他們的超能力在整個數(shù)據(jù)地球上傳播谷歌的機器學(xué)習(xí)版本。
所以從某種意義上說,在一個機器學(xué)習(xí)正在占據(jù)舞臺中心的世界里,以人工智能為中心的谷歌有維持自己主導(dǎo)地位的計劃,而 Carson Holgate 在她的忍者課程中學(xué)到內(nèi)容正是以這個計劃為中心的。
她的課程開始于為期四周的新兵訓(xùn)練營,在這里谷歌最先進的人工智能項目的產(chǎn)品領(lǐng)導(dǎo)人訓(xùn)練他們了解將機器學(xué)習(xí)整合到項目過程中的細微之處。「我們將忍者帶進了會議室,Greg Corrado 在那里寫著白板、解釋 LSTM(長短期記憶——一種可以創(chuàng)造強大的神經(jīng)網(wǎng)絡(luò)的技術(shù))、做著夸張的手勢、展示這是到底是如何工作的、其中有什么數(shù)學(xué)、怎么將它用到產(chǎn)品中。」Robson 說,「在開始的四周里,我們做這件事的時候基本上使用到了我們有的每一項技術(shù)和我們工具箱里的每一種工具,從而讓他們能真正沉浸式地深入。」
Holgate 成功通過了新兵訓(xùn)練營,現(xiàn)在她正使用機器學(xué)習(xí)工具在安卓系統(tǒng)上開發(fā)能幫助谷歌人互相交流的通信功能。她調(diào)整超參數(shù)(hyperparameter),整理她的輸入數(shù)據(jù),剝離出停止詞(stop word)。但她已經(jīng)不可能回頭了,因為她知道這些人工智能技術(shù)就在這里,而且是谷歌的未來,也許是所有技術(shù)的未來,或者所有事物的未來。
「機器學(xué)習(xí),」她說,「在這里有巨大的分量。」
?本文由機器之心編譯,轉(zhuǎn)載請聯(lián)系本公眾號授權(quán)。
?------------------------------------------------
加入機器之心(全職記者/實習(xí)生):hr@almosthuman.cn
投稿或?qū)で髨蟮溃篹ditor@almosthuman.cn
廣告&商務(wù)合作:bd@almosthuman.cn
轉(zhuǎn)載請注明來自夕逆IT,本文標(biāo)題:《傳奇游戲版號授權(quán)【正版授權(quán)】【不成功就退款】視頻》

還沒有評論,來說兩句吧...