AlphaGo之父戴密斯·哈薩比斯天才領(lǐng)導(dǎo)者和生活里的普通人

2021-01-06 15:35:38來源：鈦媒體

2016年3月發(fā)生了一件震驚全人類的大事，AI程序AlphaGo打敗了世界頂級圍棋手李世石!要知道圍棋可是號稱人類發(fā)明的最復(fù)雜的游戲。一時(shí)間，人

2017年10月18日，DeepMind團(tuán)隊(duì)公布了代號為AlphaGo Zero的最強(qiáng)版阿爾法圍棋。哈薩比斯一直以來都想創(chuàng)造一個(gè)能夠像人類一樣“學(xué)習(xí)”如何玩游戲并達(dá)到高水平的AI，在他看來，AlphaGo并非人們認(rèn)為的“機(jī)器”，“就好像和人類一起探索宇宙的哈勃望遠(yuǎn)鏡一樣，AlphaGo是和我們一起探索圍棋的哈勃”。

他一直極其堅(jiān)定地相信AI能夠幫助人類以更快速度取得更大突破。像哈薩比斯這類“謝耳朵”型男生通常都做事專注認(rèn)真但木訥、不善溝通，但哈薩比斯的難能可貴之處就在于他在帶領(lǐng)團(tuán)隊(duì)的過程中還培養(yǎng)了在多種環(huán)境下工作的能力并逐漸成長為善于表達(dá)的溝通者。

他經(jīng)常以深入淺出的方式向大眾介紹自己復(fù)雜的工作以及這些工作有何重要意義。他娓娓道來地去分解描述DeepMind是如何把傳統(tǒng)AI技術(shù)和新技術(shù)進(jìn)行結(jié)合的，比如在圍棋上，DeepMind結(jié)合了傳統(tǒng)“樹搜索”的方法和模擬大腦神經(jīng)元的“深度神經(jīng)網(wǎng)絡(luò)”，并巧妙地融合了多種不同的AI技術(shù)。

他曾在做客BBC時(shí)講到，在AI領(lǐng)域深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)是最讓他興奮的兩件事，前者用于識別，后者用于決策，AlphaGo就是兩者結(jié)合的產(chǎn)物。DeepMind將采用處理長期規(guī)劃的更深層次的強(qiáng)化學(xué)習(xí)技術(shù)引入AlphaGo中，而不是簡單地采用預(yù)編程系統(tǒng)按既定步驟下棋。

依靠增強(qiáng)學(xué)習(xí)系統(tǒng)，AlphaGo可以汲取人類棋手比賽的營養(yǎng)，然后開創(chuàng)自己的打法。未來DeepMind還將整合記憶等其他功能，“將所有這些不同領(lǐng)域整合在一起是關(guān)鍵。因?yàn)槲覀兏信d趣的算法能夠?qū)⑨槍δ骋活I(lǐng)域的學(xué)習(xí)經(jīng)驗(yàn)應(yīng)用至新的領(lǐng)域”。

新技術(shù)的引進(jìn)使得AlphaGo Zero能力卓越，與同類程序?qū)膭俾矢哌_(dá)99.8%。能夠達(dá)成這樣的結(jié)果除了新技術(shù)的原因，還源于哈薩比斯對“智力(Mind)”的認(rèn)知，“AlphaGo以人類的方式去下棋。它也是按照人類的方式去學(xué)習(xí)的，像你和我一樣，在不斷練習(xí)中技能得以提高”。

曾經(jīng)擊敗國際象棋冠軍的深藍(lán)，需要國際象棋大師和程序員組成團(tuán)隊(duì)來教它下棋的技巧。不斷進(jìn)化的AlphaGo Zero，就像一個(gè)初生的嬰兒，在圍棋世界里面對既定規(guī)則和要贏的目標(biāo)，先學(xué)習(xí)走路，在無數(shù)次自我對抗中完善自我理解與認(rèn)知，產(chǎn)生了直覺。慢慢地，它不僅能掌握人類大師下棋的技能，還會自己發(fā)展出一些新的技能，并用這些技能摧毀人類智慧的壁壘。

隨著AlphaGo變得聲名卓著，哈薩比斯也獲得了許多榮譽(yù)，包括“亞洲獎(jiǎng)”年度科技最佳貢獻(xiàn)獎(jiǎng)、英國皇家學(xué)會頒發(fā)的“穆拉德獎(jiǎng)”(Mullard Award)、Nature雜志評選的“年度十大人物”、《時(shí)代》提名的全球最具影響力100人等等。

堅(jiān)持探索通用AI

哈薩比斯給自己設(shè)定的終極目標(biāo)是理解時(shí)間、黑洞以及人類在整個(gè)宇宙中的真正地位，通用AI是他到達(dá)這一星辰大海的途徑。讀博時(shí)，哈薩比斯就開始尋求在人類大腦中尋找新的AI算法的靈感了。

2007年，他發(fā)現(xiàn)5位失憶癥患者因?yàn)楹ｑR體受損而很難想象未來，這證明了大腦中以往被認(rèn)為只與過去有關(guān)的部分對于規(guī)劃未來也至關(guān)重要。這些年，在AlphaGo獲得了不起的成功的同時(shí)，哈薩比斯堅(jiān)持對通用AI的探索，帶領(lǐng)DeepMind做了很多大事：

2016年底，DeepMind開源了其核心深度學(xué)習(xí)平臺之一“DeepMind Lab”供研究人員和開發(fā)者使用。這是一套為玩游戲的智能機(jī)器人打造的娛樂學(xué)習(xí)游戲平臺。開源之后，全世界的研究人員和開發(fā)者都可以在上面發(fā)揮才智，為AI發(fā)展群策群力。

同一時(shí)間，DeepMind還公布了一臺“可微分神經(jīng)計(jì)算機(jī)”(DNC)，簡單理解就是這臺機(jī)器既能像人類一樣思考，又能像計(jì)算機(jī)一樣進(jìn)行高速運(yùn)算和記憶數(shù)據(jù)，使得“機(jī)器”向“人”更邁進(jìn)了一步。

為了讓“機(jī)器”更像“人”，DeepMind在圖像生成和語音生成領(lǐng)域也有超前研究，其2016年公布的語音生成系統(tǒng)WaveNet據(jù)稱將計(jì)算機(jī)輸出音頻與人類自然語音差距縮小了50%。

醫(yī)療是哈薩比斯強(qiáng)調(diào)的AI需要落地的領(lǐng)域。DeepMind Health是智能醫(yī)療系統(tǒng)，其根據(jù)與英國全國醫(yī)療系統(tǒng)合作獲取的數(shù)據(jù)打造基于AI的診療和癥狀判斷幫助;Alpha Fold能根據(jù)基因序列來預(yù)測蛋白質(zhì)的3D結(jié)構(gòu)，在有“蛋白質(zhì)結(jié)構(gòu)預(yù)測奧運(yùn)會”之稱的CASP比賽中力壓其他97個(gè)參賽者奪冠，為醫(yī)療領(lǐng)域變革、新藥物研發(fā)奠定了理論基礎(chǔ)。

DeepMind還運(yùn)用AI系統(tǒng)優(yōu)化了冷卻系統(tǒng)的用電效率，據(jù)說一次性幫谷歌節(jié)省了上億美金的開銷。2018年底，Alpha Zero只用一個(gè)算法就在圍棋、國際象棋和將棋三個(gè)領(lǐng)域奠定了霸主地位，并因此登上了《科學(xué)》封面，被評價(jià)“能夠解決多個(gè)復(fù)雜問題的單一算法是創(chuàng)建通用機(jī)器學(xué)習(xí)系統(tǒng)，解決實(shí)際問題的重要一步”。

打造通用AI并不容易，DeepMind另辟蹊徑，從現(xiàn)實(shí)生活中獲得靈感，把解決方案提煉總結(jié)為“在許多不同的可能組合中選擇正確的路徑”。他認(rèn)為，在可以預(yù)見的將來，AI會像科學(xué)家一樣工作，提出假設(shè)并設(shè)計(jì)實(shí)驗(yàn)來驗(yàn)證假設(shè)，然后“取得可能獲得諾貝爾獎(jiǎng)的重大突破”。

為了推進(jìn)通用AI發(fā)展進(jìn)程，哈薩比斯甚至還非常少見地親手寫下長篇文章，發(fā)表在神經(jīng)醫(yī)學(xué)界的頂級刊物《神經(jīng)》中，提出“假如我們的目標(biāo)是開發(fā)出接近或同等于人類智慧的智能技術(shù)，那么就絕不能放棄對人腦的研究和理解，因?yàn)槿四X是唯一能夠證明這種智慧存在的證據(jù)”的鮮明觀點(diǎn)。

目前DeepMind主要專注于兩方面的研究，一個(gè)是對前面提到的強(qiáng)化學(xué)習(xí)的深度探索，可能會與機(jī)器決策、物理世界處理等AI領(lǐng)域的技術(shù)相結(jié)合;另一個(gè)是AI可解釋性，既用心理學(xué)和神經(jīng)科學(xué)來破解AI黑箱，同時(shí)也希望用強(qiáng)化學(xué)習(xí)等“AI原理”幫助探秘人類大腦。

這些研究的重要意義不在于得到了什么具體成果，而在于給跨學(xué)科研究做出了扎實(shí)的示范，證明了神經(jīng)學(xué)補(bǔ)全AI的可行性，其非常關(guān)鍵的機(jī)器心智理論可能會成為主流研究方向。

而且，哈薩比斯認(rèn)為，不僅AI需要向神經(jīng)科學(xué)學(xué)習(xí)，對人類大腦與神經(jīng)的研究今天也需要向AI學(xué)習(xí)。用強(qiáng)化學(xué)習(xí)機(jī)制來解釋人腦的運(yùn)作模式被實(shí)驗(yàn)證明解釋是正確的，那么對人類大腦機(jī)制的研究與模仿應(yīng)該也可以加強(qiáng)對強(qiáng)化學(xué)習(xí)技術(shù)的理解和升級。

未來與記憶相關(guān)的AI技術(shù)或?qū)⒊蔀镈eepMind的研究重點(diǎn)，情景記憶、工作記憶、長期學(xué)習(xí)等技術(shù)很有可能成為突破方向。哈薩比斯的暢想是：通過AI來了解人類智慧，讓AI與人類大腦形成比對，或許可能“對人類心靈中一些最深刻和最持久的奧秘如創(chuàng)造力、夢想等產(chǎn)生深刻的見解，甚至能觸及意識的本質(zhì)”。

天才領(lǐng)導(dǎo)者和生活里的普通人

作為企業(yè)家的哈薩比斯領(lǐng)導(dǎo)著Deepmind一個(gè)包括400名博士的共700名員工的團(tuán)隊(duì)。被谷歌收購后，熱愛自己家鄉(xiāng)的哈薩比斯不愿搬遷，“我在北倫敦出生并長大，非常喜歡這座城市。倫敦沒有任何理由無法容納一家世界級的AI研究機(jī)構(gòu)。我很驕傲我們能留在這里。”

DeepMind辦公樓的所有房間都以人類史上的天才來命名：特斯拉、拉馬努詹、柏拉圖、費(fèi)曼、亞里士多德、居里夫人等。辦公環(huán)境是最有利于人們發(fā)揮創(chuàng)造力的設(shè)計(jì)，大樓的一樓有咖啡廳、有帶冰箱的會客室、桌上有足球游戲機(jī)。樓頂是一個(gè)可以看到倫敦美好風(fēng)景的露天平臺，每周五晚上員工們在那里舉辦聚會。

公司匯聚了全世界最優(yōu)秀的人才，類似波蘭物理奧賽的冠軍或者法國頂級的數(shù)學(xué)博士等，他們都看起來健康、愉快、酷，空氣中彷佛都彌漫著知識的味道。哈薩比斯花很多時(shí)間思考“DeepMind作為一種算法的效率”，他堅(jiān)信自己能把事情做得更出色，因?yàn)楣救诤狭俗顑?yōu)秀的學(xué)術(shù)氛圍和最令人興奮的創(chuàng)業(yè)文化。

這樣的環(huán)境和氛圍使得即使在谷歌最大的競爭對手大舉挖人之時(shí)，DeepMind的員工離職率也為0。作為公認(rèn)的天才的哈薩比斯，并非電影里那種瘋狂地企圖做出一件轟動人類大事的科學(xué)家，或者生活中常見的表面木訥、內(nèi)心狂野的“極客”，他很接地氣。

和絕大多數(shù)普通人一樣，他在該結(jié)婚的年齡成了家，妻子是一名意大利的分子生物學(xué)家，專注于阿茲海默癥的研究。他們育有兩個(gè)兒子，分別擅長科學(xué)和創(chuàng)造性活動。與絕大多數(shù)人的不同之處在于，哈薩比斯一天之內(nèi)有兩個(gè)工作日。

他上午十點(diǎn)左右到辦公室協(xié)調(diào)、溝通、決策，引導(dǎo)公司保持世界領(lǐng)先地位。然后在晚上7點(diǎn)半搭乘地鐵準(zhǔn)時(shí)回到距離他兒時(shí)生活地點(diǎn)不遠(yuǎn)的家中，陪伴家人進(jìn)餐，與孩子們一同游戲、讀書或是幫他們完成家庭作業(yè)。在把兩個(gè)孩子哄睡之后，他重新開始工作至凌晨一點(diǎn)，之后用幾個(gè)小時(shí)來進(jìn)行深度思考，直至凌晨四點(diǎn)入眠。

那些震驚世人的想法都是來自深夜的思考。“完全是個(gè)超人”的哈薩比斯認(rèn)為工作和生活“是同一塊畫布的不同部分”，他閱讀、看電影、聽音樂，但最終還是會回到工作上，變成他思考問題的引子。“在我醒來的每個(gè)時(shí)刻，工作都是我思考的問題，或許在夢里也是如此，這也是我最有熱情的一件事。”

哈薩比斯談到工作時(shí)的樣子能夠讓你相信工作真的是一件最有趣的事，“我感覺非常幸運(yùn)，每個(gè)時(shí)刻我都在做自己真正堅(jiān)信的事。否則，生命那么短暫，為何要去做這些?”所謂天才，其實(shí)很大的部分來自于專注。

關(guān)鍵詞：哈薩比斯

責(zé)任編輯：hnmd004