AlphaGo之父:是天才,也是生活里的普通人
來源:互聯網   發布日期:2019-09-16 11:34   瀏覽:6406

Deepmind創始人戴密斯哈薩比斯是這個時代公認的天才,他不僅是世界AI領域的第一人,還是世界國際象棋大師、電腦游戲設計師、企業家和神經學家,世界范圍內再無第二個人能把這些身份融為一體。 礪石商業評論作者 高冬梅 | 文 2016年3月發生了一件震驚全人類的
 

人工智能实验室Deepmind創始人戴密斯哈薩比斯是這個時代公認的天才,他不僅是世界領域的第一人,還是世界國際象棋大師、電腦設計師、企業家和神經學家,世界范圍內再無第二個人能把這些身份融為一體。

礪石商業評論作者 高冬梅 | 文

2016年3月發生了一件震驚全人類的大事,程序AlphaGo打敗了世界頂級圍棋手李世石!

要知道圍棋可是號稱人類發明的最復雜的。一時間,即將取代人類的流言四起,引發了對倫理問題的大討論。 一般人對AlphaGo都多少有些了解,但對創造AlphaGo的人卻不知道。

人工智能实验室AlphaGo的創造者是個被稱為“人類史上最聰明的人之一”的大牛人戴密斯哈薩比斯(Demis Hassabis),他來自的,不僅是世界領域的第一人,還是世界國際象棋大師、電腦設計師、企業家和神經學家,恐怕世界范圍內再無第二個人能把這些身份融為一體。

1

天生我材必有用

人工智能实验室哈薩比斯從小就好奇心強、喜歡新鮮事物、興趣廣泛,這種天賦特質讓他不斷主動去征服一個又一個新的領域,棋盤、、編程無一不精。

1976年7月,哈薩比斯出生于一個多血統家庭,父親是希臘裔塞浦路斯人,母親則來自華人家庭;他是家中長子,下面還有一弟一妹。

哈薩比斯的父親年輕時是一名創作歌手,后來他家還開過店,再后來他們的父母又都做了教師。父母“放蕩不羈”的生活方式對子女的人生影響深遠。哈薩比斯的妹妹長大后成了一名作曲家和鋼琴演奏家,弟弟成了創造性寫作的作家,但哈薩比斯卻在父母“不要循規蹈矩,堅持走自己的路”的教導下突變為家里的“黑天鵝”,做著和家庭氣質完全不吻合的科技事業。

小時候在父母的店里瘋玩,小小年紀的哈薩比斯從那些五花八門的和中汲取營養,甚至自己創造一些和規則帶領弟弟妹妹一起玩,“我就是這么學會設計的”!所以,也許“創造”一個天才的做法是容許他自由地從生活里的點點滴滴中汲取營養,“野蠻生長”。

4歲時,哈薩比斯對父親和舅舅玩的國際象棋產生了興趣,很平常的生活小事在他身上卻變成了一段傳奇故事:在愛因斯坦剛把說話學利索的年齡,他卻只用兩周時間學下國際象棋就贏了大人。之后他就一路開掛,5歲開始參加國內比賽,6歲贏得8歲以下錦標賽冠軍,9歲成為當時象棋領域世界第二的的11歲以下國家象棋隊隊長,之后于13歲時修煉成為他所在年齡段內世界排名第二的象棋大師。

人工智能实验室因為表現太過出色,他被“之父”、科學家蒂姆伯納斯李評價為是“這個星球上最聰明的人之一”。喜歡深思和內省是哈薩比斯根植在血液里的特點,“下象棋需要深思熟慮,你必須有意識地進行全盤規劃,這個過程讓人很著迷”。

人工智能实验室8歲時,哈薩比斯用參加象棋比賽贏得的200英鎊給自己買了人生中第一臺,對一般小孩兒來說,這只會是個特別一點的大,但對哈薩比斯來說,這卻是一個通向新世界的過道。父親某次帶他去最大的書店Foyles看書的時候,一本關于編程的書吸引了他。

與國際象棋“更像是一種訓練”,提升的只是諸多技能相比,編程的“深邃”更能吸引哈薩比斯。在鍵盤和棋盤上縱橫馳騁的8歲小孩兒思考的卻是兩個和他的年齡完全不相稱的高難度問題:一是大腦是如何學習和完成復雜任務的;二是電腦是否也能做同樣的事。

“電腦的神奇之處在于可以編程,這讓我能夠盡情釋放我的創造力”,在反復編程的過程中,哈薩比斯對的認識更加深入了,他覺得是一個像飛機、火車一樣重要的發明,是能夠擴展人類腦力的工具,之后他又買了一臺新電腦并將其拆開來仔細研究。

很快哈薩比斯便編寫出了一款自己的。作為一個天才,哈薩比斯的最大特點是對新事物的好奇心永無止境。在“征服”編程之后,11歲時他又接觸了,并把其用到自己編寫的中。他編的一個黑白棋的程序竟然戰勝了他弟弟。

人工智能实验室此后電腦編程和就成了他生活的重要組成部分,像磁鐵一樣牢牢吸引著他。厲害的是,這樣深度沉迷的興趣愛好并沒影響他的學業,14歲時哈薩比斯提前兩年完成了類似中國中學會考的考試GCSE,15歲時他的數學水平達到A level,16歲時高等數學、物理和化學都達到了A level,這一年他考入了劍橋大學科學專業,因為年齡太小,劍橋建議他休息一年。

人工智能实验室所以,17歲時哈薩比斯到的一家工作室工作,師從傳奇設計師彼得莫利紐克斯。在這里他開發了首款引入元素的“ThemePark”,這款銷售百萬份,不僅讓哈薩比斯獲得了足夠的資金來完成學業,還讓他堅定必將取得驚人發展的信念。

1994年,哈薩比斯開始在劍橋大學學習科學。盡管是在人人艷羨的高校學習當時最前沿的學科,但哈薩比斯卻覺得劍橋大學本科生只能學習如何去執行具體的任務,這樣的“狹義”遠遠不夠,他對開發涉足范圍更廣的“通用”更感興趣,這為后來埋下了伏筆。

人工智能实验室在劍橋大學的4年間,哈薩比斯還接觸并迷上了古老的東方智力競技圍棋。1997年,20歲的哈薩比斯以極為少見的雙重一級榮譽學位(adouble first-class honours degree)從劍橋皇后學院畢業,然后創建了自己的公司Elixir,為包括微軟在內的全球發行商創造。

人工智能实验室Elixir在高峰期曾雇用過60人,制作了獲得和電視藝術學院獎提名的模擬如“共和國:革命”和“邪惡天才”等,公司估值最高時為1200萬英鎊。然而,正當公司大火之時,恃才任性的哈薩比斯卻覺得自己知識不夠用,要回學校讀書去。

人工智能实验室于是2005年他到大學學院(UCL)就學,在那里進行關于大腦海馬體和情景記憶的前沿學術研究,完成4年認知神經科學的學習后獲得了博士學位。

人工智能实验室哈薩比斯早年的這些經歷,不管是國際象棋還是編程,哪一項單獨拿出來都是別人難以望其項背的成就,但于他而言不過都是輕舉輕放。這不得不讓人感慨天才確實不同凡響、有才任性,同時也不得不承認,“人生沒有白走的路,每一步都算數”,因為他前面所走的每一步都和他日后取得的舉世矚目的成就息息相關。

2

AlphaGo之父

人工智能实验室圍棋因為具有依賴直覺、需要策略性思考等特點,一直以來被看成是一個很難攻克的。記住棋子位置組合、評估棋盤局勢、思考決定和執行贏棋的策略對于那時的來說具有很大的難度,科學家們一直試圖把元素帶入圍棋,但研究了幾十年都無法突破。

人工智能实验室在大學期間,哈薩比斯第一次接觸圍棋就被這個人類開發的最復雜的之一深深吸引了。1997年,超級電腦“深藍”戰勝國際象棋的世界冠軍卡斯帕羅夫之時,他就想著將來自己一定要為圍棋寫一個程序來打敗全人類的圍棋手。

上大學時,因為對圍繞“狹義”的教學課程有所質疑,哈薩比斯一次在課堂上對身邊的朋友們說老師是在“給我們洗腦”,被老師逐出教室,這讓他更堅定了以后自己要創辦一家研究的公司的想法。

人工智能实验室這些植根于遙遠的大學時代的夢想終于在2011年哈薩比斯離開大學十幾年后得以實現。這一年,哈薩比斯和發小一起創立了以“解決智能,使世界變得更美好”為理念的DeepMind公司。哈薩比斯把從象棋、圍棋等智力競技中學到的規劃思維運用到中,“在當時我就意識到這將是一個20年的計劃”。

當時霍金和馬斯克這兩位科技界大佬成立了反聯盟來共同反對的研究。早就認定必將取得驚人發展的哈薩比斯決定去說服霍金,在與這個心系全宇宙的科學家促膝長談了4個小時之后,終于讓他相信了將會讓世界變得更美好,并對哈薩比斯的相關研究表示關注和支持。

而馬斯克則成了哈薩比斯公司的早期人,他曾評價DeepMind:“它讓我對事情發展的速度有了更清晰的了解,事情的發展速度正在加快且遠遠快于人們能夠意識到的。也許你家的Roomba或其他什么會走動,但它不會接管世界。”

人工智能实验室與其他科技類初創公司不同,DeepMind開發的是一種叫作“”的混合了來自神經科學和的研究和專業知識復雜的自學習算法,可以在給定數據集面前自我學習、勝任特定任務。2013年12月,成立僅4年、團隊不到20人,沒有任何具體產品問世的DeepMind通過一款新震驚了全球。

人工智能实验室在研究大會上的演示中,這款通過不斷試錯、不斷學習找出得分的玩法,在雅達利三款經典乒乓、打磚塊和摩托大戰的試玩過程中表現優異,其從零開始學習并能掌握復雜任務的能力讓人們驚嘆并為之點贊。

人工智能实验室谷歌看完這個演示后當即以4億英鎊(約6.6億美元)的價格收購了DeepMind,成為當時規模最大的一筆收購。拉里佩奇不僅對哈薩比斯贊不絕口,更稱Deepmind的技術為“長久以來我見過的最令人興奮的事件之一”。

被谷歌收購后,哈薩比斯與他的團隊仍然爭取到了極大的自主權,不僅公司地點仍保持在,還把自己構想中結合人腦神經元與的圍棋項目命名為AlphaGo。在這之后,在圍棋上的進展勢如破竹。

2016年1月,DeepMind宣布AlphaGo攻克了圍棋并正式挑戰人類棋手。3月,AlphaGo打敗了世界頂級圍棋手李世石,這個消息讓全世界都為之沸騰,就連哈薩比斯自己都表示“很震驚”,驚訝于AlphaGo居然有自己的棋路。從那時開始,將取代人類的聲音不絕于耳。

初戰告捷之后,哈薩比斯對AlphaGo進行架構升級。2016年末2017年初,AlphaGo在中國棋類網站上以“大師”(Master)為注冊賬號,在弈城圍棋網和野狐圍棋網上與中日韓數十位圍棋高手進行快棋對決,連續60局無一敗績。

人工智能实验室2017年5月,在中國烏鎮圍棋峰會上,AlphaGo與排名世界第一的世界圍棋冠軍柯潔對戰,再次輕松獲勝。至此,圍棋界公認AlphaGo的棋力已經超過人類職業圍棋頂尖水平。與柯潔一戰之后,AlphaGo團隊宣布其將不再參加圍棋比賽。

2017年10月18日,DeepMind團隊公布了代號為AlphaGo Zero的最強版阿爾法圍棋。哈薩比斯一直以來都想創造一個能夠像人類一樣“學習”如何玩并達到高水平的,在他看來,AlphaGo并非人們認為的“機器”,“就好像和人類一起探索宇宙的哈勃望遠鏡一樣,AlphaGo是和我們一起探索圍棋的哈勃”。

他一直極其堅定地相信能夠幫助人類以更快速度取得更大突破。像哈薩比斯這類“謝耳朵”型男生通常都做事專注認真但木訥、不善溝通,但哈薩比斯的難能可貴之處就在于他在帶領團隊的過程中還培養了在多種環境下工作的能力并逐漸成長為善于表達的溝通者。

他經常以深入淺出的方式向大眾介紹自己復雜的工作以及這些工作有何重要意義。他娓娓道來地去分解描述DeepMind是如何把傳統技術和新技術進行結合的,比如在圍棋上,DeepMind結合了傳統“樹搜索”的方法和模擬大腦神經元的“深度”,并巧妙地融合了多種不同的技術。

他曾在做客BBC時講到,在領域和強化學習是最讓他興奮的兩件事,前者用于識別,后者用于決策,AlphaGo就是兩者結合的產物。DeepMind將采用處理長期規劃的更深層次的強化學習技術引入AlphaGo中,而不是簡單地采用預編程系統按既定步驟下棋。

依靠增強學習系統,AlphaGo可以汲取人類棋手比賽的營養,然后開創自己的打法。未來DeepMind還將整合記憶等其他功能,“將所有這些不同領域整合在一起是關鍵。因為我們感興趣的算法能夠將針對某一領域的學習經驗應用至新的領域”。

新技術的引進使得AlphaGo Zero能力卓越,與同類程序對弈勝率高達99.8%。能夠達成這樣的結果除了新技術的原因,還源于哈薩比斯對“智力(Mind)”的認知,“AlphaGo以人類的方式去下棋。它也是按照人類的方式去學習的,像你和我一樣,在不斷練習中技能得以提高”。

曾經擊敗國際象棋冠軍的深藍,需要國際象棋大師和程序員組成團隊來教它下棋的技巧。不斷進化的AlphaGo Zero,就像一個初生的嬰兒,在圍棋世界里面對既定規則和要贏的目標,先學習走路,在無數次自我對抗中完善自我理解與認知,產生了直覺。慢慢地,它不僅能掌握人類大師下棋的技能,還會自己發展出一些新的技能,并用這些技能摧毀人類智慧的壁壘。

隨著AlphaGo變得聲名卓著,哈薩比斯也獲得了許多榮譽,包括“獎”年度科技最佳貢獻獎、皇家學會頒發的“穆拉德獎”(Mullard Award)、Nature雜志評選的“年度十大人物”、《時代》提名的全球最具影響力100人等等。

3

堅持探索通用

哈薩比斯給自己設定的終極目標是理解時間、黑洞以及人類在整個宇宙中的真正地位,通用是他到達這一星辰大海的途徑。讀博時,哈薩比斯就開始尋求在人類大腦中尋找新的算法的靈感了。

2007年,他發現5位失憶癥患者因為海馬體受損而很難想象未來,這證明了大腦中以往被認為只與過去有關的部分對于規劃未來也至關重要。這些年,在AlphaGo獲得了不起的成功的同時,哈薩比斯堅持對通用的探索,帶領DeepMind做了很多大事:

2016年底,DeepMind開源了其核心平臺之一“DeepMind Lab”供研究人員和開發者使用。這是一套為玩的打造的娛樂學習平臺。開源之后,全世界的研究人員和開發者都可以在上面發揮才智,為發展群策群力。

人工智能实验室同一時間,DeepMind還公布了一臺“可微分神經”(DNC),簡單理解就是這臺機器既能像人類一樣思考,又能像一樣進行高速運算和記憶數據,使得“機器”向“人”更邁進了一步。

為了讓“機器”更像“人”,DeepMind在圖像生成和語音生成領域也有超前研究,其2016年公布的語音生成系統WaveNet據稱將輸出音頻與人類自然語音差距縮小了50%。

是哈薩比斯強調的需要落地的領域。DeepMind Health是智能系統,其根據與全國系統合作獲取的數據打造基于的診療和癥狀判斷幫助;Alpha Fold能根據基因序列來預測蛋白質的3D結構,在有“蛋白質結構預測奧運會”之稱的CASP比賽中力壓其他97個參賽者奪冠,為領域變革、新藥物研發奠定了理論基矗

DeepMind還運用系統優化了冷卻系統的用電效率,據說一次性幫谷歌節省了上億美金的開銷。2018年底,Alpha Zero只用一個算法就在圍棋、國際象棋和將棋三個領域奠定了霸主地位,并因此登上了《科學》封面,被評價“能夠解決多個復雜問題的單一算法是創建通用系統,解決實際問題的重要一步”。

人工智能实验室打造通用并不容易,DeepMind另辟蹊徑,從現實生活中獲得靈感,把解決方案提煉總結為“在許多不同的可能組合中選擇正確的路徑”。他認為,在可以預見的將來,會像科學家一樣工作,提出假設并設計實驗來驗證假設,然后“取得可能獲得諾貝爾獎的重大突破”。

為了推進通用發展進程,哈薩比斯甚至還非常少見地親手寫下長篇文章,發表在神經醫學界的頂級刊物《神經》中,提出“假如我們的目標是開發出接近或同等于人類智慧的智能技術,那么就絕不能放棄對人腦的研究和理解,因為人腦是唯一能夠證明這種智慧存在的證據”的鮮明觀點。

人工智能实验室目前DeepMind主要專注于兩方面的研究,一個是對前面提到的強化學習的深度探索,可能會與機器決策、物理世界處理等領域的技術相結合;另一個是可解釋性,既用心理學和神經科學來破解黑箱,同時也希望用強化學習等“原理”幫助探秘人類大腦。

人工智能实验室這些研究的重要意義不在于得到了什么具體成果,而在于給跨學科研究做出了扎實的示范,證明了神經學補全的可行性,其非常關鍵的機器心智理論可能會成為主流研究方向。

而且,哈薩比斯認為,不僅需要向神經科學學習,對人類大腦與神經的研究今天也需要向學習。用強化學習機制來解釋人腦的運作模式被實驗證明解釋是正確的,那么對人類大腦機制的研究與模仿應該也可以加強對強化學習技術的理解和升級。

人工智能实验室未來與記憶相關的技術或將成為DeepMind的研究重點,情景記憶、工作記憶、長期學習等技術很有可能成為突破方向。哈薩比斯的暢想是:通過來了解人類智慧,讓與人類大腦形成比對,或許可能“對人類心靈中一些最深刻和最持久的奧秘如創造力、夢想等產生深刻的見解,甚至能觸及意識的本質”。

4

天才領導者和生活里的普通人

作為企業家的哈薩比斯領導著Deepmind一個包括400名博士的共700名員工的團隊。被谷歌收購后,熱愛自己家鄉的哈薩比斯不愿搬遷,“我在北出生并長大,非常喜歡這座城市。沒有任何理由無法容納一家世界級的研究機構。我很驕傲我們能留在這里。”

DeepMind樓的所有房間都以人類史上的天才來命名:特斯拉、拉馬努詹、柏拉圖、費曼、亞里士多德、居里夫人等。環境是最有利于人們發揮創造力的設計,大樓的一樓有廳、有帶冰箱的會客室、桌上有足球機。樓頂是一個可以看到美好風景的露天平臺,每周五晚上員工們在那里舉辦聚會。

公司匯聚了全世界最優秀的人才,類似物理奧賽的冠軍或者頂級的數學博士等,他們都看起來、愉快、酷,空氣中彷佛都彌漫著知識的味道。哈薩比斯花很多時間思考“DeepMind作為一種算法的效率”,他堅信自己能把事情做得更出色,因為公司融合了最優秀的學術氛圍和最令人興奮的文化。

人工智能实验室這樣的環境和氛圍使得即使在谷歌最大的競爭對手大舉挖人之時,DeepMind的員工離職率也為0。作為公認的天才的哈薩比斯,并非里那種瘋狂地企圖做出一件轟動人類大事的科學家,或者生活中常見的表面木訥、內心狂野的“極客”,他很接地氣。

人工智能实验室和絕大多數普通人一樣,他在該結婚的年齡成了家,妻子是一名的分子學家,專注于阿茲海默癥的研究。他們育有兩個兒子,分別擅長科學和創造性活動。與絕大多數人的不同之處在于,哈薩比斯一天之內有兩個工作日。

人工智能实验室他上午十點左右到室協調、溝通、決策,引導公司保持世界領先地位。然后在晚上7點半搭乘地鐵準時回到距離他兒時生活地點不遠的家中,陪伴家人進餐,與孩子們一同、讀書或是幫他們完成家庭作業。在把兩個孩子哄睡之后,他重新開始工作至凌晨一點,之后用幾個小時來進行深度思考,直至凌晨四點入眠。

那些震驚世人的想法都是來自深夜的思考。“完全是個超人”的哈薩比斯認為工作和生活“是同一塊畫布的不同部分”,他閱讀、看、聽音樂,但最終還是會回到工作上,變成他思考問題的引子。“在我醒來的每個時刻,工作都是我思考的問題,或許在夢里也是如此,這也是我最有熱情的一件事。”

哈薩比斯談到工作時的樣子能夠讓你相信工作真的是一件最有趣的事,“我感覺非常幸運,每個時刻我都在做自己真正堅信的事。否則,生命那么短暫,為何要去做這些?”所謂天才,其實很大的部分來自于專注。

登陸 | 注冊 歡迎登陸本站,認識更多朋友,獲得更多精彩內容推薦!

贊助本站

人工智能實驗室

相關熱詞:

相關內容
AiLab云推薦
最新資訊
本月熱點
熱門排行

閱讀量:104589

閱讀量:103041

閱讀量:101629

閱讀量:79356

閱讀量:69247

閱讀量:63309

展開
Copyright © 2010-2019 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯系我們 | 廣告服務 | 公司動態 | 免責聲明 | 隱私條款 | 工作機會 |