繼在圍棋棋盤上輕松戰(zhàn)勝人類后,AI似乎在對空間的認知和巡航能力上也要將人類踩在腳下了。美國東部時間5月9日,一手打造AlphaGo的DeepMind
繼在圍棋棋盤上輕松戰(zhàn)勝人類后,AI似乎在對空間的認知和巡航能力上也要將人類“踩在腳下了。
美國東部時間5月9日,一手打造AlphaGo的DeepMind團隊又在世界頂級學術(shù)雜志《自然》上發(fā)表了一項重磅成果。在一篇題為Vector-based navigation using grid-like representations in artificial agents的論文中,DeepMind團隊稱,其其最新研發(fā)出的一個人工智能程序具有類似哺乳動物一樣的尋路能力,非常類似大腦中網(wǎng)格細胞的工作原理。
人類在自然空間中游刃有余,可以輕松繞過障礙,找到自己與目的地間的捷徑,但其背后的機理卻不甚明了。
為了解開這個謎團,科學家們進行了孜孜不倦地探索。早在上個世紀六十年代末,UCL神經(jīng)生理學家John O’Keefe就開始研究這個問題,并在1971年發(fā)現(xiàn)位置細胞(Place Cell),大腦定位系統(tǒng)的第一個元件。位置細胞能在主體到達特定地點時放電,從而賦予對過往地點的記憶,但位置細胞并不是坐標,也不具備幾何計算能力。
2005年,May-Britt Moser和Edvard Moser夫婦發(fā)現(xiàn)了大腦內(nèi)嗅皮層更為神奇的網(wǎng)格細胞。他們記錄大鼠運動時特定神經(jīng)細胞被相應激活的規(guī)律,發(fā)現(xiàn)網(wǎng)格細胞能將整個空間環(huán)境劃分成蜂窩狀的六邊形網(wǎng)格,就像地圖上的坐標系一樣。網(wǎng)格細胞的行為是如此令人震撼,2014年,Moser夫婦也因此分享了諾貝爾生理學獎。
不過,網(wǎng)格細胞僅僅是在空間環(huán)境中提供GPS定位服務嗎?一直以來,人們猜測網(wǎng)格細胞支撐著生物的矢量巡航,即計算通向目標的距離和方向,但人們在發(fā)現(xiàn)網(wǎng)格細胞十余年后,對其計算功能以及和矢量巡航的關系,仍然未知。
這正是deepmind這篇論文試圖解開的謎團。
DeepMind團隊決定用人工神經(jīng)網(wǎng)絡檢驗上述猜想。人工神經(jīng)網(wǎng)絡是一種利用多層處理模擬大腦神經(jīng)網(wǎng)絡的運算結(jié)構(gòu)。在這項工作中,研究人員首先訓練循環(huán)神經(jīng)網(wǎng)絡基于運動速度信息在虛擬環(huán)境中定位。這與哺乳動物在不熟悉環(huán)境中運動定位所用到的信息非常類似。
令人震驚的是,類似網(wǎng)格細胞的模式,研究人員稱之為網(wǎng)格單元,在神經(jīng)網(wǎng)絡中自然出現(xiàn)了。在此前的訓練中,研究人員并未刻意引導神經(jīng)網(wǎng)絡產(chǎn)生此種結(jié)構(gòu)。人工智能的定位方案,竟然與大自然億萬年進化所得到的答案如此一致。
DeepMind團隊隨后利用強化學習檢驗這種網(wǎng)格結(jié)構(gòu)是否能夠進行矢量導航。強化學習被普遍用于訓練游戲AI,人類告訴AI一種游戲的得分獎懲機制,但卻不教授游戲方法,由AI在反復進行游戲、努力爭取更高分的過程中自我進化。后期的AlphaGo就完全擯棄了人類棋譜經(jīng)驗,在純粹的自我對弈中從零進化到更強版本。
研究人員將之前自動出現(xiàn)的網(wǎng)格結(jié)構(gòu)與一個更大型的神經(jīng)網(wǎng)絡架構(gòu)結(jié)合成了人工智能體,置于虛擬現(xiàn)實的游戲環(huán)境中。經(jīng)歷強化學習后,該人工智能在游戲迷宮中向目的地前進的導航能力超越了一般人,達到了職業(yè)游戲玩家水平。它能像哺乳動物一樣尋找新路線和抄近路。
而如果將網(wǎng)格單元靜音后,其巡航能力則大打折扣,距離和方向的計算誤差都增大,證明網(wǎng)格模式對矢量巡航的重要性。
對于這項發(fā)現(xiàn),網(wǎng)格細胞發(fā)現(xiàn)者Edvard Moser表示:“這篇論文橫空出世,非常令人興奮。更令人吃驚的是,從另一個角度來看,計算機模式的發(fā)展最終回歸到了我們從生物學中發(fā)現(xiàn)的網(wǎng)格模式。
Deep Mind創(chuàng)始人和CEO,論文共同作者哈薩比斯稱:“我們相信人工智能和神經(jīng)科學是相互啟發(fā)的。這項工作就是很好的證明:通過研發(fā)出一個能在復雜環(huán)境中導航的人工智能體,我們對網(wǎng)格細胞在哺乳動物導航中的重要性有了更深的理解。”
DeepMind團隊相信,這一工作既是理解網(wǎng)格細胞計算功能的重要一步,也是人工智能發(fā)展的重要一步,顯示類腦機器學習構(gòu)架的重要性。而同樣的方法,也可以用于研究生命的其他感知能力。
英國帝國理工學院劉芳德博士稱,位置細胞和網(wǎng)格細胞的研究對人工智能特別是機器人系統(tǒng)啟發(fā)很大。位置細胞其實是空間索引的數(shù)據(jù)庫,描述的是拓撲空間;而網(wǎng)格細胞是幾何計算器,描術(shù)的是歐氏空間。這種組織跟我們目前計算機科學中的技術(shù)完全不同,并有非常強的優(yōu)勢。
杜克大學陳怡然教授和博士生吳春鵬介紹,論文中提到的兩個細節(jié)值得注意。第一,如果神經(jīng)網(wǎng)絡的損失函數(shù)中不包括正則項,那么神經(jīng)網(wǎng)絡無法表現(xiàn)出網(wǎng)格細胞功能。這一發(fā)現(xiàn)給了我們一個全新的角度去思考正則項的作用。第二,論文指出深度神經(jīng)網(wǎng)絡的“黑盒”特點阻礙了進一步分析網(wǎng)格細胞活動特性對路徑整合的作用。這一點再次印證了當前研究神經(jīng)網(wǎng)絡可解釋性的必要。
對此,約翰霍普金斯大學神經(jīng)學家Francesco Savelli 和 James Knierim在同期Nature發(fā)表的題為AI mimics brain codes for navigation的新聞評述中強調(diào):“網(wǎng)格模型增強了目標導向能力,這一事實證明了網(wǎng)格細胞在大腦中的作用。但是在模型中無法直接控制這些計算,使得我們很難對其背后的計算原理、算法和編碼策略進行研究。如何讓深度學習系統(tǒng)更加智能以理解人類的推理邏輯,是未來我們面臨的一個令人興奮的挑戰(zhàn)。”
關鍵詞: 團隊