我想和大家談一下人工智慧領域正在發生什麼。首先,我想說說我們在人工智慧最近所取得的一些成功,尤其是過去5年,以及人工智慧未來可能在哪裡取得突破。深度學習有點像我們這個時代的煉金術,但是需要從煉金術轉化為真正的化學。這樣我們才能知道,深度學習在未來到底可以實現什麼。
過去5年,人工智慧領域最重要的2個成就是:AlphaGo和自動駕駛。我在這行待了很久,因此2個領域都有我的學生:一個是AlphaGo的Hassabis先生,他是DeepMind員工,現在在Google;另外一個就是Moblieye的CEO Amnon Shashua,他現在已經加入了英特爾。
接下來我們可以看一下過去23年機器學習取得了哪些進步。23年以前,我和Hassabis希望可以把電腦視覺和機器學習進行整合,然後創造出一個學習系統來辨別行人。在這個短片中,我們可以看到機器識別出了行人和信號燈,基本上每秒鐘會出現10個錯誤,當時是1995年,所以我們對這個結果還是非常滿意的。
但是,Moblieye後來做到了每30英里只出現1個錯誤,把錯誤率降至當年的百萬分之一,可以看出機器學習的準確性顯著提高。那麼,AlphaGo和Moblieye所取得的進步,背後是什麼動因呢?首先我認為是機器學習的演算法,第一是深度學習,第二是強化學習,他們都是來自於認知科學以及神經科學。
深度學習的架構最早是在60年代研究猴子的視覺系統時被發明出來的,從而更好地研究他們大腦在學習時的神經結構,然後一直到Fukushima 提出了首個量化模型,再到20年前現代版的HMAX被提出。這些架構都是一脈相承的——從腦科學到現在的深度學習,本質上都是一樣的層級架構。從下到上,神經的等級越來越高。這個結構的局部中並沒有很多的連接,每一個高級的神經元只會和下一個等級的神經元相聯繫。
2012年我們也開發出了AlexNet,它也是性能最好的一個架構。基於神經科學,我們通過工程學的研究並不斷地發展。這是很重要的,因為我們還沒有真正實現人工智慧。
深度學習可以幫助我們解決10%的難題,剩下的90%呢?我的答案是:我們可能也需要來自神經科學以及認知科學的研究,我們需要更好地瞭解人的思維和大腦。這也是我們MIT大腦、心智和機器中心(CBMM)在研究的問題,5年前我們開始開展相關的研究,我們的使命就是要在理解認知方面獲得新的進步,同時也需要去瞭解整個智慧的架構和智慧背後的科學原理。關於智慧的科學會幫助我們回答最宏大的問題,瞭解生命的起源、宇宙的起源,以及時間的源頭。大腦中智慧的產生,是科學現在需要解決的元問題。
CBMM想通過以下3條路徑解決這個問題:
- 電腦科學+機器學習
- 神經科學
- 認知科學
我們會同Google這樣的商業公司合作,探索在工程和科學領域合作的可能。過去幾年中,技術發展和理論發展、包括深度神經網路領域的發展很顯著。要瞭解深度神經網路的運作原理,需要回答背後的3個基本問題:
- 逼近理論:深層網路什麼情況下會比淺層網路更有效?
- 最優化:應該如何設計經驗風險函數?
- 學習理論:為什麼深度學習不會產生過擬合?
這3個問題是機器學習的奠基石。他們的答案很複雜,要解決這種問題,我們需要一開始就思考深度學習的一些技術理論,以及它的局限性。
現在是應用人工智慧的黃金時代,因為深度學習及其工程應用,終於說明我們將傳統的人工智慧科學理論應用於了工程實際,而且能夠為我們進行賦能。假如我們可以超越深度學習的理論,可以更好的去瞭解人工智慧的話,我們也可以更加深刻地瞭解我們人類到底是什麼。