2018.01.30 11:51 臺北時間

【EmTech China現場 】解析下個AlphaGo線索 再談「深度學習煉金術」

mm-logo
【EmTech China現場 】解析下個AlphaGo線索 再談「深度學習煉金術」
全球頂級科技雜誌「麻省理工學院科技評論」授權的會議品牌,EmTech新興科技峰會,此刻正在北京熱鬧展開。今鏡傳媒與主辦單位「深科技DeepTech」合作,將會議現場帶給台灣讀者。
今年有12位世界級科學家,19位科技公司領導人擔任演講貴賓。其中一位演講貴賓是MIT電腦科學&人工智慧實驗室教授Tomaso Poggio,他在峰會上,發表了關於深度學習煉金術的精彩演講,以下為整理後的演講全文:
 
我想和大家談一下人工智慧領域正在發生什麼。首先,我想說說我們在人工智慧最近所取得的一些成功,尤其是過去5年,以及人工智慧未來可能在哪裡取得突破。深度學習有點像我們這個時代的煉金術,但是需要從煉金術轉化為真正的化學。這樣我們才能知道,深度學習在未來到底可以實現什麼。
過去5年,人工智慧領域最重要的2個成就是:AlphaGo和自動駕駛。我在這行待了很久,因此2個領域都有我的學生:一個是AlphaGo的Hassabis先生,他是DeepMind員工,現在在Google;另外一個就是Moblieye的CEO Amnon Shashua,他現在已經加入了英特爾。
接下來我們可以看一下過去23年機器學習取得了哪些進步。23年以前,我和Hassabis希望可以把電腦視覺和機器學習進行整合,然後創造出一個學習系統來辨別行人。在這個短片中,我們可以看到機器識別出了行人和信號燈,基本上每秒鐘會出現10個錯誤,當時是1995年,所以我們對這個結果還是非常滿意的。
但是,Moblieye後來做到了每30英里只出現1個錯誤,把錯誤率降至當年的百萬分之一,可以看出機器學習的準確性顯著提高。那麼,AlphaGo和Moblieye所取得的進步,背後是什麼動因呢?首先我認為是機器學習的演算法,第一是深度學習,第二是強化學習,他們都是來自於認知科學以及神經科學。
 
深度學習的架構最早是在60年代研究猴子的視覺系統時被發明出來的,從而更好地研究他們大腦在學習時的神經結構,然後一直到Fukushima 提出了首個量化模型,再到20年前現代版的HMAX被提出。這些架構都是一脈相承的——從腦科學到現在的深度學習,本質上都是一樣的層級架構。從下到上,神經的等級越來越高。這個結構的局部中並沒有很多的連接,每一個高級的神經元只會和下一個等級的神經元相聯繫。
2012年我們也開發出了AlexNet,它也是性能最好的一個架構。基於神經科學,我們通過工程學的研究並不斷地發展。這是很重要的,因為我們還沒有真正實現人工智慧。
深度學習可以幫助我們解決10%的難題,剩下的90%呢?我的答案是:我們可能也需要來自神經科學以及認知科學的研究,我們需要更好地瞭解人的思維和大腦。這也是我們MIT大腦、心智和機器中心(CBMM)在研究的問題,5年前我們開始開展相關的研究,我們的使命就是要在理解認知方面獲得新的進步,同時也需要去瞭解整個智慧的架構和智慧背後的科學原理。關於智慧的科學會幫助我們回答最宏大的問題,瞭解生命的起源、宇宙的起源,以及時間的源頭。大腦中智慧的產生,是科學現在需要解決的元問題。
CBMM想通過以下3條路徑解決這個問題:
  1. 電腦科學+機器學習
  2. 神經科學
  3. 認知科學
 
我們會同Google這樣的商業公司合作,探索在工程和科學領域合作的可能。過去幾年中,技術發展和理論發展、包括深度神經網路領域的發展很顯著。要瞭解深度神經網路的運作原理,需要回答背後的3個基本問題:
  1. 逼近理論:深層網路什麼情況下會比淺層網路更有效?
  2. 最優化:應該如何設計經驗風險函數?
  3. 學習理論:為什麼深度學習不會產生過擬合?
這3個問題是機器學習的奠基石。他們的答案很複雜,要解決這種問題,我們需要一開始就思考深度學習的一些技術理論,以及它的局限性。
 
現在是應用人工智慧的黃金時代,因為深度學習及其工程應用,終於說明我們將傳統的人工智慧科學理論應用於了工程實際,而且能夠為我們進行賦能。假如我們可以超越深度學習的理論,可以更好的去瞭解人工智慧的話,我們也可以更加深刻地瞭解我們人類到底是什麼。
更新時間|2023.09.12 20:26 臺北時間
延伸閱讀

支持鏡週刊

小心意大意義
小額贊助鏡週刊!

每月 $79 元全站看到飽
暢享無廣告閱讀體驗

更多內容,歡迎 鏡週刊紙本雜誌鏡週刊數位訂閱了解內容授權資訊

月費、年費會員免費線上閱讀動態雜誌

線上閱讀

更多內容,歡迎 鏡週刊紙本雜誌鏡週刊數位訂閱了解內容授權資訊

月費、年費會員免費線上閱讀動態雜誌

線上閱讀