兩場辯論的主題分別是「我們應該資助太空探索」,以及「我們應該增加使用遠端醫療」,參賽者在事前不知道題目的情況下,當場進行一個 4 分鐘的開場申論,然後有 4 分鐘時間來反駁對方的論點,最後有 2 分鐘做結辯,由 Project Debator 對戰人類辯論者:2016 年以色列國家辯論冠軍 Noa Ovadia、以色列國際辯論協會主席 Dan Zafrir,並由現場觀眾投票評論各方表現。
在雙方結束總結後,多數觀眾認為人類表達的比較好,不過 Project Debator 傳遞信息量的豐富度則優於人類,而且在第二場的「我們應該增加使用遠端醫療」辯論,觀眾則認為 Project Debator 的遊說能力較強,例如有 9 位觀眾在聽完 AI 辯論後而改變了立場。看來在這場與人類的友誼賽,AI 的表現算是不錯。
Project Debater 是由位在以色列 Haifa 實驗室的研發團隊來主導,花費 6 年開發並建立起 Project Debater 的三大能力:首先,是資料驅動的語音編寫和交付。第二是聽力理解能力,能夠識別隱藏在連續口說論述中的關鍵主張。第三是在一個獨特的知識圖譜(knowledge graph)中模擬人類的困境,進而做出有規則性的論點。
目前人工智慧在單一特定領域的能力已經有不少相當人類水準、甚至超越人類的表現,像是影像識別、棋類遊戲等,同樣的,辯論就是針對一個特定領域的議題來闡述論點,而在闡述論點前需要參考大量的內容,並將片段的資訊整理成有脈絡,流暢的分析或觀點,這一直是機器擅長的地方,也已經落地在許多行業裡,例如金融業的股票投資、或是 IBM Waston 替醫生爬論文,而 Project Debater 可說是 IBM 處理非常大型資料集能力的另一個展示。
IBM 也表示,辯論規則源自於人類的討論文化,而非隨意的對話,Project Debater 必須適應人的理性,並提出人們可以遵循的論點。因此,在辯論中,人工智慧必須學會在淩亂的非結構化人類世界中抓出方向,而不是像在棋盤遊戲中那樣使用預先定義的規則。基於上述原因,Project Debater 有時也會犯錯。但 IBM 認為,雖然該項技術的工作遠未完成,但它有可能幫助解決數千個複雜的人類決策,例如,金融領域、公共政策,未來 Project Debater 的基礎技術將在 IBM Cloud 和 IBM Watson 中商業化。
人工智慧的語言對話能力一直是科學家及企業希望能獲得大幅突破的領域,IBM 的辯論 AI 屬於大型資料查找、分析、用以幫助做決策,展現了人類理性的一面,另外則有不少人希望讓 AI 有人類的感性,包括閒聊機器人、或是Google或微軟已投入眾多資源的 Duplex 語音技術,則是希望讓 AI 在對話時能有人類的口氣。
本文係由DeepTech深科技授權刊登。