無障礙人工智慧成顯學,各大科技巨頭亦相繼致力投入
AI for Accessibility、無障礙人工智慧近來已在國際間成為一項顯學。如何將發展迅速的人工智慧技術,用來改善全世界約10億殘疾人士的生活,也是各大科技巨頭致力投入的方向之一。
以視障者來說,近日Instagram就新增一項協助工具,用AI動辨識照片內容並以語音告知使用者。臉書Messenger也有無障礙機器人(Accessibility Bot),協助盲人辨識臉書朋友,甚至是朋友的臉部表情。華為Mate 20 Pro 也有一個應用程式Facing Emotions,可以將七種最普遍的情緒轉化為相應的聲音,可以大幅提升盲人與其他人的即時互動交流。
影像視覺AI並不是新的概念,其背後技術主要包含機器學習、深度學習,再加上3D臉部辨識等。尤其是深度學習演算法運用在訓練AI來協助盲人辨識物體,可以發揮非常大的用處。
比方說,如果我們想要設計一個AI協助盲人分辨不同面額的紙鈔。做法就是將一張10元紙鈔,通過各種不同角度,包含正面、反面、整張、邊角、其中每一小片圖案,都展示給AI看,讓它學習什麼是一張10元紙鈔。通過大量反覆學習後,視障者只要能讓手機鏡頭看到10元紙鈔的一小角,AI就能將它分辨出來。
「這些小事,會讓你很確實地感覺到自己的獨立性。希望隨著人工智慧的進展,可以讓我們更容易感受環境,協助我們完成更多日常事務」,微軟視覺輔助應用程式Seeing AI的專案主管、同時自身也是視障者的Saqib Shaikh,近日接受專訪時這樣對DT君說。
Saqib Shaikh在7歲時失去視力,此前不久,他才剛剛得到人生中的第一台電腦。
所幸這並不是他與電腦科學之間的句點。
而後他就讀視障學生小學,一位老師看出了他的潛力,鼓勵他開始學習打字。此後他一路進入大學,主修電腦科學,以班上頂尖的成績畢業,並取得人工智慧碩士學位。而後,他又加入微軟的人工智慧團隊,並在大約3年前通過微軟內部的駭客松競賽,以Seeing AI這個項目脫穎而出,獲得資源將之打造為實際產品,現在已可在美國地區免費下載。
Seeing AI用視覺AI說明 視障者「聽懂」世界
Seeing AI這個是一款結合圖像辨識、語音說明及人性化使用介面的應用程式,可以用手機上的攝像頭識別所有圖像,包含通過掃描條碼來識別產品、辨識身旁其他人的年齡,性別和面部表情,還可以描述它在圖片中看到的內容,並閱讀出功能表和檔。
同時,這款應用程式也可以結合智慧眼鏡,更好地協助用戶瞭解所處的周遭環境。
Saqib Shaikh指出,近年深度學習技術的成熟,是Seeing AI可以真正發揮用處的主要關鍵。通過深度學習訓練,向系統展示大量照片,並教導它們照片中的內容,AI可以真正有效辨識出現實生活環境中的各種物體與人物。