2019.01.06 06:45 臺北時間

【視障者AI（上）】無障礙人工智慧成顯學　各科技巨頭搶破頭

發布時間：2019.01.06 06:45 臺北時間

更新時間：2023.09.12 20:28 臺北時間

文

DeepTech深科技

已複製連結

贊助本文

智能身心障礙視障盲人 AI技術深科技

從自動駕駛、無人機，到監控安防，視覺AI技術的突破為人們生活帶來了巨大改變，在許多領域迎來爆發式發展，僅在國內就湧現商湯、雲從、曠視和依圖等四大視覺AI獨角獸。但若真要論能為使用者帶來多大改變，恐怕很少有比得上這一項，那就是用視覺AI來打造盲人的眼睛。

無障礙人工智慧成顯學，各大科技巨頭亦相繼致力投入
AI for Accessibility、無障礙人工智慧近來已在國際間成為一項顯學。如何將發展迅速的人工智慧技術，用來改善全世界約10億殘疾人士的生活，也是各大科技巨頭致力投入的方向之一。

以視障者來說，近日Instagram就新增一項協助工具，用AI動辨識照片內容並以語音告知使用者。臉書Messenger也有無障礙機器人（Accessibility Bot），協助盲人辨識臉書朋友，甚至是朋友的臉部表情。華為Mate 20 Pro 也有一個應用程式Facing Emotions，可以將七種最普遍的情緒轉化為相應的聲音，可以大幅提升盲人與其他人的即時互動交流。
影像視覺AI並不是新的概念，其背後技術主要包含機器學習、深度學習，再加上3D臉部辨識等。尤其是深度學習演算法運用在訓練AI來協助盲人辨識物體，可以發揮非常大的用處。
比方說，如果我們想要設計一個AI協助盲人分辨不同面額的紙鈔。做法就是將一張10元紙鈔，通過各種不同角度，包含正面、反面、整張、邊角、其中每一小片圖案，都展示給AI看，讓它學習什麼是一張10元紙鈔。通過大量反覆學習後，視障者只要能讓手機鏡頭看到10元紙鈔的一小角，AI就能將它分辨出來。
「這些小事，會讓你很確實地感覺到自己的獨立性。希望隨著人工智慧的進展，可以讓我們更容易感受環境，協助我們完成更多日常事務」，微軟視覺輔助應用程式Seeing AI的專案主管、同時自身也是視障者的Saqib Shaikh，近日接受專訪時這樣對DT君說。

Saqib Shaikh在7歲時失去視力，此前不久，他才剛剛得到人生中的第一台電腦。
所幸這並不是他與電腦科學之間的句點。
而後他就讀視障學生小學，一位老師看出了他的潛力，鼓勵他開始學習打字。此後他一路進入大學，主修電腦科學，以班上頂尖的成績畢業，並取得人工智慧碩士學位。而後，他又加入微軟的人工智慧團隊，並在大約3年前通過微軟內部的駭客松競賽，以Seeing AI這個項目脫穎而出，獲得資源將之打造為實際產品，現在已可在美國地區免費下載。
Seeing AI用視覺AI說明　視障者「聽懂」世界
Seeing AI這個是一款結合圖像辨識、語音說明及人性化使用介面的應用程式，可以用手機上的攝像頭識別所有圖像，包含通過掃描條碼來識別產品、辨識身旁其他人的年齡，性別和面部表情，還可以描述它在圖片中看到的內容，並閱讀出功能表和檔。
同時，這款應用程式也可以結合智慧眼鏡，更好地協助用戶瞭解所處的周遭環境。 
圖｜Seeing AI是一款結合圖像辨識、語音說明及人性化使用介面的應用程式（來源：微軟）Saqib Shaikh指出，近年深度學習技術的成熟，是Seeing AI可以真正發揮用處的主要關鍵。通過深度學習訓練，向系統展示大量照片，並教導它們照片中的內容，AI可以真正有效辨識出現實生活環境中的各種物體與人物。
本文係由DeepTech深科技授權刊登。原文連結：用 AI 帮助视障者“听懂”世界，专访微软传奇盲人工程师 Saqib Shaikh。