7月下旬,中國醫藥大學附設醫院(簡稱中國附醫)特地北上,發表全球首款中文AI生成病歷系統「智海系統」,只見神經部主治醫師許凱程對著小麥克風口述患者病徵,約莫10秒,電腦螢幕就顯示一份AI生成的病歷紀錄,「這套系統已在院內廣泛運用,使用過的同仁都驚呼太方便了。」一位中國附醫主管透露。
大語言模型 多方發展
智海系統為何讓人嘖嘖稱奇?支持導入新技術不遺餘力的中國附醫院長周德陽向本刊說明,這套系統將醫院過去龐大的病歷彙整到GPT-4大語言模型(LLM),就如同一顆「腦」,透過摘要分析與關鍵字提取等訓練,就能逐一建構出對病歷的理解,與時下最夯的聊天機器人ChatGPT一樣,都屬生成式AI。
生成式AI不只在醫療端落地,自從ChatGPT問世,各行業都在探索各種應用的可能性,「像國際通訊社彭博(Bloomberg)內部專用的BloombergGPT,就是透過我們雲端服務開發。」亞馬遜旗下Amazon Web Service(AWS)香港專業架構師團隊總監楊仲豪向本刊透露。
「他們(彭博)有40多年新聞、公司申報資料、財務等龐大數據,視這些知識為資產,我們便以自建(客製)模型的方式為其打造專屬GPT。」楊仲豪指出,這樁合作早在多年前就已展開,隨著大語言模型發展蓬勃,合作內容從初期協助編輯下標,再延伸到部分文章生成;除企業自建GPT外,也有法律事務所希望開發可生成訴狀的GPT。
「以前與AI互動,指令要夠精準機器才能執行;現在不用,當描述我心情不好、可否給個影片讓心情變美麗?它可能會去找影片讓我開心。」MIC資深產業分析師朱師右,生動點出這波生成式AI對人類生活帶來的改變。
巨頭搶商機 卡位注資
如今生成式AI應用,在全球風生水起,據研調機構Omdia指出,相關市場規模至2028年將來到585億美元,年複合成長率高達56%,如此巨大的商機,自然吸引科技巨頭追捧潛力新創公司藉機卡位。CB Insights更發現,光今年上半年,全球就新增5家生成式AI獨角獸,比去年增加1倍。除了OpenAI有微軟長期支持,Anthropic、Cohere、Inflection也相繼獲得谷歌(Google)、亞馬遜、甲骨文(Oracle)等大咖加持。
這波AI應用投資熱也吹向台灣。開發飯店語音智能服務「小美犀」的犀動智能共同創辦人暨商務開發副總廖先嫺就興奮地對本刊說:「對軟體新創來說,生成式AI確實是重新洗牌的大好機會。」她透露,小美犀已獲得台灣、日本、泰國等地多達60家旅宿客戶採用,2023年下半年進一步導入GPT-3大語言模型推動產品升級,最新一輪融資也獲緯創、日本知名創投領投。
導入GPT 準度飆升
曾住過台北寒舍艾美、台南晶英或高雄洲際酒店的朋友,一定對小美犀不陌生,透過對話,不只能在房內點播音樂、調控燈光,需要水或毛巾等備品也可下達指令,約5分鐘後,由緯創打造的機器人就會將物品送至房門口。
廖先嫺表示,公司投注不少心力在大語言模型,但其實並沒料到生成式AI會爆紅。一路走來,嘗試過法國的Bloom、Google的LaMDA與BERT等語言模型,直到今年4月再結合GPT-3語言模型,最後以混搭方式訓練出小美犀,讓非結構性的語意產生出有意義的資訊,在飯店場域開展自然的對話。
「過去的語言模型,因資料庫裡找不到答案,小美犀回應問題精準度僅約34%,導入GPT後大幅提升到近95%,幾乎無話不答,用戶體驗變得更好,進而擴大市占。」透過數據,廖先嫻佐證升級後的小美犀,對一家有200個房間的飯店業者來說,平均每月可協助回答逾250小時的電話,相當於1至1.5名人力的工作量。
以小美犀為基礎,犀動智能再接再厲推出「Vocol.ai語音協作平台」,舉凡企業會議、學校教學、醫療問診等,都可將語音轉為文字,並提供摘要分析來生成記錄,同時讓多人協作確認完整性,目前已獲得海內外1萬多人使用。
面對雲端大廠谷歌語音助理或亞馬遜的Alexa,也積極搶攻生成式AI語音服務,廖先嫺認為,小美犀鎖定飯店應用已形成區隔,Vocal.ai未來也將從B2C轉為B2B,2023年11月更打進醫療產業、全面導入奇美醫院協助文書紀錄。
虛擬主持人 參展吸睛
場景轉換到新竹高鐵站旁、竹冠雙翼大樓7樓的集仕多科技(ChoozMo),今年7月,三立新聞台推出以主持人陳斐娟為AI虛擬人像原型的「克隆娟」,就是出自集仕多之手。
「在克隆娟之前,早在2021年,我們就推出台灣第一個AI主播韓小夏。」談起這波生成式AI崛起,集仕多總經理梁哲瑋強調公司已布局多時,早期打造虛擬主持人多利用3D建模,是請真人穿上10至20套衣服在綠幕牆拍攝再後製,如今可運用Stable Diffusion這類預訓練模型建立人臉,從人像到背景都全用電腦軟體生成。
Stable Diffusion是生成式AI新創Stability.AI所發布的文生圖熱門模型,一般民眾都可使用,但梁哲瑋透露,生成式AI有不連續特性,輸入相同問題每次得到結果都不一樣,「當影像要動時,你會發現,怎麼穿的是運動服,下一秒變穿西裝?」如何克服這種不一致性,便成為重要的技術核心,但囿於商業機密,梁哲瑋不肯明說。
2023年亞運期間,就推出以體育主播林奕雯為原型的AI主播「E-Win」,也是集仕多團隊的心血,他們憑著這些作品參展屢屢獲勝,日前更吸引輝達(nVIDIA)美國AI繪圖部門主動尋求合作,計畫將在影音、影片展開技術策略聯盟。
生成式AI各種應用正在萌芽,專家提醒,台灣業者須在資料(數據)拿出獨特性,同時,當大家都用開源(open source)模型打造服務,也需在算法加值,才能在雨後春筍般的市場勝出。