根據數位發展部官網說明,生成式AI(Generative Artificial Intelligence)是指透過AI技術,生成近似真實資料的研究與應用,譬如生成一篇文章、風格各異的畫作或特定人士的聲音與容貌影像等。這些原本由人類產出的各類內容,如今拜科技進步之賜,都可由AI生成。
今年初,美國經濟顧問公司CVL Economics調查報導指出,去年美國影視、動畫、音樂和遊戲產業中,有72%的企業在產製內容的過程使用生成式AI:使用AI生成文字的比例為68.7%、生成聲音為38%、生成圖像有76.7%。這些數據呈現當地現況,也意味生成式AI正以排山倒海之姿進入內容產業的生產環節,影響整體發展方向。
台灣的內容產業緊跟時代潮流,在視覺藝術、聲音和影視文化等領域,不乏生成式AI的應用案例。呼應當前趨勢,文化部與法國在台協會年度工作坊也以「文化AI進行式」為主題,與文策院合辦策劃,邀請雙方產業先鋒和學者專家分享相關經驗與面臨的挑戰;受限篇幅,以下僅介紹部分台灣個案。
以動畫影像製作和原創IP開發為主的木下曰本動畫公司,作品有原住民題材的動畫電影《CEMACEMAS》、短片和漫畫,也參與排灣族歌手Kivi的歌曲〈我所思念的〉MV製作。為提升動畫品質和流程,近期導入AI繪製技術,在創作階段擁有更多選擇和想像空間,為中期製程增進工作效率,同時減少後期逐格修正的時間、節省成本。
木下曰本的製片兼設計師高捷表示,動畫需要大量精細分工,有了生成式AI輔助,可讓每位畫師的風格趨近一致。因AI模型訓練涉及著作權問題,該公司產製內容均為商業用途,為避免爭議,他們使用自有內容訓練AI模型。不過現階段不論訓練角色或畫風模型,都需要較長的調整時間;如何讓AI生成作品更具人味,也是目前面臨的挑戰。
科文双融集團以創新科技推動沉浸式表演為宗旨,近期在双融域AMBI SPACE ONE陸續推出結合AI技術的沉浸式展覽「《RE:江賢二》數位冥想.江賢二光影沉浸展」,以及「《GAN亭序》AI沉浸式展演「當代」蘭亭集會:Debugging《易經》」。前者由藝術家王奕盛策展,部分片段以科技還原畫家江賢二於1970年代旅居巴黎的生活樣貌;後者是藝術家溫詠筌結合書法和《易經》,以生成對抗網路(GAN)所生成的作品。
該集團副執行長周琍敏表示,他們鼓勵藝術家以新技術創作,期許所有作品在双融域發表後,有機會發展成售票型展覽,建立商業模式。未來除了內容上的應用,双融域也希望借助AI優化客戶服務,例如因應觀光客需求開發翻譯軟體,協助參觀者快速理解展覽內容。
表演藝術的本質是現場演出,難與AI產生聯想,但雲門舞集總監鄭宗龍和日本新媒體藝術家真鍋大度攜手以舞作《波》寫下範例。團隊人員採集舞者的動作,經過AI運算轉化成影像和音樂,在舞台上創造出與舞者對話的效果。
科技人和藝術人的語彙相距甚遠,溝通上需要磨合。
雲門文化藝術基金會執行總監洪凱西不諱言,科技人和藝術人的語彙相距甚遠,溝通上需要磨合。原本他們想打造一個AI舞者,並做了大量實驗,最後仍因訓練所需資料不足而作罷。此外,有些地方想細微修改,但僅三秒鐘的長度,電腦卻花數小時才運算完成,成果也不見得符合藝術家的想像。
AI模型經過訓練可生成特定人士的聲音,去年台灣人工智慧實驗室與歌手陳珊妮合作,透過AI生成工具打造單曲〈教我如何做你的愛人〉。發布初期騙過許多業界人士的耳朵,後來才知道原唱不是陳珊妮本人,而是工程師以她過去20年的歌曲資料訓練出來的AI歌聲,她擔綱製作人之餘,亦親自調教「AI陳珊妮」唱歌。
AI模型經訓練可生成特定人士的聲音,科技帶來進步和方便,但也可能遭有心人士濫用。
遺憾的是,科技帶來進步和方便,但也可能遭有心人士濫用。上述AI單曲發表幾個月後,有人把孫燕姿的資料放上網路,任何人只要上傳乾淨的聲音,都可以置換、模仿孫燕姿的歌聲。後來陳珊妮有機會與律師交流,得知目前人類僅擁有人格權,法律顯然跟不上時代變化。
音樂產業從實體進入串流時代已受到一波衝擊,生成式AI的蓬勃讓業界人士再度產生既視感,不得不採取行動自保,索尼、環球和華納便聯手美國唱片業協會,控告AI公司Suno和Udio使用他們旗下作品訓練音樂生成式AI系統,認為此舉形同大規模侵犯版權。
不只音樂人備感威脅,影像公司Getty Images也控告Stability AI以他們的圖像做訓練;《紐約時報》控告Open AI和微軟擅自以旗下內容訓練AI模型,Open AI則反擊對方的侵權控告於法無據。沸沸揚揚的訴訟事件讓AI的法律爭議浮出檯面,不過目前生成式AI在訓練階段使用的素材,究竟可視為合理使用或必須得到授權?各界看法仍莫衷一是。創作人只能期待政府加快腳步回應局勢,如同陳珊妮所言:「很多關於自然人的權利,都迫切需要法律的保障。」