語言的數位落差 強化同溫層效應
網路讓我們的世界更加連結,或是更加孤立?
隨著日常應用的行動聯網科技不斷先進,矽谷科技界曾經樂觀相信,未來世界將可打破時空的邊際,讓人與人、人與資訊緊密相連。
不過隨美國大選炒熱的「後真相政治」,似乎打破這個數位烏托邦的美好想像。網路沒有讓彼此更靠近,反倒是加深了隔閡。在社群同溫層的泡泡裡,大家忙著拉攏「我們」,防禦並攻擊非我同類的「他者」。資訊的傳遞方式變得更私密鬼祟,內容更破碎片面,以致於真假難辨。
根據統計,英文仍然是網路上第一通行的語言。在1990年代中期,網路上有八成的內容是英語。不過,如今英語獨霸的情況已經出現改變。以2016年6月的統計,英文在網路所佔的比例大約26.3%,而中文則急起直追,佔了20.8%,而且從2000年到2016年之間像吹氣球一樣暴增了2227.9%。
語言隔閡和資訊破碎化
我的語言的限制意謂著我的世界的限制
The limits of my language mean the limits of my world.
在衛報的這份報告裡提醒我們,即使我們使用的是強勢的語言,我們可獲取資訊的觀點也是相當有限。
以維基百科為例,我們可能很容易誤解,以為不同語言版本的線上內容可以一體適用。特別是一些重大或著名的歷史事件、或是永恆普遍的主題。
不過實際上,不同語言版本的內容差異往往超過我們的想像。在維基百科裡面,大約74%的內容,只存在於一種語言版本。有95%的條目,只有不到六種語言的版本。即使是英語這個最大也最多元的版本裡,它所收錄的條目當中,也只涵蓋維基第二大語言德文版本51%的條目。意思是說,德文版維基百科有一半的條目你沒法子用英文搜尋到。
再拿川普最愛用的推特為例,雖然英語是推特最常用的語言(約佔全部的51%),但是有大約一半的推文用的是其他語言,其中日語(19.1%)、西班牙語(9.6%)、葡萄牙語(5.6%)、和印尼語(4.7%)特別活躍。
從使用者的分析顯示大部分的推特用戶追蹤推文和轉推都只局限於相同語言的使用者。所以推特理論上雖然是全球的大平台,但實際使用上它的互動受限於語言而破碎。
語言與共同體
網路連結的不只是機器,它連結的是人。
The Wed does not just connect machines, it connects people.
語言的使用對網路的體驗帶來深遠的影響。它導引我們在社群網站上和誰說話、決定我們在搜尋引擎中查詢資料的量、也常會決定我們在這些社群平台的表現。
全球資訊網(World Wide Web)的發明人柏納里(Tim Berners-Lee)說過:「網路連結的不只是機器,它連結的是人。」
他想表達的意思或許是:網路重點並不在它的渠道(pipeline),而是連結到人。也就是說,人與人彼此「互連」(inter-)而成「網」(net)。其中,語言對於人類連結,不管在線(online)還是離線(offline)同樣重要。它構成使用者相互辨識、彼此認同的基礎,同時也畫出排除和納入的界線,基於共同利害關係形成共同體。
美國NPR曾報導過,2014年烏克蘭陷入政治風暴時,他們意外發現美國卡通「辛普森家庭」在當地大行其道。有趣的是,在東烏克蘭以俄語為母語的觀眾偏好的卻是烏克蘭語的翻譯。因為他們覺得烏克蘭語的翻譯比較生活化,比較有趣。「他們用俄語交談,用俄語思考,但是看辛普森?他們用的是烏克蘭語。」21歲的土木工程師克斯丁(Misha Kostin)這麼說。
不過對親俄派的政治人物來說,烏克蘭語的辛普森卻代表了俄語在烏克蘭式微的危機,所以在親俄的亞努科維奇上台後,當地電視台只播放俄語版的辛普森,想看烏克蘭語的還得自己去網路下載。
語言區分「我們/他們」在網路上更為明顯。即使同樣是中文,當我們在網路上看到簡體字的留言可能在情緒上自然出現微妙的反應。猶記得去年蔡英文總統就職引來中國大批的網友「翻牆遠征」,部分留言者可能不熟悉臉書操作成了新聞話題。而事實上從中國的微信、微博熱門搜尋字來看,台灣問題在大多數網民眼中顯得雲淡風輕。台灣的網友如果光只是在臉書看到中國網民強烈挑釁的字眼,也很容易出現誤解。
網路上誰有發言權、誰被代表了
富國大致而言得以定義自己,而窮國大致而言被他人所定義。
Rich countries largely get to define themselves and poor countries largely get defined by others.
在衛報的報導中也提到,使用語言的不同,無形中造成網路上資訊的不公平。而資訊的不公平,可能再次強化了過去殖民時代資訊的生產與再現的模式。
例如在網路上,強勢語言--英語--幾乎一面倒主導了大部分非洲和亞洲國家的描述。簡單來說,至少就維基百科來看,西方世界的主要語言音量被放大,成了較弱小聲音的代言者。根據牛津大學網路研究所一份2012年的研究,分析世界每個國家維基條目最多的語言,除了台灣、韓國、日本、中國和越南等少數亞洲國家之外,幾乎整個世界都被主要歐洲語系所涵蓋(如下圖)。同樣有廣大使用者的語言如阿拉伯語、印地語、和其他亞非洲主要語言,在地圖上則幾乎不見蹤影,顯示不同語言在網路話語權上的明顯差異。
不同語言在網路資訊量和代表性的不公平,自然影響到我們對一個地區的理解。衛報報導了一個在約旦河西岸進行的研究,研究者在當地用希伯來文、阿拉伯文、和英文輸入「餐廳」這個字進行搜尋,使用不同的文字,帶給我們對這個城市三種截然不同的認識。
彌合落差
數位翻譯的科技提供了彌合數位語言落差的一個解決之道,同時也開創了新的商業市場。臉書和推特都已開始提供翻譯服務,不過目前只限於少數幾種語言。
而在數位科技驅動下,一些語言可能加速消亡。因為原本少數族群的語言使用者,可能被迫要使用其他強勢的語言來尋找資訊、和人溝通。根據估計,全世界超過六千種現存的語言中,前十大語言已占了網路上82%的內容。匈牙利語言學家柯爾奈(András Kornai)預估,全世界95%的現存語言,將永遠無法在數位的世界留存它們的跡線。
(首圖為兩名參觀者觀賞奧地利維也納的藝術史博物館「無盡屏幕--巴別塔」光影藝術裝置。2016年9月21日。來源:EPA/CHRISTIAN BRUNA,畫面取自東方IC)
參考資料:
The Digital Language Divide(The Guardian)
What 'The Simpsons' Says About Ukraine's Language Divide(NPR)