對(duì)土著語(yǔ)言音頻描述的需求的探討
我居住在沙漠之中,新墨西哥州的阿爾伯克基市,這座城市被一條河流貫穿,四周環(huán)繞著古老而遼闊的土地。這里不僅是美國(guó)最古老的印第安人聚居地,還是土著社區(qū)和美洲土著保留地的所在地,承載著深厚的文化歷史。
盡管這座城市融合了古老建筑與現(xiàn)代建筑的風(fēng)格,從充滿儀式感的基瓦斯島到現(xiàn)代化的水晶賭場(chǎng),然而土著人民卻日益感受到他們的語(yǔ)言受到忽視。在這個(gè)數(shù)字化媒體和語(yǔ)言工具日益盛行的時(shí)代,祖先的語(yǔ)言往往被邊緣化,鮮有得到應(yīng)有的尊重。
全球范圍內(nèi),數(shù)十億人無(wú)法用他們自己的語(yǔ)言獲取數(shù)字內(nèi)容和服務(wù)。其中一些問(wèn)題源于更大范圍的結(jié)構(gòu)性不平等,比如缺乏數(shù)字基礎(chǔ)設(shè)施,如Wi-Fi接入,以及學(xué)校缺乏母語(yǔ)教學(xué)。然而,另一部分原因則在于對(duì)內(nèi)容制作和本地化中不同語(yǔ)言的投資不足和缺乏包容性。
當(dāng)考慮到土著語(yǔ)言的音頻描述時(shí),這種“媒體沙漠”現(xiàn)象顯得尤為突出。音頻描述,即為盲人和低視力觀眾在屏幕上以語(yǔ)言形式描述正在發(fā)生的事情,是一項(xiàng)至關(guān)重要的服務(wù)。盡管英語(yǔ)音頻描述在流媒體、廣播媒體和傳統(tǒng)媒體上日益普及并提升質(zhì)量,但我們?nèi)匀幻媾R著巨大的挑戰(zhàn)。畢竟,為了觸達(dá)語(yǔ)言和文化多元化的受眾,無(wú)障礙性遠(yuǎn)遠(yuǎn)超越了英語(yǔ)的范疇。
在許多方面,人工智能或許能夠成為一個(gè)令人振奮的突破口,用于多種語(yǔ)言的音頻描述制作。借助人工智能技術(shù),音頻描述腳本可以以一種語(yǔ)言(如英語(yǔ))編寫并發(fā)音,然后瞬間轉(zhuǎn)化為另一種語(yǔ)言的發(fā)音。
然而,與此同時(shí),隨著生成性人工智能(GenAI)的崛起,語(yǔ)言獲取方面的差異愈發(fā)凸顯。大型語(yǔ)言模型(LLM)所需的龐大數(shù)據(jù)集往往難以用土著語(yǔ)言提供,這導(dǎo)致一些社區(qū)不得不自力更生,創(chuàng)建自己的數(shù)字語(yǔ)言工具,并與大學(xué)或其他機(jī)構(gòu)合作,手工編織數(shù)字?jǐn)?shù)據(jù)庫(kù),逐詞填補(bǔ)空白。
保護(hù)和數(shù)字化土著語(yǔ)言的工作正在穩(wěn)步推進(jìn),充滿熱情的阿米喬(April Armijo)將其稱為“本土化”。使用那些服務(wù)不足的語(yǔ)言制作音頻描述,不僅可以促進(jìn)這些語(yǔ)言的保護(hù),還能擴(kuò)大其受眾范圍,提高訪問(wèn)量。