【環(huán)球網(wǎng)智能報(bào)道 記者 馬俊】近日上海小學(xué)教材將“外婆”改成“姥姥”一事,引發(fā)了全國(guó)網(wǎng)友對(duì)于“方言保護(hù)”的爭(zhēng)論熱潮。新加坡《聯(lián)合早報(bào)》稱,此事反映出方言在全國(guó)范圍內(nèi)的式微趨勢(shì),許多歷史文化遺產(chǎn)面臨失傳的厄運(yùn)。盡管國(guó)內(nèi)外都啟動(dòng)了多種語(yǔ)言的保護(hù)工程,但接受《環(huán)球時(shí)報(bào)》記者采訪的專家表示,大多數(shù)語(yǔ)言消亡的趨勢(shì)幾乎是不可避免的,但通過(guò)人工智能技術(shù),至少我們有望把這些語(yǔ)言保存下來(lái),從而記錄下它們所承載的文化。
方言作為地方文化的一種,是民族文化的有機(jī)組成部分,這些“南腔北調(diào)”傳承著不同地區(qū)的文化和歷史。那些生活中積累下來(lái)的生動(dòng)傳神、接地氣的特有音調(diào)和詞匯,構(gòu)成了方言妙趣的音韻。對(duì)于流動(dòng)性越來(lái)越大的現(xiàn)代社會(huì)而言,方言更寄托著很多游子的思鄉(xiāng)之情,聽(tīng)起來(lái)特別有親切感,那些與生俱來(lái)的記憶,隨著鄉(xiāng)音歷歷在目。
但現(xiàn)實(shí)情況是,在全球化和信息高速傳遞的現(xiàn)代社會(huì),無(wú)論是國(guó)際還是國(guó)內(nèi),包括方言在內(nèi)的大多數(shù)語(yǔ)言都受到強(qiáng)勢(shì)主流語(yǔ)言的侵蝕甚至是飛速消亡。聯(lián)合國(guó)2017年的相關(guān)報(bào)告顯示,全球現(xiàn)有約6000種語(yǔ)言,預(yù)計(jì)到本世紀(jì)末將有90%的語(yǔ)言可能消亡。其中近500種語(yǔ)言的傳承者甚至少于10人,很可能會(huì)迅速滅亡。而其他語(yǔ)言,則由于學(xué)校、商業(yè)和電視上那些主流語(yǔ)言的壓倒性優(yōu)勢(shì)排擠,也會(huì)逐漸消失滅絕。
同樣的情況也出現(xiàn)在中國(guó)。由于大量人口背井離鄉(xiāng),使方言使用的場(chǎng)合和頻次大大降低,生存的空間不斷被擠壓。根據(jù)2015年啟動(dòng)的中國(guó)語(yǔ)言資源保護(hù)工程提供的數(shù)據(jù),在中國(guó)的130多種語(yǔ)言中,有68種使用人口在萬(wàn)人以下,有48種使用人口在5000人以下,其中有25種使用人口不足千人,滿語(yǔ)、赫哲語(yǔ)、蘇龍語(yǔ)等使用人數(shù)不足百人。你還記得你的家鄉(xiāng)話怎么說(shuō)嗎?很多受訪者表示已經(jīng)不會(huì)用地道的家鄉(xiāng)話來(lái)表達(dá)了。
致力于少數(shù)民族語(yǔ)言和方言保護(hù)近十年的科大訊飛多語(yǔ)種高級(jí)研究員祖漪清告訴《環(huán)球時(shí)報(bào)》記者,從整體趨勢(shì)而言,包括方言在內(nèi)的大多數(shù)語(yǔ)言走向消亡是不可避免的。在全球化趨勢(shì)日益明顯的當(dāng)代,語(yǔ)言作為交流工具,本身就在不斷向主流強(qiáng)勢(shì)語(yǔ)種靠攏。尤其是主流語(yǔ)言往往背靠更強(qiáng)大的經(jīng)濟(jì)和文化實(shí)力,不但不斷侵蝕弱勢(shì)語(yǔ)言的“地盤”,而且創(chuàng)造新詞的功能更活躍。她舉例說(shuō),在科大訊飛的全國(guó)方言保護(hù)項(xiàng)目中發(fā)現(xiàn),不僅是滿語(yǔ)這類瀕臨消亡的小語(yǔ)種存在困境,就連很多使用人群較多的方言同樣受到明顯侵蝕。例如由于北京方言和普通話很接近,要找出能說(shuō)一口地道北京話的年輕人變得很難,很多北京方言的特有詞匯其實(shí)已經(jīng)被普通話取代。
在信息化時(shí)代,文化交流的速度空前加快,也加速了強(qiáng)勢(shì)語(yǔ)言對(duì)其他語(yǔ)言或方言的入侵。祖漪清表示,即便是具有強(qiáng)大造詞能力的強(qiáng)勢(shì)語(yǔ)種的漢語(yǔ),如今也會(huì)直接在各種中文交流場(chǎng)合使用NBA、Ipad等外來(lái)詞匯。
她惋惜地說(shuō),糟糕的是,由于很多少數(shù)民族語(yǔ)言和方言的使用人群只使用口語(yǔ)交流,極少使用文字,很多南方方言沒(méi)有合適漢字進(jìn)行描寫。而口語(yǔ)采集比朗讀采集困難大很多。一旦相關(guān)語(yǔ)言消亡,它承載的那些獨(dú)特文化也就消失在歷史長(zhǎng)河中。
為挽救這些瀕臨消亡的語(yǔ)言,各國(guó)都在爭(zhēng)分奪秒。澳大利亞政府上世紀(jì)70年代便規(guī)定在全國(guó)實(shí)現(xiàn)多語(yǔ)教育制;美國(guó)也出臺(tái)專門保護(hù)原著民語(yǔ)言的相關(guān)法案,支持原著民語(yǔ)言的項(xiàng)目。中國(guó)也先后出版了漢語(yǔ)方言地圖集、音檔及系列詞典,《中國(guó)的語(yǔ)言》及少數(shù)民族語(yǔ)言的詞典和參考語(yǔ)法等。中國(guó)語(yǔ)言資源保護(hù)工程更是規(guī)模宏大,計(jì)劃為每種語(yǔ)言記錄1000-3000個(gè)常用詞、數(shù)量有限句子和400分鐘的文化典藏。
祖漪清介紹說(shuō),正確利用人工智能技術(shù),對(duì)于保存這些瀕臨滅亡的語(yǔ)言是十分必要的??拼笥嶏w的人工智能技術(shù)不但可以分析方言的孤立音節(jié)和孤立詞匯,還可對(duì)連續(xù)話語(yǔ)進(jìn)行建模?;谡Z(yǔ)音合成、語(yǔ)音識(shí)別、翻譯技術(shù)經(jīng)過(guò)人機(jī)協(xié)同分析,實(shí)現(xiàn)對(duì)一個(gè)語(yǔ)言的完整“復(fù)制”。對(duì)于沒(méi)有文字的語(yǔ)言,美國(guó)科學(xué)家進(jìn)行的“語(yǔ)音羅塞塔”項(xiàng)目的思路也值得借鑒,即盡最大可能獲得被記錄語(yǔ)言的語(yǔ)音和主流語(yǔ)言文字的平行數(shù)據(jù),并實(shí)現(xiàn)兩者之間的“翻譯”。
不過(guò)她也表示,由于現(xiàn)有的人工智能技術(shù)需要海量數(shù)據(jù)作為機(jī)器學(xué)習(xí)的內(nèi)容支撐,但一些瀕危方言和語(yǔ)言的使用者中,真正能標(biāo)準(zhǔn)朗讀的人已經(jīng)很少,甚至只有個(gè)位數(shù),而且大都年年事已高,這使得語(yǔ)音的采集工作極為艱難且迫切。另一方面,中國(guó)方言,尤其是南方方言種類繁多,結(jié)構(gòu)復(fù)雜,甚至存在“十里不同音”的情況。若想要保存這樣種類繁多的方言,還必須依靠全社會(huì)的支持。日前,科大訊飛對(duì)外啟動(dòng)了“方言發(fā)音人”招募公益行動(dòng),邀請(qǐng)全民參與共建“中國(guó)方言庫(kù)”,用自己的聲音留下中華語(yǔ)言文化遺產(chǎn),傳承優(yōu)秀傳統(tǒng)文化。