兩天前,我分享了我在廈門參加TAC LSC 2024的見聞,重點探討了生成式人工智能在本地化中的作用以及文化敏感性的必要性。今天,我想進(jìn)一步探討會議中的另一個重要主題:多模態(tài)本地化的崛起。
短視頻平臺如抖音和TikTok的興起已經(jīng)徹底改變了世界各地人們的內(nèi)容消費方式。隨著視頻成為主要的溝通方式,各大企業(yè)正競相向國際受眾提供多媒體內(nèi)容。然而,視頻和音頻的本地化呈現(xiàn)出不同于傳統(tǒng)文本翻譯的獨特挑戰(zhàn)。
在TAC LSC 2024大會上,包括“未來多媒體本地化”在內(nèi)的多個專題都深入探討了這一議題。很明顯,多模態(tài)本地化不僅僅是翻譯字幕,還涉及:
一個令人印象深刻的案例研究揭示了這些挑戰(zhàn)。一部為西方觀眾本地化的中國電視劇在調(diào)整視覺和文化元素時遇到困難。盡管AI驅(qū)動的轉(zhuǎn)錄和字幕生成無縫完成,但配音的情感細(xì)膩度未能打動西方觀眾,直到人類編輯介入優(yōu)化。
生成式人工智能的進(jìn)步顯著提升了視頻和音頻本地化的可擴(kuò)展性?;诖笮驼Z言模型(LLM)的工具如今可以自動完成:
例如,在TAC LSC 2024會議上,一家中國科技公司展示了通過AI配音將一部10集電視劇的本地化時間縮短近 50%。然而,正如多位發(fā)言者指出的那樣,這些工具在處理文化語境或傳遞真情實感時仍然存在不足。
盡管人工智能效率高,但在多模態(tài)本地化中,尤其是高風(fēng)險項目中,人類專家的作用仍不可替代。
● 語音配音中的文化細(xì)微差異
在一個專題討論中,專家提到,將中文成語直譯成英文常導(dǎo)致生硬的配音效果。例如,“借花獻(xiàn)佛”(指用別人的資源送禮)被機械地翻譯為“borrowing flowers for Buddha”(給佛祖獻(xiàn)上借來的花),完全喪失了其隱喻意義。
配音演員和人工編輯能將這些表達(dá)調(diào)整為文化適配的等效語,從而保留內(nèi)容的情感沖擊力。
● 配音中的情感共鳴
盡管合成聲音技術(shù)已十分先進(jìn),但在處理特定類型(如戲劇或紀(jì)錄片)時,仍然缺乏傳遞深層情感的能力。演講者分享了一個例子:在一部關(guān)于中國農(nóng)村傳統(tǒng)的紀(jì)錄片中,合成配音未能傳達(dá)出對該主題應(yīng)有的敬意。最終由人工介入調(diào)整語氣,確保符合觀眾的期望。
正如在文本翻譯中一樣,混合工作流在多模態(tài)本地化中也證明是成功的關(guān)鍵。這種工作流結(jié)合了 AI 的速度與可擴(kuò)展性以及人類專家的創(chuàng)造力與文化意識。
混合多媒體本地化的運作方式
一個來自TAC LSC 2024的亮點案例是,一家中國游戲公司為歐洲市場本地化一款互動奇幻游戲。AI生成了字幕并為超過30,000條游戲?qū)υ捥峁┝俗詣优湟簟kS后,人類編輯根據(jù)文化需求調(diào)整內(nèi)容,將特定的中國民俗替換為歐洲神話。這種混合方法將項目成本降低了 40%,同時交付了一款貼近目標(biāo)市場文化的本地化游戲。
隨著視頻和音頻內(nèi)容持續(xù)主導(dǎo)全球交流,多模態(tài)本地化已不再是可選項,而成為了必選項。挑戰(zhàn)在于如何在AI的效率與只有人類才能提供的情感和文化深度之間找到平衡。