5月25日,2019機(jī)器翻譯論壇在西湖大學(xué)舉行。會(huì)議有來(lái)自中科院、華為諾亞方舟實(shí)驗(yàn)室、微軟亞洲研究院等知名機(jī)構(gòu)的自然語(yǔ)言處理專家,以及來(lái)自翻譯工具廠商、翻譯服務(wù)業(yè)和教學(xué)界的90多名參會(huì)者。
在會(huì)議發(fā)言環(huán)節(jié),專家們分享了機(jī)器翻譯研究的最新成果,訊飛聽(tīng)見(jiàn)介紹了訊飛機(jī)器翻譯的落地應(yīng)用,對(duì)外經(jīng)貿(mào)大學(xué)崔啟亮博士就機(jī)器翻譯的應(yīng)用提出了問(wèn)題和建議。下午,東北大學(xué)朱靖波老師主持了機(jī)器翻譯技術(shù)發(fā)展與應(yīng)用落地研討會(huì),與會(huì)者就機(jī)器翻譯技術(shù)應(yīng)用的場(chǎng)景、商業(yè)模式、質(zhì)量評(píng)估、發(fā)展前景等進(jìn)行了熱烈討論。
我在會(huì)上認(rèn)真聽(tīng)專家發(fā)言,會(huì)下跟NLP專家、翻譯工具廠商、翻譯公司同行進(jìn)行了交流。以下幾點(diǎn)觀察和個(gè)人思考,權(quán)當(dāng)會(huì)后交流。
- 真正的專家們看到的都是問(wèn)題,沒(méi)有陶醉于自己的研究成果,也沒(méi)有被一些宣傳所困擾。在會(huì)上做分享報(bào)告的專家講的更多是問(wèn)題和解決方案。向這些專家致敬!
- ?自然語(yǔ)言處理技術(shù)通過(guò)神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)(NMT)獲得突破后,又進(jìn)入了新的瓶頸期,質(zhì)量提升緩慢,同質(zhì)化問(wèn)題比較明顯。參會(huì)專家和廠商普遍提到優(yōu)質(zhì)語(yǔ)料匱乏及對(duì)提升機(jī)器翻譯質(zhì)量的制約:擁有語(yǔ)料的翻譯公司對(duì)語(yǔ)料知識(shí)產(chǎn)權(quán)保護(hù)比較謹(jǐn)慎,語(yǔ)料清洗成本高,機(jī)翻公司購(gòu)買(mǎi)語(yǔ)料容易碰到坑,等等。
- ?機(jī)器翻譯技術(shù)在特定場(chǎng)景已經(jīng)有很不錯(cuò)的應(yīng)用,比如情報(bào)、輔助閱讀和日常溝通等,甚至C端的應(yīng)用探索也有成功的范例,如科大訊飛的翻譯機(jī)等產(chǎn)品。
4. 機(jī)器翻譯技術(shù)在專業(yè)翻譯領(lǐng)域的應(yīng)用還有待于突破。傳統(tǒng)CAT工具的用戶基本是職業(yè)譯員和翻譯公司,機(jī)器翻譯雖然已經(jīng)成為了非專業(yè)譯員的另類“CAT工具”,但在專業(yè)翻譯領(lǐng)域的應(yīng)用較難普及,也缺乏盈利模式。對(duì)于機(jī)器翻譯+譯后編輯(PE)和類似Lilt的交互式應(yīng)用的前景,見(jiàn)仁見(jiàn)智,有待于更多驗(yàn)證。
5.? 機(jī)器翻譯質(zhì)量評(píng)測(cè)方法需要革新,長(zhǎng)期使用的Bleu值評(píng)測(cè)系統(tǒng)很過(guò)時(shí),會(huì)上也有專家提到這個(gè)問(wèn)題。建議NMT質(zhì)量評(píng)估納入翻譯和本地化行業(yè)的譯文質(zhì)量評(píng)價(jià)模型,以克服Bleu值評(píng)測(cè)的缺陷。
6.? 機(jī)器翻譯專家和工具產(chǎn)商都在摸索NMT的落地應(yīng)用場(chǎng)景,中科院自動(dòng)化所等都組建了公司團(tuán)隊(duì)來(lái)開(kāi)發(fā)用戶需求牽引的機(jī)器翻譯系統(tǒng)。傳統(tǒng)翻譯公司不應(yīng)該排斥,應(yīng)該積極牽手機(jī)譯廠商一起探索。
7. 翻譯圈和技術(shù)圈都應(yīng)有更大的包容性。對(duì)于一些技術(shù)應(yīng)用探索,翻譯學(xué)術(shù)和教學(xué)圈比較抵觸,大可不必。比如,科大訊飛的翻譯機(jī),受限于技術(shù)本身,從學(xué)術(shù)圈來(lái)看,其缺點(diǎn)是明顯的。但翻譯機(jī)產(chǎn)品本身無(wú)疑是語(yǔ)音識(shí)別和機(jī)器翻譯技術(shù)的成功應(yīng)用,幫助不懂外語(yǔ)的人們更便捷地獲得即時(shí)翻譯服務(wù)。翻譯圈在比較翻譯質(zhì)量時(shí),應(yīng)區(qū)分應(yīng)用環(huán)境或場(chǎng)景。如,不宜用筆譯的質(zhì)量要求來(lái)衡量會(huì)議現(xiàn)場(chǎng)的口語(yǔ)翻譯。同時(shí),應(yīng)多從用戶角度來(lái)看這樣的產(chǎn)品是否有意義。畢竟專業(yè)譯員的服務(wù)不是隨時(shí)隨地可以獲得,也不是所有人都能用得起。從市場(chǎng)或傳播學(xué)的角度,能幫助用戶解決問(wèn)題的產(chǎn)品就是好產(chǎn)品。
8. 機(jī)器廠商在做產(chǎn)品宣傳時(shí),注意機(jī)譯的工具屬性,不要?jiǎng)虞m就拿人類譯員來(lái)做比較,更不要將機(jī)器和譯員描述誤導(dǎo)成替代關(guān)系。這種做法,就像把汽車和人來(lái)做比較一樣荒唐。汽車應(yīng)該和人力車或火車或飛機(jī)等交通運(yùn)輸工具做比較,而不是和人比較。此外,建議找些不懂中文的外國(guó)聽(tīng)眾來(lái)對(duì)人類譯員的同傳和機(jī)器同傳做比較,評(píng)價(jià)哪種方式信息傳達(dá)更好,或者他們更愿意使用哪種服務(wù)。這樣的比較結(jié)果或客戶反饋才有真正的說(shuō)服力。
最引人思考的一個(gè)問(wèn)題在討論環(huán)節(jié)。論壇主持人問(wèn)阿里達(dá)摩院陳博興下一代機(jī)器翻譯技術(shù)是什么樣子?陳博士回答“好問(wèn)題,不過(guò)我也不知道”。其在朋友圈做了解釋:“顛覆第一代規(guī)則翻譯系統(tǒng)的人不是做規(guī)則的,顛覆第二代統(tǒng)計(jì)翻譯模型的人不是做統(tǒng)計(jì)翻譯的,同樣,顛覆第三代神經(jīng)機(jī)器翻譯系統(tǒng)的人不會(huì)是我們現(xiàn)在這批做神經(jīng)機(jī)器翻譯的人。所以,作為一個(gè)目前在從事神經(jīng)機(jī)器翻譯技術(shù)研究的,我也不知道下一代機(jī)器翻譯技術(shù)會(huì)是什么樣的,但是我知道肯定不是基于神經(jīng)網(wǎng)絡(luò)的?!薄拔蚁嘈旁谖业挠猩?,我能看到第四代甚至第五代機(jī)器翻譯技術(shù)的出現(xiàn)?!边@樣的回答體現(xiàn)了求實(shí)的科學(xué)精神,引人思考,也給人期待。
以上僅為個(gè)人觀察和思考,不是會(huì)議總結(jié)。感謝會(huì)議承辦單位西湖大學(xué)和贊助單位小牛翻譯、語(yǔ)言橋、深知無(wú)限。再次向與會(huì)專家學(xué)者致敬!
譯直播為本次會(huì)議提供了直播,完整視頻回放鏈接:http://ttv.cn/archives/4042