機(jī)器翻譯(MT)解決方案和技術(shù)的開發(fā)正在成為整個(gè)語言行業(yè)的一個(gè)與眾不同的特點(diǎn)。例如:丹麥語言服務(wù)提供商(LSP) 允許使用wire.toteagsmer的專用插件,在2018年,幾乎沒有翻譯過MT的內(nèi)容。
然而,到2021年,該公司用機(jī)器翻譯翻譯了超過10億個(gè)單詞,用“相當(dāng)可觀的增長”來形容 Roeland hofkens ,LanguageWire的首席產(chǎn)品和技術(shù)官,于2021年12月在SlatorCon Remote發(fā)表演講。
也就是說,公司已經(jīng)有了一個(gè)堅(jiān)實(shí)的基礎(chǔ),即自動(dòng)化的工作流程和專有的翻譯管理系統(tǒng)(TMS)?,F(xiàn)在,LanguageWire在工作流中尋找空缺,在那里自動(dòng)化可以騰出員工的時(shí)間來完成不能留給機(jī)器的工作。
專注于數(shù)據(jù)安全和定制機(jī)器翻譯,使得LanguageWire在科學(xué)家和工程師團(tuán)隊(duì)的幫助下創(chuàng)建了自己的專有引擎。根據(jù)Hofkens的說法,這個(gè)更加靈活的系統(tǒng)還有一個(gè)額外的好處,即比第一次使用的開源MT提供商LanguageWire快5倍.
該公司的翻譯生產(chǎn)力(又稱CAT)工具已經(jīng)測量了翻譯速度和編輯距離,更精確地描繪出翻譯人員所做的工作以及所需時(shí)間?,F(xiàn)在,該公司正在建立一個(gè)模型,利用過去工作的數(shù)據(jù)來預(yù)測新任務(wù)的機(jī)器翻譯質(zhì)量和效率。
鈥淲e鈥檝我們做了模擬,鈥 霍夫肯斯解釋道。鈥淚如果我們對(duì)供應(yīng)商幾乎什么都不做的工作給予更高的折扣,然后在機(jī)器翻譯不起作用的地方?jīng)]有折扣或是很小的折扣,這就給我們的翻譯支付方式帶來了更多的公平性。鈥
霍夫肯斯說,這些見解在該公司的機(jī)器翻譯戰(zhàn)略中起著至關(guān)重要的作用,正如他認(rèn)為在其他LSP中應(yīng)該這樣。他指出:“如果你不能測量端到端流中發(fā)生的所有事情,那么你的機(jī)器翻譯操作就完全蒙上了眼睛?!?。
]]>
許多翻譯公司都不愿意采用機(jī)器翻譯。許多人認(rèn)為,這將降低工作質(zhì)量,并將削弱該行業(yè)的就業(yè)機(jī)會(huì)。作為一個(gè)在本地化和翻譯行業(yè)工作了幾十年的人,我可以告訴你,這種阻力并不是什么新鮮事。
1993年,當(dāng)我介紹CAT工具同時(shí)我也看到了對(duì)新技術(shù)的抵制。翻譯人員擔(dān)心依賴翻譯記憶會(huì)使他們的工作更具重復(fù)性,并降低工資和工作量。25年后,同樣的爭論也在機(jī)器翻譯上展開。
翻譯當(dāng)然不是新概念。它現(xiàn)在越來越受歡迎是由于最近技術(shù)的進(jìn)步。20年前,基于神經(jīng)網(wǎng)絡(luò)的引擎比20年前先進(jìn)得多。
當(dāng)有人認(rèn)為機(jī)器翻譯引擎的結(jié)果不佳時(shí),我首先要問的是他們上次測試機(jī)器翻譯的時(shí)間。許多業(yè)內(nèi)人士仍將他們的觀點(diǎn)建立在多年前的結(jié)果之上,而這些結(jié)果已不再有效。事實(shí)上,機(jī)器翻譯更便宜、更快、更安全,質(zhì)量也越來越好。不采用這種快速主導(dǎo)技術(shù)的LSP將無法在這個(gè)新的市場上競爭。
在這篇文章中,我們將看到反對(duì)機(jī)器翻譯的爭論,以及它們是如何隨著機(jī)器翻譯的新進(jìn)步而改變的。我們還將概述lsp采用機(jī)器翻譯過程的過程。
盡管新的機(jī)器翻譯引擎產(chǎn)生的結(jié)果在某些情況下接近于人工翻譯,但仍然有理由不愿意使用未經(jīng)編輯的機(jī)器翻譯。大多數(shù)機(jī)器翻譯輸出需要翻譯后編輯。
關(guān)于后期編輯的效率,人們有著相互矛盾的看法。一些翻譯人員認(rèn)為從頭開始翻譯有時(shí)比后期編輯快,盡管這種看法正在被更高質(zhì)量的機(jī)器翻譯輸出所改變。
即使進(jìn)行人工后期編輯,成本仍然比傳統(tǒng)的翻譯過程至少便宜50%。
有一種誤解,認(rèn)為機(jī)器翻譯只對(duì)獲取文本的要點(diǎn)有用,而實(shí)際上,機(jī)器翻譯幾乎是任何翻譯項(xiàng)目的一個(gè)重要部分,不管你使用的是什么源文件。
在大多數(shù)情況下,機(jī)器翻譯不是合適的問題,而是除了機(jī)器翻譯之外還需要做多少后期編輯工作。有了適當(dāng)?shù)牧鞒?,機(jī)器翻譯可以用來滿足大多數(shù)翻譯要求。
不進(jìn)行后期編輯:機(jī)器翻譯可用于法律行業(yè)的eDiscovery之類的內(nèi)容分析,或用于內(nèi)部溝通的基本理解。
最少或不進(jìn)行后期編輯:它還可以用于處理面向客戶的大型非關(guān)鍵內(nèi)容存儲(chǔ)庫,例如支持論壇或電子商務(wù)應(yīng)用程序。
通過后期編輯和附加QA步驟:它可以用于大多數(shù)需要翻譯的場景。
仍有不建議使用機(jī)器翻譯的情況。
正如我們在其他受到技術(shù)干擾的行業(yè)中所看到的那樣,就業(yè)機(jī)會(huì)的流失并不一定像它們在發(fā)展中那樣嚴(yán)重。
作為一名自由譯者的生活,曾經(jīng)的基礎(chǔ)是獲得項(xiàng)目和客戶,建立質(zhì)量聲譽(yù),現(xiàn)在已經(jīng)轉(zhuǎn)向提供各種各樣的服務(wù)Elanna Mariniello and Afaf Steiert在tcworld中解釋?.
科技正在創(chuàng)造新的職位,需要新的技能。編輯把翻譯工作從機(jī)器上翻譯出來,而不是把翻譯工作從機(jī)器上翻譯出來。
翻譯人員對(duì)此表示過多關(guān)注薪酬和工作量減少. 然而,這個(gè)問題比機(jī)器翻譯的影響要大得多。在本地化行業(yè)中,降低大多數(shù)流程成本的壓力越來越大。翻譯成本的降低也影響了譯者的收入。為了解決這些問題,業(yè)界需要加強(qiáng)對(duì)訓(xùn)練有素的語言專業(yè)人士價(jià)值觀的認(rèn)識(shí)。
受機(jī)器翻譯影響的不僅僅是翻譯人員。這項(xiàng)技術(shù)改變了定價(jià)和語言服務(wù)能力,也影響了客戶。當(dāng)一個(gè)LSP采用機(jī)器翻譯過程時(shí),他們需要準(zhǔn)備好培訓(xùn)翻譯人員和客戶。下面是實(shí)現(xiàn)機(jī)器翻譯過程的分步指南。
]]>根據(jù)定義,機(jī)器翻譯是一種計(jì)算語言學(xué)和語言工程的形式,它使用軟件將文本或語音從一種語言翻譯到另一種語言?;旧?,在機(jī)器翻譯過程中,一個(gè)源語言單詞被目標(biāo)語言中的一個(gè)單詞所代替。但不要把機(jī)器翻譯與計(jì)算機(jī)輔助翻譯(CAT)混淆,后者是指人工翻譯人員使用計(jì)算機(jī)軟件輔助翻譯過程;CAT工具不會(huì)自動(dòng)翻譯內(nèi)容。
有幾種機(jī)器翻譯引擎可以對(duì)內(nèi)容進(jìn)行不同的分析和處理。最常見的是基于規(guī)則的機(jī)器翻譯和統(tǒng)計(jì)機(jī)器翻譯。
基于規(guī)則的機(jī)器翻譯(RBMT)
基于規(guī)則的引擎使用無數(shù)的語法和語言規(guī)則來分析內(nèi)容和分解文本。在使用這些規(guī)則時(shí),源語言的語法結(jié)構(gòu)被轉(zhuǎn)換成目標(biāo)語言。雙語詞典也用于語言對(duì),可以添加自定義術(shù)語列表來微調(diào)引擎。通過在特定主題或行業(yè)中添加特定術(shù)語,可以在特定主題上創(chuàng)建更可靠的翻譯結(jié)果?;谝?guī)則的引擎不需要雙語語料庫(也稱為大型結(jié)構(gòu)化文本集)來創(chuàng)建翻譯系統(tǒng)。
基于規(guī)則的引擎由于翻譯所基于的語法規(guī)則和詞典的數(shù)量,產(chǎn)生了相當(dāng)可預(yù)測的,但也非常一致的輸出。由于設(shè)置了規(guī)則,每個(gè)錯(cuò)誤都可以用目標(biāo)規(guī)則來糾正。因此,通過添加更多的規(guī)則和更多的詞典或術(shù)語,可以改進(jìn)翻譯。
統(tǒng)計(jì)機(jī)器翻譯(SMT)
與RBMT不同,統(tǒng)計(jì)機(jī)器翻譯不基于語言規(guī)則分析文本。相反,這個(gè)引擎“學(xué)習(xí)”如何翻譯文本。因此,它分析語言對(duì)中的大量數(shù)據(jù),然后使用其統(tǒng)計(jì)翻譯模型來創(chuàng)建源內(nèi)容的翻譯。該模型是通過分析雙語語料庫建立起來的,需要適當(dāng)?shù)碾p語內(nèi)容量。使用SMT,還可以通過提供與所討論主題相關(guān)的更多數(shù)據(jù)來關(guān)注特定主題或行業(yè)。
機(jī)器翻譯與神經(jīng)網(wǎng)絡(luò)
機(jī)器翻譯正在發(fā)展。自2013年以來,谷歌和微軟等互聯(lián)網(wǎng)巨頭一直在探索使用神經(jīng)網(wǎng)絡(luò)的可能性。神經(jīng)網(wǎng)絡(luò)是最早應(yīng)用于語音和圖像識(shí)別技術(shù)的統(tǒng)計(jì)學(xué)習(xí)模型。在機(jī)器翻譯中使用它們使引擎能夠通過模式和結(jié)構(gòu)訓(xùn)練自己如何使用類似于人腦工作方式的過程翻譯文本。這個(gè)過程被稱為“深度學(xué)習(xí)”,它基于通過實(shí)施大數(shù)據(jù)分析而確立的原則。
雖然神經(jīng)機(jī)器翻譯(NMT)是一種新的翻譯方法,但它被認(rèn)為是一個(gè)巨大的突破,并且已經(jīng)在機(jī)器翻譯研究者中非常流行,因?yàn)楹苊黠@,它在大多數(shù)情況下提高了翻譯,提供的輸出看起來更流暢,更人性化。
他們說,NMT可以創(chuàng)造更流暢的翻譯,并且可以減少多達(dá)25%的后期編輯工作。對(duì)于一些語言專業(yè)人士來說,毫無疑問,神經(jīng)機(jī)器翻譯比基于規(guī)則或統(tǒng)計(jì)的機(jī)器翻譯表現(xiàn)得更好。NMT系統(tǒng)能夠理解和看到單詞的相似性,考慮整個(gè)句子,學(xué)習(xí)語言之間的復(fù)雜關(guān)系(來源:神經(jīng)翻譯是一個(gè)突破的三個(gè)原因)。
由于每個(gè)引擎處理和生成數(shù)據(jù)的方式不同,因此為項(xiàng)目選擇的引擎取決于目標(biāo)語言和給定源文件的參考資料的可用性。一般來說,機(jī)器翻譯最適合重復(fù)性和簡單性的內(nèi)容,在這些內(nèi)容中,相同的詞被重用,同義詞被最小化。毫無疑問,機(jī)器翻譯的優(yōu)勢在于:它提高了生產(chǎn)率,縮短了上市時(shí)間,提高了術(shù)語的一致性。
]]>然而,盡管有了這些突破,機(jī)器翻譯仍然缺乏。
最明顯的情況是它在翻譯文學(xué)文本方面完全沒有效率。google可能理解句子之間的組合關(guān)系,但(目前)它無法理解同義詞之間的細(xì)微差別、隱喻或轉(zhuǎn)喻、幽默等的結(jié)構(gòu)。當(dāng)然,我們可以翻譯一本100頁的員工手冊,但我們無法翻譯第一行草頁。
此外,由于它無法解釋文本,機(jī)器翻譯引擎根本無法處理寫得不好的文本。如果一篇文章寫得不好、模棱兩可或有拼寫錯(cuò)誤,機(jī)器翻譯就不能做太多的工作。這就是為什么在使用引擎之前必須考慮編輯步驟,以確保結(jié)果不可讀。一個(gè)例子(從西班牙語到英語)是,機(jī)器翻譯引擎無法推斷指示元素何時(shí)不存在:“si”或“s”(如果或是)、“que”或“que”(那或什么)、“como”或“cómo”(喜歡或怎樣)等。
當(dāng)要翻譯的文本太技術(shù)化時(shí),也不建議使用機(jī)器翻譯。當(dāng)然,我們可以使用gtm來翻譯手機(jī)的用戶手冊,但是對(duì)于液壓起重機(jī)來說,翻譯手冊是不可能的,因?yàn)閷?duì)于后者,我們必須有廣泛的知識(shí)來翻譯。我們遇到的許多法律文本也可以這樣說:每個(gè)國家的法律制度不同,所以同一個(gè)詞的翻譯也會(huì)因國家而異。例如,“法庭”在阿根廷不是“法庭”,而是“法庭”(最高法院除外),而在西班牙,“法庭”則被用作標(biāo)準(zhǔn)翻譯。
這個(gè)博客無意批評(píng)機(jī)器翻譯的使用,而只是警告機(jī)器翻譯的一些局限性。在可信的翻譯中,我們鼓勵(lì)盡可能使用它,因?yàn)槲覀兠刻於伎吹讲粩嗟母倪M(jìn)。
]]>新加坡國家翻譯委員會(huì)(NTC)最近頒發(fā)了首個(gè)翻譯人才發(fā)展計(jì)劃(TTDS),該計(jì)劃于2018年1月首次公布。七名專業(yè)翻譯人員將獲得高達(dá)90%成本的無債券補(bǔ)貼 – 上限為每位獲獎(jiǎng)?wù)?0,000新元(7,647美元) – 用于培訓(xùn)和教育。
廣告
在2018年9月的最后一周讀者調(diào)查中,Slator向受訪者詢問他們是否認(rèn)為政府應(yīng)支持翻譯公司培訓(xùn)和教育。
近四分之三的受訪者表示,雖然這是一個(gè)好主意。繼續(xù)教育和培訓(xùn)也是Lupe Gervas在SlatorCon舊金山2018年演講中的一個(gè)關(guān)鍵點(diǎn).Gervas,智能問答社區(qū)Quora的本地化經(jīng)理,在活動(dòng)期間發(fā)表講話,并要求與會(huì)者思考他們是否真正招聘和準(zhǔn)備本地化人才為未來。
“我們的行業(yè)發(fā)展如此迅速,如此之快,以至于15年前的工作現(xiàn)在可能無法發(fā)揮作用,”Gervas在她的演講中一度說道。她給觀眾帶來了兩個(gè)關(guān)鍵的收獲,特別是對(duì)于管理者:在招聘方面冒險(xiǎn)并改進(jìn)培訓(xùn)和指導(dǎo)。
在2018年10月的第一次讀者調(diào)查中,特別是翻譯公司被問及對(duì)編輯后機(jī)器翻譯的需求。
近一半的受訪者表示,他們發(fā)現(xiàn)要求他們對(duì)編輯機(jī)器翻譯進(jìn)行后期編輯的客戶數(shù)量顯著增加。這可能暗示語言學(xué)家扮演的角色正在發(fā)生變化,因?yàn)镹MT在本地化過程中不斷變得越來越根深蒂固,而且根據(jù)SAP全球化首席Ferose V R的說法,這實(shí)際上為翻譯行業(yè)描繪了一個(gè)光明的未來。
“技術(shù)的核心是人類,”他說,并補(bǔ)充說,技術(shù)的作用是“提升而不是放松人類?!盕erose說,技術(shù)的作用將是產(chǎn)生最初的機(jī)器翻譯輸出,而人類將繼續(xù)負(fù)責(zé)增值任務(wù),他認(rèn)為這是后期編輯以及與機(jī)器實(shí)時(shí)協(xié)作。
毫無疑問,即使NMT研究的發(fā)展,NMT也只是在某些領(lǐng)域 – 創(chuàng)意垂直領(lǐng)域,主要是營銷和游戲。在舊金山的SlatorCon技術(shù)小組中,GoPro和騰訊的高管表示,這些極具創(chuàng)意的垂直行業(yè)不適合NMT使用。
10月12日,讀者民意調(diào)查針對(duì)新興亞洲市場,詢問讀者是否看到亞洲語言需求增加。
這項(xiàng)民意調(diào)查導(dǎo)致了“是”,“不”和“難以辨別”之間幾乎均勻的三方分歧。需求增長可能難以確定,但亞洲的語言服務(wù)市場在SzerMeet香港2018年期間表現(xiàn)活躍。
來自EVS Translations,23和Alibaba Translate的演講嘉賓加入Slator聯(lián)合創(chuàng)始人Florian Faes,探索亞洲語言服務(wù)市場。特別是Into23的創(chuàng)始人Richard Delanty表示,亞洲有幾個(gè)領(lǐng)域?yàn)檎Z言服務(wù)和技術(shù)提供商提供了巨大的潛力。與此同時(shí),阿里巴巴翻譯的高級(jí)產(chǎn)品運(yùn)營顧問李杰表示,語言是電子商務(wù)巨頭戰(zhàn)略的重要組成部分。
李說她“在阿里巴巴的第一個(gè)任務(wù)是如何將語言變成產(chǎn)品。此外,我所關(guān)注的主要是使用人工智能,主要是機(jī)器翻譯與語音識(shí)別等其他人工智能技術(shù)相結(jié)合。“
考慮到語言的性質(zhì)以及可以使用多少訓(xùn)練數(shù)據(jù),中文,日文和韓文等亞洲語言對(duì)于機(jī)器翻譯來說是難以理解的。例如,韓國的KT公司在推出人工智能語音助手GiGA Genie時(shí)發(fā)現(xiàn),“最大的困難就是獲得足夠的語言數(shù)據(jù)?!?/p>
在10月19日的讀者調(diào)查中,讀者被問及他們?nèi)绾慰创齼?nèi)部和自由翻譯工作將在未來三年內(nèi)發(fā)展。
近一半的受訪者認(rèn)為自由職業(yè)者會(huì)增長。其余部分分為現(xiàn)狀或轉(zhuǎn)向內(nèi)部招聘。
這項(xiàng)特別調(diào)查是基于英國RWS為投資者和分析師舉辦的資本市場活動(dòng)的故事,該公司解釋了一些關(guān)鍵細(xì)節(jié)和發(fā)展,包括其專利翻譯和備案部門的內(nèi)部翻譯基地。
]]>由于我是巴西翻譯員,因此以任何方式將我的翻譯語言對(duì)限制為英語 – 葡萄牙語對(duì)都很方便。
翻譯中的不自然性可以通過借助現(xiàn)在可用的任何自動(dòng)翻譯工具來大量舉例說明。不好的人員翻譯也會(huì)造成很多這些不愉快的例子。
我認(rèn)識(shí)一個(gè)博主,他的東西被太多人從太多的地方讀到。他自動(dòng)翻譯他的帖子。任何人都可以看到他翻譯的文本總是笨拙,難以理解,充滿荒謬,語無倫次,總之,他們根本就不會(huì)聽起來自然。難怪。除了那些認(rèn)為自動(dòng)翻譯的東西足以滿足多語言讀者的人之外,任何人都可以看到直接機(jī)器翻譯是如何使文本內(nèi)容變得貧乏,甚至沒有一個(gè)合格的審查。
例如,將Google翻譯器提供的原始翻譯提供給其他語言的讀者,對(duì)于熟悉目標(biāo)語言的讀者而言,這幾乎是不可想象的。但是,這正是有些人在做的。沒有開玩笑。你肯定會(huì)得到很多現(xiàn)在聽起來很拗口的句子,無法理解、無意義、完全荒謬。這些自動(dòng)翻譯資源的使用方式與我們?nèi)祟悾ā白匀弧狈g人員)的使用方式不同。其中之一,據(jù)我所知,其中許多人是免費(fèi)工作的。當(dāng)然,我們?nèi)祟愐矔?huì)犯錯(cuò)誤。我看到的巨大差異在于,至少我們有機(jī)會(huì)為這樣的錯(cuò)誤感到羞愧。贊揚(yáng)機(jī)器翻譯表現(xiàn)出色,或者因?yàn)橐粋€(gè)簡陋,無法形容的荒謬潤色而告知它是毫無意義的。它應(yīng)該與對(duì)最高的贊譽(yù)或更嚴(yán)厲的責(zé)罵完全一樣的漠不關(guān)心,是不是對(duì)嗎?
因此,期望機(jī)器翻譯的自然性是不合理的,它們不能對(duì)任何觀點(diǎn)作出反應(yīng),根本不能理解任何東西,不能根據(jù)情況或環(huán)境作出明智的選擇,也不能有絲毫的想法,不能結(jié)合最基本的語境或?qū)I(yè)知識(shí)來翻譯。只有我們具有使用語言作為真實(shí)溝通工具經(jīng)驗(yàn)的自然人才可以提供任何程度的自然翻譯。
如果你想聽起來自然,那么當(dāng)你翻譯時(shí),還有很多事情需要考慮。首先,你必須很好地理解原文中傳達(dá)的內(nèi)容,你也應(yīng)該能夠猜出作者的某些意圖。例如,當(dāng)一個(gè)作者說些有趣的事情 – 無論多么成功 – 如果他的翻譯人員無法猜測這個(gè)事情的笑點(diǎn),更糟的是,將這個(gè)可能的笑點(diǎn)視為嚴(yán)肅的東西,那么重要的東西會(huì)在翻譯時(shí)被忽略。自然沒有會(huì)打動(dòng)它的讀者。在某些特定情況下使用的語言可能充滿隱喻,給原文帶來色彩,但這將是譯者的地獄,
很多時(shí)候,我看到像“遠(yuǎn)有多遠(yuǎn)”這樣的表達(dá),將其翻譯成葡萄牙語為“Qu?olongeélonge?”。確實(shí),這是一種逐字逐詞翻譯。問題是沒有葡萄牙語的人會(huì)想到用這種方式提出這樣的問題。它總體上不自然。有些人類翻譯似乎甚至沒有懷疑“qu?olonge longege”聽起來有多不自然。在他們設(shè)法做出這樣一個(gè)明顯不自然的翻譯之前,他們永遠(yuǎn)不會(huì)是好的翻譯人員。在這個(gè)意義上說,機(jī)器永遠(yuǎn)不會(huì)是一個(gè)好翻譯者,然后才能明白所說的內(nèi)容并作出相應(yīng)的反應(yīng)。
當(dāng)“早安”可以被翻譯成’boamanh?’時(shí)(如果這就是這些詞的真正含義,例如,“我早上愉快地度過了一個(gè)非常滿意的日子”),我認(rèn)為一臺(tái)冰冷的機(jī)器不可能做出正確的決定。他們“),或者什么時(shí)候?qū)⑵浞g為”bom dia“,這是一種常見的問候語。通常,我們大多數(shù)人類翻譯人員都是如此翻譯。
為了翻譯內(nèi)容做到客觀且自然,首先是具有自然性的參考文本,人(或機(jī)器,如果可能的話)應(yīng)該既具有目標(biāo)語言的豐富經(jīng)驗(yàn)又具有源語言的完整知識(shí)。在沒有這些的情況下,我認(rèn)為無論是人還是機(jī)器都是不可能做到自然翻譯的。
本文由迪朗上海翻譯公司提供
]]>