233期
2019 年 03 月 27 日
  北美智權官網 歷期電子報   電子報訂閱管理  
 
AI加持後,翻譯行業將呈現何種新樣貌?
許慈真/輔仁大學法律學系博士

近年來人工智慧(AI)發展蔚為話題,有預測十至十五年後AI可望取代許多藍領與白領的從業人力,尤其是重複性高、要求規律一致的工作。接觸過Google翻譯、Bing翻譯等服務的使用者或許疑惑,AI應用是否會大幅減少翻譯人力需求,全面改寫翻譯行業的樣貌?

當然,不同翻譯類型會有不同結果,這也與其內容「偏向創造性或重複性」密切相關,但是否意味著,重複性相對較高的專業文件翻譯未來可全由AI代勞?恐怕亦無法一概而論。本文以下試舉出幾項事例,簡介專業文件筆譯領域的AI應用現況,並對機器翻譯(Machine Translation, MT)發展提出一些看法。


圖片來源 : shutterstock、達志影像

人類與機器協作

現今的專業文件譯師幾乎都必須利用「電腦輔助翻譯」(Computer Assistant Translation, CAT)工具進行作業,而CAT主要是透過AI搜尋及比對技術,從翻譯記憶庫(translation memory)中找出不同相似度的翻譯文句,譯師可決定採納或加以編輯,其翻譯成果會存入資料庫供下次參考。其實不只是專業文件翻譯,若干書籍翻譯也能運用CAT提高翻譯效益。

利用CAT協作之最大優點在於「一致性」,尤其是法律文件,不僅應在單一文件使用相同詞彙指涉同一概念或事件,也必須在一系列不同文件間保持一致性。其次,CAT能自動比對數字、日期或格式等細節,避免人為疏漏;如遇內容完全或絕大部分重複時,亦可自動覆蓋譯文或由譯師稍加修改,以節省作業時間。CAT甚至允許導入機器翻譯結果,例如Google翻譯、Bing翻譯等,為譯師提供更多參考資料。簡言之,目前專業文件筆譯的主導者仍是譯師,CAT、記憶資料庫及術語庫(termbase)則是其作業時的得力助手。

透過人類與機器協作,能夠加速處理數量龐大的文件並保持一致性,不論是日本法務省的「日本法令英譯資料庫系統」(Japanese Law Translation Database System, JLT)[1]或是香港律政司的「電子版香港法例」[2],均屬於此類模式運用。

以JLT為例,其法令譯文係由人工翻譯後經機器利用資料庫校正用語,最終交由專業人士審閱定案。為此,法務省發展出《標準法律用語對譯字典》(Japanese-English Standard Legal Term Dictionary, SLTD),藉以大幅提升翻譯精準度,同時保持法令名稱、構成格式、陳述方式、用語等形式的一致性;舉例來說,「相手方」(中文譯為他方或對造)一語在該雙語字典即針對不同場合譯成不同英文詞彙,譬如一般情形譯為「the other party/other parties」或「opposite party」,契約上譯為「counterparty」,在司法程序上譯為「opponent」或「adverse party」。SLTD可說是此計畫最具價值之產出,不但可嵌入翻譯工具協助維持譯文一致性,也為往後機器翻譯發展提供寶貴的訓練資料。

歐盟eTranslation機器翻譯

為便利歐盟各國機構及公共部門之資訊交流,歐盟執委會翻譯總署(Directorate-General for Translation, DGT)以開放原始碼統計機器翻譯(Statistical Machine Translation, SMT)系統MOSES為基礎,開發專屬的機器翻譯工具「MT@EU」並於2013年啟用。MT@EU主要以龐大的Euramis翻譯記憶庫作為訓練素材,其中內含來自24個官方語言的10億多個譯句,由數十年來歐盟機構譯師的工作成果累積而成,因此MT@EU相當熟稔歐盟政策及法律用語,特別適合翻譯歐盟相關事務文件。自2017年11月起,「eTranslation」[3]取代MT@EU,並且逐漸導入神經機器翻譯(neural machine translation, NMT)技術。

eTranslation的翻譯服務不僅免費(至少2020年為止),同時具備高度保密性,但服務對象原則上限於歐盟會員國、冰島及挪威之公共管理部門以及特定教學人員。儘管如此,歐盟智慧財產局(EUIPO)已透過eTranslation釋出部分上訴委員會、普通法院及歐洲法院裁判的翻譯文本以供參考,使用者可就翻譯成果決定是否進一步交由人工翻譯[4]

WIPO Translate機器翻譯

世界智慧財產權組織(WIPO)多年來發展的機器翻譯工具「WIPO Translate」(前身為「TAPTA」)目前可在頁面上提供專利名稱、摘要、說明、請求項等專利文件內容即時翻譯[5],包括專利合作條約(PCT)10種官方語言的查詢與互譯服務;此外,也可自行複製文件中任何內容貼上WIPO Translate網頁[6],選擇特定語言對(language pairs)及技術領域進行機器翻譯,其使用方式與Google翻譯雷同,使用者亦能編輯翻譯結果,等同向WIPO提供翻譯反饋。

WIPO Translate是利用神經機器翻譯技術,提供貼近一般語言用法的翻譯成果。神經機器翻譯基於龐大的神經網絡模型,讓機器學習先前譯句,相較於「以短語為基礎」之統計方法,所產出的語序更加自然,尤其有助於改善遠程語言對(distant language pair)如中英對譯,但即使是較近的語言對如英法對譯,也同樣受惠。值得注意的是,WIPO Translate單純利用大量公開的專利文件訓練,因此機器能學得更快且產出更優質成果,再加上「領域辨識技術」(domain-aware-technique),機器翻譯時能考量到不同技術領域差異(目前有來自國際專利分類(IPC)的32個技術領域)而調整翻譯成果,這正是為何利用WIPO Translate翻譯專利文件會比Google翻譯(於2016年亦導入神經機器翻譯技術)更加卓越的原因。但也正因為WIPO Translate僅專注於翻譯專利文件,適用在其他領域/類型文件或日常言談可能不盡理想。

雖然WIPO聲明此翻譯系統僅供參考,無法保證譯文的正確性與品質,但WIPO Translate未來仍會免費提供予聯合國機構及其他國際組織使用,以因應大量翻譯需求並降低成本。而韓國與WIPO於2018年5月簽署諒解備忘錄(memorandum of understanding),在其專利申請及審查程序中導入WIPO Translate,成為首個採用WIPO Translate的會員國。

機器翻譯帶來之助益及其發展困難

誠如前述,機器翻譯不僅能降低企業與譯師的成本,使資訊廣泛傳播,更有助於企業保密——此點尤其重要。鑑於專業文件翻譯大多採取外包形式,經手人員眾多,縱使簽署保密協議亦難保萬無一失。其次,機器翻譯亦能有效提升資源有限的中小企業之競爭能力,例如WIPO Translate,其開發目的之一便是為協助企業以較低成本進行專利管理。

儘管如此,想要實現成熟的機器翻譯仍有不少阻礙。除市場需求影響外,開發機器翻譯首先必須建置「充足」且「準確」之資料庫:縱使同屬專業文件,其制式化及公開程度可能大不相同,例如契約與公開說明書,前者內容變化萬千且大多屬於機密文件,不容易累積足夠的資料量;再者,務必確保所取得資料係經專業人士翻譯或審閱的正確譯本,否則無法訓練機器產出優質翻譯成果。

除此以外,AI能否具備人類解讀或理解專業文件之能力,也是一大難題。以英文法律文件為例,其文法結構及表述方式不但異於一般英文,且有相當多長句與歧義詞,往往必須利用法律知識從前後文判斷,才能正確斷句並釐清文件旨意。

綜上所述,為提升翻譯精準度,針對不同專業領域(例如法律、金融、資訊、醫學等領域及其子領域)開發專用型機器翻譯工具,會是較符合成本效益的作法。不過,AI仍不太可能完全取代專業文件譯師,只是譯師在未來會逐漸從主導者轉為審核者或監督者,當然,薪酬也會因其角色轉換而產生變化。

 

備註:

 

【本文僅反映專家作者意見,不代表本報立場。】

作者: 許慈真
學歷: 輔仁大學外語學院財經法律翻譯學程
輔仁大學法律學系博士
輔仁大學財經法律學系碩士
輔仁大學法律學系學士
專長: 智慧財產權、法律翻譯

 

Facebook 在北美智權報粉絲團上追踪我們       

 





感謝您閱讀「北美智權報」,歡迎分享智權報連結。如果您對北美智權電子報內容有任何建議或欲獲得授權,請洽:Editorial@naipo.com
本電子報所登載之文章皆受著作權保護,未經本公司授權, 請勿轉載!
© 北美智權股份有限公司 & 北美聯合專利商標事務所 版權所有     234新北市永和區福和路389號五樓 TEL:+886-2-8923-7350