035期
2019 年 3 月 27 日
  北美智权官网 历期电子报   电子报订阅管理  
 
AI加持后,翻译行业将呈现何种新样貌?
许慈真/(台湾)辅仁大学法律学系博士

近年来人工智能(AI)发展颇受关注,有预测十至十五年后AI可望取代许多蓝领与白领的从业人力,尤其是重复性高、要求规律一致的工作。接触过Google翻译、Bing翻译等服务的使用者或许疑惑,AI应用是否会大幅减少翻译人力需求,全面改写翻译行业的样貌?

当然,不同翻译类型会有不同结果,这也与其内容「偏向创造性或重复性」密切相关,但是否意味着,重复性相对较高的专业文件翻译未来可全由AI代劳?恐怕亦无法一概而论。本文以下试举出几项事例,简介专业文件笔译领域的AI应用现况,并对机器翻译(Machine Translation, MT)发展提出一些看法。


图片来源 : shutterstock、达志影像

人类与机器协作

现今的专业文件译师几乎都必须利用「计算机辅助翻译」(Computer Assistant Translation, CAT)工具进行作业,而CAT主要是透过AI搜寻及比对技术,从翻译记忆库(translation memory)中找出不同相似度的翻译文句,译师可决定采纳或加以编辑,其翻译成果会存入数据库供下次参考。其实不只是专业文件翻译,若干书籍翻译也能运用CAT提高翻译效益。

利用CAT协作之最大优点在于「一致性」,尤其是法律文件,不仅应在单一文件使用相同词汇指涉同一概念或事件,也必须在一系列不同文件间保持一致性。其次,CAT能自动比对数字、日期或格式等细节,避免人为疏漏;如遇内容完全或绝大部分重复时,亦可自动覆盖译文或由译师稍加修改,以节省作业时间。CAT甚至允许导入机器翻译结果,例如Google翻译、Bing翻译等,为译师提供更多参考数据。简言之,目前专业文件笔译的主导者仍是译师,CAT、记忆数据库及术语库(termbase)则是其作业时的得力助手。

通过人类与机器协作,能够加速处理数量庞大的文件并保持一致性,不论是日本法务省的「日本法令英译数据库系统」(Japanese Law Translation Database System, JLT)[1]或是香港律政司的「电子版香港法例」[2],均属于此类模式运用。

以JLT为例,其法令译文系由人工翻译后经机器利用数据库校正用语,最终交由专业人士审阅定案。为此,法务省发展出《标准法律用语对译字典》(Japanese-English Standard Legal Term Dictionary, SLTD),藉以大幅提升翻译精准度,同时保持法令名称、构成格式、陈述方式、用语等形式的一致性;举例来说,「相手方」(中文译为他方或对造)一语在该双语字典即针对不同场合译成不同英文词汇,譬如一般情形译为「the other party/other parties」或「opposite party」,契约上译为「counterparty」,在司法程序上译为「opponent」或「adverse party」。SLTD可说是此计划最具价值之产出,不但可嵌入翻译工具协助维持译文一致性,也为往后机器翻译发展提供宝贵的训练数据。

欧盟eTranslation机器翻译

为便利欧盟各国机构及公共部门之信息交流,欧盟执委会翻译总署(Directorate-General for Translation, DGT)以开放原始码统计机器翻译(Statistical Machine Translation, SMT)系统MOSES为基础,开发专属的机器翻译工具「MT@EU」并于2013年启用。MT@EU主要以庞大的Euramis翻译记忆库作为训练素材,其中内含来自24个官方语言的10亿多个译句,由数十年来欧盟机构译师的工作成果累积而成,因此MT@EU相当熟稔欧盟政策及法律用语,特别适合翻译欧盟相关事务文件。自2017年11月起,「eTranslation」[3]取代MT@EU,并且逐渐导入神经机器翻译(neural machine translation, NMT)技术。

eTranslation的翻译服务不仅免费(至少2020年为止),同时具备高度保密性,但服务对象原则上限于欧盟会员国、冰岛及挪威之公共管理部门以及特定教学人员。尽管如此,欧盟智慧财产局(EUIPO)已透过eTranslation释出部分上诉委员会、普通法院及欧洲法院裁判的翻译文本以供参考,使用者可就翻译成果决定是否进一步交由人工翻译[4]

WIPO Translate机器翻译

世界知识产权组织(WIPO)多年来发展的机器翻译工具「WIPO Translate」(前身为「TAPTA」)目前可在页面上提供专利名称、摘要、说明、请求项等专利文件内容实时翻译[5],包括专利合作条约(PCT)10种官方语言的查询与互译服务;此外,也可自行复制文件中任何内容贴上WIPO Translate网页[6],选择特定语言对(language pairs)及技术领域进行机器翻译,其使用方式与Google翻译雷同,使用者亦能编辑翻译结果,等同向WIPO提供翻译反馈。

WIPO Translate是利用神经机器翻译技术,提供贴近一般语言用法的翻译成果。神经机器翻译基于庞大的神经网络模型,让机器学习先前译句,相较于「以短语为基础」之统计方法,所产出的语序更加自然,尤其有助于改善远程语言对(distant language pair)如中英对译,但即使是较近的语言对如英法对译,也同样受惠。值得注意的是,WIPO Translate单纯利用大量公开的专利文件训练,因此机器能学得更快且产出更优质成果,再加上「领域辨识技术」(domain-aware-technique),机器翻译时能考虑到不同技术领域差异(目前有来自国际专利分类(IPC)的32个技术领域)而调整翻译成果,这正是为何利用WIPO Translate翻译专利文件会比Google翻译(于2016年亦导入神经机器翻译技术)更加卓越的原因。但也正因为WIPO Translate仅专注于翻译专利文件,适用在其他领域/类型文件或日常言谈可能不尽理想。

虽然WIPO声明此翻译系统仅供参考,无法保证译文的正确性与质量,但WIPO Translate未来仍会免费提供予联合国机构及其他国际组织使用,以因应大量翻译需求并降低成本。而韩国与WIPO于2018年5月签署谅解备忘录(memorandum of understanding),在其专利申请及审查程序中导入WIPO Translate,成为首个采用WIPO Translate的会员国。

机器翻译带来之帮助及其发展困难

诚如前述,机器翻译不仅能降低企业与译师的成本,使信息广泛传播,更有助于企业保密——此点尤其重要。鉴于专业文件翻译大多采取外包形式,经手人员众多,纵使签署保密协议亦难保万无一失。其次,机器翻译亦能有效提升资源有限的中小企业之竞争能力,例如WIPO Translate,其开发目的之一便是为协助企业以较低成本进行专利管理。

尽管如此,想要实现成熟的机器翻译仍有不少阻碍。除市场需求影响外,开发机器翻译首先必须建置「充足」且「准确」之数据库:纵使同属专业文件,其制式化及公开程度可能大不相同,例如契约与公开说明书,前者内容变化万千且大多属于机密文件,不容易累积足够的数据量;再者,务必确保所取得资料系经专业人士翻译或审阅的正确译本,否则无法训练机器产出优质翻译成果。

除此以外,AI能否具备人类解读或理解专业文件之能力,也是一大难题。以英文法律文件为例,其文法结构及表述方式不但异于一般英文,且有相当多长句与歧义词,往往必须利用法律知识从前后文判断,才能正确断句并厘清文件旨意。

综上所述,为提升翻译精准度,针对不同专业领域(例如法律、金融、信息、医学等领域及其子领域)开发专用型机器翻译工具,会是较符合成本效益的作法。不过,AI仍不太可能完全取代专业文件译师,只是译师在未来会逐渐从主导者转为审核者或监督者,当然,薪酬也会因其角色转换而产生变化。

 

備註:

 

备注:

 

好消息~北美智权报有微信公众号了!

《北美智权报》内容涵盖世界各国的知识产权新闻、重要的侵权诉讼案例分析、法规解析,以及产业与技术新知等等。

立即关注北美智权微信公众号→ NAIP_IPServices

~欢迎读者分享与转发~


【本文仅反映专家作者意见,不代表本报立场。】

作者: 许慈真
学历: (台湾)辅仁大学外语学院财经法律翻译学程
(台湾)辅仁大学法律学系博士
(台湾)辅仁大学财经法律学系硕士
(台湾)辅仁大学法律学系学士
专长: 智慧财产权、法律翻译

 


 





感谢您阅读「北美智权报」,欢迎分享智权报连结。如果您对北美智权电子报内容有任何建议或欲获得授权,请洽:Editorial@naipo.com
本电子报所登载之文章皆受著作权保护,未经本公司授权, 请勿转载!
© 北美智权股份有限公司 & 北美联合专利商标事务所 版权所有 234 台湾地区新北市永和区福和路389号五楼 TEL:+886-2-8923-7350