根据MarketWatch最新分析,机器翻译(MT)市场价值在2019年约为5.5亿美元,预计2025年将窜升至10.4亿美元。这一增长趋势反映出机器翻译市场呈现强劲需求,而其背后原因众多,包括计算机辅助工具使用普及、经济活动国际化、在地化需求增加等,大幅提高机器翻译的重要性和产业的倚赖程度。本文试从几国专利局的举措,简介机器翻译在专利文件及信息共享上的应用概况。
图片来源 : shutterstock、达志影像
机器翻译大致上可分为通用型与专业型,前者如Google Translate,后者则如WIPO Translate翻译工具。发展专业型机器翻译的考虑因素通常包括,有大量快速交换信息的需求、文件制式化程度较高或重复性较高、翻译成本昂贵(可能因为人才难寻或技术门坎较高)、有高度机密性需求等。不难想见,医疗、信息、军事、金融、法律等领域都会是发展重镇,当然,汇聚技术和法律的专利文件也是其中之一。
机器翻译是了解信息的一大利器
根据WIPO的2018年报告显示[1],现有不少智能局已在工作流程上导入AI技术,包括自动分类、检索、审查与形式检查、服务台、机器翻译等,而机器翻译俨然成为了解信息的重要途径(主要是专利领域),例如:
- 加拿大采用结合Google Translate/Patent/Scholar的G Suite服务(现名为Google Workspace),取得各国专利局提供的完整专利文件、引证数据与相关学术论述,以及其机器译本。
- 瑞典审查员使用EPO透过Epoque Net检索系统与Espacenet提供的Patent Translate(介绍如后)。
- 英国要求审查员学习使用Patent Translate,但必要时,也可与其他公开机器翻译工具并同使用。
- EUIPO审查员使用名为Babelscape的多语种商用自然语言工具。
- WIPO各成员国可提出申请,免费使用PATENTSCOPE数据库提供的WIPO Translate。
显然,机器翻译的应用不止于专利文件翻译,还包括检索作业,甚至可协助审查员查阅前案技术。除此以外,机器翻译也是各国智能局信息合作、快速交换专利讯息的重要功臣。全球专利审查高速公路(PPH)原则中提及[2],参与局得在实际可行范围内接受实体审查过程数据、裁决通知或可准请求项的机器译本,但若审查员认为无法依据该译本质量判断是否接受PPH申请时,得要求提交人工译本。
以下再以欧洲、美国与日本发展为例,略述一二。
欧洲:Patent Translate与单一专利
欧洲专利局(EPO)可说是世界上最为积极运用各种AI技术与机器学习的专利局。其与Google合作开发并于2012年2月推出Patent Translation,又随着WIPO Translation在2016年导入神经机器翻译(NMT)的脚步,于2017年将Patent Translation翻译引擎转换成NMT。该系统的训练素材来自EPO向Google提供的大量专利文件人工译本,可针对特定技术领域,处理复杂且具高度技术性的专利词汇、措辞与格式。
Patent Translate不仅开放公众使用,也是经过培训审查员的重要工具之一。目前提供英、法与德语及其他欧洲专利公约(EPC)成员国的27种官方语言,以及英与中、日、韩、俄语的自动化翻译。
然而,EPO并不以拥有Patent Translate为足,已打算开发专属的机器翻译工具。而Google在这次与EPO的合作当中,不但跨足B2B,实际上也大幅提升Google Translate的技术影响力。
EPO对于机器译本颇具信心,此点从审查指南可窥见一二[3]:在第G-IV 4.1条提及,为克服语言障碍,审查员可适度仰赖机器译本,了解不熟悉的非官方语言文件内容。该译本若是以熟悉语言表达出文件旨意,不得仅以单纯的文法或句法错误(且不影响理解)为由拒绝接受该译本。当事人若是反对使用机器译文,不得仅是声称其不足以信赖,而是应负举证责任,例如提出改善后的译本证明原先机器译本有严重缺陷。
EPO发展及运用机器翻译的野心远不止于此。EPO曾在访谈中表示[4],希望能尽快实施单一专利(unitary patent)[5],届时将可透过EPO一次申请而赋予多国保护;尽管EPO将以英、法与德语作为官方语言,但专利权人在过渡期间(最长12年)届满后取得单一专利时,不必提交人工译本,唯有实际发生争议且应法院或侵权被告要求,才需要以相关语言提交完整的人工译本。
需要补充说明的是,或许有读者了解欧盟智能局(EUIPO)裁决数据所使用的是另一套机器翻译工具,亦即欧盟自行开发的eTranslation。姑不论EPO与EUIPO所处的架构体系不同,即使是在相同领域(例如知识产权),但选择的训练素材范围也会随目标需求而不同,例如eTranslation是以欧盟政策、法规及裁决文书为主,此类文件即与Patent Translate应用的专利文件有相当差异。
美国:Dossier Access
美国专利商标局(USPTO)、EPO、JPO、中国国家知识产权局(CNIPA)与韩国知识产权局(KIPO)此全球五大专利局(IP5)于2011年共同推动的全球档案计划(Global Dossier Initiative),可说是各国在专利信息合作方面的一大成就。该计划旨在透过单一入口网站,提供各国专利主管机关申请过程的完整文件,以USPTO为例,即于2015年11月推出“Dossier Access”服务,当然同时也提供相关文件的自动化翻译。
令人好奇的是,Dossier Access是采用何种翻译引擎?USPTO虽未明白表示,但根据产业消息[6],在IP5全球档案服务背后支持的极可能是同一套翻译引擎,而且应该就是EPO与Google合作开发的Patent Translate。
日本:AIPN与J-PlatPat
目前担任全球PPH秘书处的日本特许厅(JPO),对于利用机器翻译加强各国交流彼此专利申请相关信息,同样寄与厚望。JPO早在2004年10月即建立进阶工业财产网络系统(AIPN),向其他智慧局提供专利档卷、审查文件及申请案或专利相关法律状态信息的英文机器译本。根据2018年报告[7],已有69个海外智慧局可直接透过AIPN取得信息,JPO也透过前述的全球档案计划,将档案文件交换至IP5的各单一入口网站。参与WIPO档案共享系统WIPO-CASE的智能局,也可由此取得该网站提供的信息。除IP5外,已有32个国家或组织可使用WIPO-CASE的链接共享功能[8]。
此外,JPO于2019年5月发布新闻,表示已优化日本专利信息平台(J-PlatPat)的机器翻译质量,该平台主要是提供公报和审查数据的英文译本。经本次更新后,J-PlatPat的翻译引擎将从基于规则的机器翻译(RBMT)变更为以NMT为主,而且不仅是日英系统,中日与韩日的文献翻译系统也一并更新。
J-PlatPat采用的翻译引擎是结合国立研究开发法人情报通信研究机构(NICT)现有技术与Toshiba Digital Solutions Corporation的自然语言处理技术共同开发而成。Toshiba在访谈中大方分享开发经验[9],尽管NMT是目前最受青睐的引擎,但其认为RBMT、统计机器翻译(SMT)与NMT这三者各有所长:
- RBMT是以字典、文法和词序规则作为基础数据,翻译速度快,但产出的语句不够自然。
- SMT是以从大量平行语料得出的统计信息为基础,翻译质量高于RBMT且容易提高BLEU值(分数越高,代表机器翻译表现越好、越接近人工翻译),但语句仍不够自然。
- NMT是利用深度学习,语句相对自然且翻译质量较高,但机器学习需要花费相当时间;再者,SMT与NMT的运算时间较长,在实时翻译上较具挑战性。
在综合提升翻译质量、减少误译、提高翻译速度等多方考虑下,Toshiba决定采用混合型翻译引擎,亦即以NMT为主,搭配RBMT与SMT两者。
机器翻译的发展值得期待
从前述事例观察,可得出以下几点启示:
- 机器翻译的准确度与效率有望继续提升,在专利信息方面的应用可能更为广泛。Slator报告大胆预言,至2028年,将会有高质量的机器翻译提供充足的专利翻译服务。
- 除自行开发系统外,各国智能局可能更倾向直接采用商用机器翻译或与之合作开发。以现阶段而论,Google Translate显然占有极大优势。
- 诚如EPO所言,机器翻译在现阶段是作为协助了解专利文件的信息工具,而非提供经严格审视的译本(例如「日本法令英译数据库系统」或「电子版香港法例」)。因此,在做出法律、商业或相关决策时,仍是需要人工翻译。
- 除准确度与速度外,机器翻译的应用仍有需要留意或克服的问题,例如隐私权保护、客制化需求等。
至于台湾(TIPO),至今尚未利用机器翻译提供专利或商标信息的各类服务。台湾专利师公会也曾在2020年智财白皮书中提及相关建议;为强化台湾的智慧财产策略发展,或许是时候考虑如何借重AI技术,进一步提升竞争力。
备注:
- Meeting of Intellectual Property Offices (IPOs) on ICT Strategies and Artificial Intelligence (AI) for IP Administration (2018/05/29), WIPO/IP/ITAI/GE/18/2 REV.
- Global PPH, https://www.jpo.go.jp/e/toppage/pph-portal/globalpph.html
- 4.1 Machine translations, https://www.epo.org/law-practice/legal-texts/html/guidelines/e/g_iv_4_1.htm
- Eden Estopace, Inside the EPO’s Machine-Powered Mission to Unlock Europe’s Multilingual Patents, https://slator.com/technology/inside-epo-machine-powered-mission-to-unlock-europe-multilingual-patents/
相關法規請參考COUNCIL REGULATION (EU) No 1260/2012 of 17 December 2012。
- 单一专利必须待单一专利法院协议(UPCA)生效后方能实施,该协议生效必须经25个参与国中的13个国家批准。最关键的德国,其联邦议院虽于2020年12月18日批准UPCA法案,但随后再度陷入违宪争议,何时能批准仍是未知数。
- Marion Marking, Lawyers Excited by New US Patent Portal’s Machine Translation, https://slator.com/technology/lawyers-excited-by-new-us-patent-portals-machine-translation
- Japan Patent Office Online Services for Cooperating Partners and Public, https://www.wipo.int/edocs/mdocs/africa/en/wipo_ip_it_hre_18/wipo_ip_it_hre_18_t_1.pdf
- WIPO CASE - Centralized Access to Search and Examination, https://www.wipo.int/case/en/
- IT for IP: Japan Patent Office’s Advanced Machine Translation System Supports Companies in Promoting Intellectual Property Strategy, https://www.toshiba-clip.com/en/detail/p=410
好消息~北美智权报有微信公众号了!
《北美智权报》内容涵盖世界各国的知识产权新闻、重要的侵权诉讼案例分析、法规解析,以及产业与技术新知等等。
立即关注北美智权微信公众号→ NAIP_IPServices
~欢迎读者分享与转发~ |
|
|
【本文只反映专家作者意见,不代表本报立场。】
作者: |
许慈真 |
学历: |
(台湾)辅仁大学外语学院财经法律翻译学程
(台湾)辅仁大学法律学系博士
(台湾)辅仁大学财经法律学系硕士
(台湾)辅仁大学法律学系学士 |
专长: |
智慧财产权、法律翻译 |
|
|
|