根據MarketWatch最新分析,機器翻譯(MT)市場價值在2019年約為5.5億美元,預計2025年將竄升至10.4億美元。這一增長趨勢反映出機器翻譯市場呈現強勁需求,而其背後原因眾多,包括電腦輔助工具使用普及、經濟活動國際化、在地化需求增加等,大幅提高機器翻譯的重要性和產業的倚賴程度。本文試從幾國專利局的舉措,簡介機器翻譯在專利文件及資訊共享上的應用概況。
圖片來源 : shutterstock、達志影像
機器翻譯大致上可分為通用型與專業型,前者如Google Translate,後者則如WIPO Translate翻譯工具。發展專業型機器翻譯的考量因素通常包括,有大量快速交換資訊的需求、文件制式化程度較高或重複性較高、翻譯成本昂貴(可能因為人才難尋或技術門檻較高)、有高度機密性需求等。不難想見,醫療、資訊、軍事、金融、法律等領域都會是發展重鎮,當然,匯聚技術和法律的專利文件也是其中之一。
機器翻譯是瞭解資訊的一大利器
根據WIPO的2018年報告顯示[1] ,現有不少智慧局已在工作流程上導入AI技術,包括自動分類、檢索、審查與形式檢查、服務台、機器翻譯等,而機器翻譯儼然成為瞭解資訊的重要途徑(主要是專利領域),例如:
加拿大採用結合Google Translate/Patent/Scholar的G Suite服務(現名為Google Workspace),取得各國專利局提供的完整專利文件、引證資料與相關學術論述,以及其機器譯本。
瑞典審查員使用EPO透過Epoque Net檢索系統與Espacenet提供的Patent Translate(介紹如後)。
英國要求審查員學習使用Patent Translate,但必要時,也可與其他公開機器翻譯工具併同使用。
EUIPO審查員使用名為Babelscape的多語種商用自然語言工具。
WIPO各成員國可提出申請,免費使用PATENTSCOPE資料庫提供的WIPO Translate。
顯然,機器翻譯的應用不止於專利文件翻譯,還包括檢索作業,甚至可協助審查員查閱前案技術。除此以外,機器翻譯也是各國智慧局資訊合作、快速交換專利訊息的重要功臣。全球專利審查高速公路(PPH)原則中提及[2] ,參與局得在實際可行範圍內接受實體審查過程資料、裁決通知或可准請求項的機器譯本,但若審查員認為無法依據該譯本品質判斷是否接受PPH申請時,得要求提交人工譯本。
以下再以歐洲、美國與日本發展為例,略述一二。
歐洲:Patent Translate與單一專利
歐洲專利局(EPO)可說是世界上最為積極運用各種AI技術與機器學習的智慧局。其與Google合作開發並於2012年2月推出Patent Translation,又隨著WIPO Translation在2016年導入神經機器翻譯(NMT)的腳步,於2017年將Patent Translation翻譯引擎轉換成NMT。該系統的訓練素材來自EPO向Google提供的大量專利文件人工譯本,可針對特定技術領域,處理複雜且具高度技術性的專利詞彙、措辭與格式。
Patent Translate不僅開放公眾使用,也是經過培訓審查員的重要工具之一。目前提供英、法與德語及其他歐洲專利公約(EPC)成員國的27種官方語言,以及英與中、日、韓、俄語的自動化翻譯。
然而,EPO並不以擁有Patent Translate為足,已打算開發專屬的機器翻譯工具。而Google在這次與EPO的合作當中,不但跨足B2B,實際上也大幅提升Google Translate的技術影響力。
EPO對於機器譯本頗具信心,此點從審查指南可窺見一二[3] :在第G-IV 4.1條提及,為克服語言障礙,審查員可適度仰賴機器譯本,瞭解不熟悉的非官方語言文件內容 。該譯本若是以熟悉語言表達出文件旨意,不得僅以單純的文法或句法錯誤(且不影響理解)為由拒絕接受該譯本。當事人若是反對使用機器譯文,不得僅是聲稱其不足以信賴,而是應負舉證責任 ,例如提出改善後的譯本證明原先機器譯本有嚴重缺陷。
EPO發展及運用機器翻譯的野心遠不止於此。EPO曾在訪談中表示[4] ,希望能盡快實施單一專利(unitary patent)[5] ,屆時將可透過EPO一次申請而賦予多國保護;儘管EPO將以英、法與德語作為官方語言,但專利權人在過渡期間(最長12年)屆滿後取得單一專利時,不必提交人工譯本,唯有實際發生爭議且應法院或侵權被告要求,才需要以相關語言提交完整的人工譯本。
需要補充說明的是,或許有讀者了解歐盟智慧局(EUIPO)裁決資料所使用的是另一套機器翻譯工具,亦即歐盟自行開發的eTranslation。姑不論EPO與EUIPO所處的架構體系不同,即使是在相同領域(例如智慧財產權),但選擇的訓練素材範圍也會隨目標需求而不同,例如eTranslation是以歐盟政策、法規及裁決文書為主,此類文件即與Patent Translate應用的專利文件有相當差異。
美國:Dossier Access
美國專利商標局(USPTO)、EPO、JPO、中國國家知識產權局(CNIPA)與韓國智慧局(KIPO)此全球五大專利局(IP5)於2011年共同推動的全球檔案計畫(Global Dossier Initiative),可說是各國在專利資訊合作方面的一大成就。該計畫旨在透過單一入口網站,提供各國專利主管機關申請過程的完整文件,以USPTO為例,即於2015年11月推出“Dossier Access”服務,當然同時也提供相關文件的自動化翻譯。
令人好奇的是,Dossier Access是採用何種翻譯引擎?USPTO雖未明白表示,但根據產業消息[6] ,在IP5全球檔案服務背後支援的極可能是同一套翻譯引擎,而且應該就是EPO與Google合作開發的Patent Translate。
日本:AIPN與J-PlatPat
目前擔任全球PPH秘書處的日本特許廳(JPO),對於利用機器翻譯加強各國交流彼此專利申請相關資訊,同樣寄與厚望。JPO早在2004年10月即建立進階工業財產網路系統(AIPN),向其他智慧局提供專利檔卷、審查文件及申請案或專利相關法律狀態資訊的英文機器譯本。根據2018年報告[7] ,已有69個海外智慧局可直接透過AIPN取得資訊,JPO也透過前述的全球檔案計畫,將檔案文件交換至IP5的各單一入口網站。參與WIPO檔案共享系統WIPO-CASE的智慧局,也可由此取得該網站提供的資訊。除IP5外,已有32個國家或組織可使用WIPO-CASE的連結共享功能[8] 。
此外,JPO於2019年5月發布新聞,表示已優化日本專利資訊平台(J-PlatPat)的機器翻譯品質,該平台主要是提供公報和審查資料的英文譯本。經本次更新後,J-PlatPat的翻譯引擎將從基於規則的機器翻譯(RBMT)變更為以NMT為主,而且不僅是日英系統,中日與韓日的文獻翻譯系統也一併更新。
J-PlatPat採用的翻譯引擎是結合國立研究開發法人情報通信研究機構(NICT)現有技術與Toshiba Digital Solutions Corporation的自然語言處理技術共同開發而成。Toshiba在訪談中大方分享開發經驗[9] ,儘管NMT是目前最受青睞的引擎,但其認為RBMT、統計機器翻譯(SMT)與NMT這三者各有所長:
RBMT是以字典、文法和詞序規則作為基礎資料,翻譯速度快,但產出的語句不夠自然。
SMT是以從大量平行語料得出的統計資訊為基礎,翻譯品質高於RBMT且容易提高BLEU值(分數越高,代表機器翻譯表現越好、越接近人工翻譯),但語句仍不夠自然。
NMT是利用深度學習,語句相對自然且翻譯品質較高,但機器學習需要花費相當時間;再者,SMT與NMT的運算時間較長,在即時翻譯上較具挑戰性。
在綜合提升翻譯品質、減少誤譯、提高翻譯速度等多方考量下,Toshiba決定採用混合型翻譯引擎,亦即以NMT為主,搭配RBMT與SMT兩者。
機器翻譯的發展值得期待
從前述事例觀察,可得出以下幾點啟示:
機器翻譯的準確度與效率有望繼續提升,在專利資訊方面的應用可能更為廣泛。Slator報告大膽預言,至2028年,將會有高品質的機器翻譯提供充足的專利翻譯服務。
除自行開發系統外,各國智慧局可能更傾向直接採用商用機器翻譯或與之合作開發。以現階段而論,Google Translate顯然占有極大優勢。
誠如EPO所言,機器翻譯在現階段是作為協助瞭解專利文件的資訊工具,而非提供經嚴格審視的譯本(例如「日本法令英譯資料庫系統」或「電子版香港法例」)。因此,在做出法律、商業或相關決策時,仍是需要人工翻譯。
除準確度與速度外,機器翻譯的應用仍有需要留意或克服的問題,例如隱私權保護、客製化需求等。
至於台灣的智慧局(TIPO),至今尚未利用機器翻譯提供專利或商標資訊的各類服務。專利師公會也曾在2020年智財白皮書中提及相關建議;為強化我國的智慧財產策略發展,或許是時候考量如何借重AI技術,進一步提升競爭力。
備註:
Meeting of Intellectual Property Offices (IPOs) on ICT Strategies and Artificial Intelligence (AI) for IP Administration (2018/05/29), WIPO/IP/ITAI/GE/18/2 REV.
Global PPH, https://www.jpo.go.jp/e/toppage/pph-portal/globalpph.html
4.1 Machine translations, https://www.epo.org/law-practice/legal-texts/html/guidelines/e/g_iv_4_1.htm
Eden Estopace, Inside the EPO’s Machine-Powered Mission to Unlock Europe’s Multilingual Patents, https://slator.com/technology/inside-epo-machine-powered-mission-to-unlock-europe-multilingual-patents/
相關法規請參考COUNCIL REGULATION (EU) No 1260/2012 of 17 December 2012。
單一專利必須待單一專利法院協定(UPCA)生效後方能實施,該協定生效必須經25個參與國中的13個國家批准。最關鍵的德國,其聯邦議院雖於2020年12月18日批准UPCA法案,但隨後再度陷入違憲爭議,何時能批准仍是未知數。
Marion Marking, Lawyers Excited by New US Patent Portal’s Machine Translation, https://slator.com/technology/lawyers-excited-by-new-us-patent-portals-machine-translation
Japan Patent Office Online Services for Cooperating Partners and Public, https://www.wipo.int/edocs/mdocs/africa/en/wipo_ip_it_hre_18/wipo_ip_it_hre_18_t_1.pdf
WIPO CASE - Centralized Access to Search and Examination, https://www.wipo.int/case/en/
IT for IP: Japan Patent Office’s Advanced Machine Translation System Supports Companies in Promoting Intellectual Property Strategy, https://www.toshiba-clip.com/en/detail/p=410
【本文僅反映專家作者意見,不代表本報立場。】
作者:
許慈真
學歷:
輔仁大學外語學院財經法律翻譯學程
輔仁大學法律學系博士
輔仁大學財經法律學系碩士
輔仁大學法律學系學士
專長:
智慧財產權、法律翻譯
Facebook
在北美智權報粉絲團上追踪我們
Please enable JavaScript to view the comments.