北美智權股份有限公司

法律的其中一項功能在於建立人類社會的秩序，而人類社會的發展是個緩慢的進程，因此，各種法律的演變也隨之緩慢。但不論是在世界各國，專利法在法律體系中都具有獨特的地位，因為專利法所管轄的是人類社會中變遷速度最為驚人的科技領域。

去年 (2019) 是全球專利法制躁動不安的一年，很大一部分源自於人工智慧 (AI) 技術的突破，其特色是能夠取代人類的學習能力、判斷能力，其應用不僅造成工業4.0 (電腦化、數位化和智慧化)，而且這項突破很快地就反映在專利申請案件上。首先遭遇這波衝擊的便是全球技術創新的領頭羊 — 美國，長久以來，取代人力的技術方案是否成為專利法的適格保護標的一直困擾著USPTO，美國的各級法院也在這條適格性的崎嶇道路上不斷地修正自己方向，兩方面的共同目標皆是試圖尋求對尖端科技的合理保護。

USPTO終於在去年送出兩分大禮，The 2019 Revised Patent Subject Matter Eligibility Guidance (2019 PEG)以及October 2019 Patent Eligibility Guidance Update (PEG Oct update)，然而老練的從業人員會發現，其間充滿了「不適格類型的範例」，適格標的的範例相對稀缺。USPTO似乎試圖補救如此不均衡的狀況，就在去年12月USPTO將與人工智慧相關的Ex parte Hannun[1] (本案發布之初名為Ex parte Linden，疑為USPTO誤植，已於2020/1/14 USPTO網站上修改)一案指定為informative decision[2]。

該案申請人為百度的美國分公司，該申請案的請求項11~20遭審查委員以不適格且不具進步性為由核駁。本文僅聚焦於兩造在適格性上交鋒，以下為最具代表性的請求項11：

normalizing the input audio to make a total power of the input audio consistent with a set of training samples used to train a trained neural network model;

generating a jitter set of audio files from the normalized input audio by translating the normalized input audio by one or more time values;

for each audio file from the jitter set of audio files, which includes the normalized input audio:

inputting the audio file along with a context of spectrogram frames into a trained neural network;

obtaining predicted character probabilities outputs from the trained neural network; and

decoding a transcription of the input audio using the predicted character probabilities outputs from the trained neural network constrained by a language model that interprets a string of characters from the predicted character probabilities outputs as a word or words.

在Alice測試的第一步中，審查委員認為其所主張的發明指向使用數學方程式，即predicted character probabilities (字符的預期機率)，對輸入的語音進行解碼而轉錄成文字或文字數據，並認為因為使用了字符的預期機率，導致該發明所涉及的抽象概念與Benson案類似。同時，審查委員將該發明總結為三個步驟：(1) 將輸入的語音數據標準化 (即操作數據)；(2) 基於每個語音檔案產生成頻譜圖幀 (基於在先數據集生成數據集)；(3) 使用數學公式將語音數據轉換為文字數據 (解碼)。據此審查委員還認為，既然聆聽語音檔案，並將其轉錄為文字，可以憑藉人類心智而完成，因此所主張的發明還屬於「組織人類行為的特定方法」範疇。在Alice測試的第二步中，審查委員指出所主張的發明只是利用數學關係或方程式，將語音數據轉換為文字數據，並未顯著超越抽象概念 (…the claims do not amount to significantly more than the abstract idea.)，綜上，該請求項不具備適格性。

上訴人認為審查委員忽略被訓練過的類神經網絡及其相關元件，將其看作是一般上位化的電腦，導致過於簡化該發明；上訴人同時爭執，該發明是解決自動化語音辨識技術中特定問題的特定實施方式，並指向了電腦能力的具體進步 (讀者諸君可於此時回想一下最高法院為Diehr案護航時的說法)。關於Alice測試的第二步，上訴人則提出以下爭執：該發明涉及科技或技術領域中的進步 (通過語音識別作動的電腦功能，可以有各種不同的應用)；該發明涉及電腦本身的功能進步 (使用者可以透過較簡易的操作介面使用複雜的電腦系統)；涉及特定的電腦或系統；並加入了傳統、例行、眾所周知之外，具體的限制條件 (利用特定、非一般的步驟取得字符的預期機率，而且使用被訓練過的類神經網絡所產出的字符預期機率對輸入語音的進行轉錄解碼，該預測神經網絡的輸出受語言模型的限制，進而將輸出中的字符串解釋為一個或多個單詞)。

在本案中，美國專利審理暨訴願委員會 (PTAB) 注意到在2018發布的備忘錄 (Memorandum - Revising 101 Eligibility Procedure in view of Berkheimer v. HP, Inc.) 中，心智活動與組織人類行為的方法並列為抽象概念下不同的範疇，因此PTAB並不同意審查委員將請求項歸類為組織人類行為的方法或心智活動的見解。

PTAB也注意到，雖然將語音轉錄為文字，一般說來可由人類完成，但請求項內容所記載的具體實施方式：將輸入檔案標準化、產生語音檔案的抖動集合 (jitter set)、產生頻譜圖幀集合、以及從被訓練過的類神經網絡獲得字符預期機率並以之對輸入語音的進行轉錄解碼，這些步驟卻是不可能透過人類心智完成的。而且，由於請求項並未引述基礎經濟理論或實踐、商業或法律互動或管理個人行為或關係或人與人之間的互動，因此請求項也不涉及組織人類行為的方法。

雖然請求項確實記載了利用字符的預期機率決定語音輸入的轉錄，但請求項並未記載演算法或數學方程式本身，因此不構成引述數學概念。即便是將其當作是引述數學概念，根據上訴人的陳述「該發明包含了特別的特徵，專門設計用來達成技術結果的進步，並提供了該技術領域的進展」，在現行判斷流程2A的判斷二標準下，請求項仍具適格性，因為請求項的步驟可以被整合到實際應用中。PTAB也同意上訴人的見解在現行判斷流程2B下，審查委員並未提供足夠的事實來支持其「沒有任何額外元件導致 (請求項) 顯著超越抽象概念」的判斷。根據上述理由，PTAB撤銷了審查委員的適格性核駁。

首先，應該是由於PTAB這份裁決早於PEG Oct update的關係，因此裁決內容與最新實務見解有小小的出入。PEG Oct update指出抽象概念下的各種類型或是子類型彼此並非互斥，一個請求項的確是有可能同時落入抽象概念中的不同類型或子類型[3]。PTAB針對該請求項並未涉及組織人類行為的方法的論述的確是正確的，但「PTAB根據備忘錄中，心智活動與組織人類行為的方法並列為抽象概念下不同的範疇，因此PTAB並不同意審查委員將請求項歸類為組織人類行為的方法或心智活動的處分」的這個說法卻與最新實務不同。但這並不影響這個案例的參考價值。

涉及AI領域方法項由於先天上的限制，撰寫上極容易落入PEG Oct update列舉的抽象概念範疇，例如normalizing、generating、obtaining、decoding…等用遣詞，從業人員基本上可以絕了螺螄殼裡做道場的念頭，利用不同的用語 (wording) 脫逸出step 2A判斷一，可說是難上加難。然而此一案例演示了如何提出step 2A判斷二、step 2B方面答辯的方向，以及PTAB所採取的觀點，對從業人員在AI領域案件的撰寫與答辯上則極具參考價值。

https://www.uspto.gov/sites/default/files/documents/Ex%20parte%20Hannun%202018-003323.pdf
本案審理適用2019修正版審查指南，裁決日期2019/4/1，2019/12/11被指定為informative decision。
informative decision的作用在於為美國專利審理暨訴願委員會（PTAB）在一些會重複出現的議題上提供規範。
PEG Oct update, s. II, para. 2, l. 5.