本次將延續北美智權報275期化學結構之專利檢索—Ⅰ,介紹PATENTSCOPE中以結構式進行檢索的方式,並實際以不同的結構式實測。
圖片來源 : shutterstock、達志影像
上傳結構
依照前次的方式進入化合物檢索後,即可點選「上傳結構」選項,進入其介面。
按下「Upload」後即可由本機選擇想要上傳的結構式。該介面中提示有可接受的檔案格式,其中較不為一般人所知的是 .mol 這個檔案格式,該格式最初為ChemDraw、ISIS/Draw等較為主流的分子結構編輯程式所採用,爾後逐漸變為通用檔案格式。然而,筆者建議在專利工程師的日常工作中盡量採用/轉存為圖形格式,以避免與客戶稿件往來時,或是電子送件時發生不相容的意外;因為一旦發生意外,輕則需要付出額外的心力,重則失去較早的申請日。也因此,本文均以圖形格式進行操作,不對 .mol 格式進行測試。
本次以乙醯胺酚 (檔名:Acetaminophen.jpg) 為例,化學結構圖形上傳後系統即自動開始分析、評估,以乙醯胺酚來說,這個過程大概只有三秒鐘。
之後,頁面便自動跳轉至「結構編輯器」並呈現對input分析、評估的output,此時檢索者應該要檢查output是否正確,如果系統呈現的結構式有誤,則要進行修訂,完成修訂後,按下5. 評估以重新輸入結構式,如果要放棄當前進度,則可以按下2. 重置以回到化合物檢索最初的頁面。
進行到這一步驟時,如果沒有修改結構式的必要,基本上只要按下3. 子結構檢索或4. 精確結構檢索,就可以收取檢索結果了。與以文字進行檢索類似,以結構進行檢索時,4. 精確結構檢索也可以選擇是否搭配1. 檢索骨架;而3. 子結構檢索則是本文後段的重點。
化學結構編輯器
本次實測中,upload各種結構式的圖檔時,在upload乙酸乙酯之後,頁面都回報錯誤訊息,即便變更為不同來源的圖檔。因此,筆者決定自行繪製該結構,其實就是自行繪製前面所提到的output,前述的output若發生辨識錯誤時,也是透過這個編輯器進行修正,故藉此機會簡單介紹PATENTSCOPE所使用的化學結構編輯器。
編輯器上緣工作列有不同功能的按鈕,當游標停留於其上時,會跳出說明功能的標籤,前六個按鈕的功能較為常見,其作動方式類似於小畫家、powerpoint中的等效按鈕。較為特別的是6. 模板、7. 鍵結以及8. 原子這三個按鈕。
按下6. 模板後,工作列第二行會提供各種碳數不同的碳環結構,供檢索者依需求後製。需要注意的是,這些模板已經預設以氫原子補齊每個碳的空軌域,若要以其他原子/基團取代氫原子,在碳原子與其他原子/基團直接繪製鍵結即可,軟體會自動依鍵結數量在該碳原子刪除相同數量的氫原子。
按下7. 鍵結後,工作列第二行會提供一鍵至三鍵的選項、紙面上/下方向的鍵結以及飽和碳鏈,最後一個選項的功能則是在繪製完成後,可以用來量測化學鍵性質。
至於8. 原子則提供切換每次滑鼠左鍵點擊時在編輯器中放置的原子種類。
較為特別的是,這個編輯器配合檢索的目的,還提供了兩種query atom,來替代不確定的原子種類。
繪製乙酸乙酯
首先放置乙酸乙酯的兩個氧原子。選擇氧原子後,在繪製區空白處分別點擊左鍵即可。
點選碳鏈,將游標放置在下方氧原子令其出現紅框時,按下左鍵不放,拉開游標,距離越遠則碳鏈會自動加長。重複操作以繪製兩個乙基。
點選雙鍵,將游標放置在上方氧原子令其出現紅框時,按下左鍵不放,拉動游標至目標碳原子上,至該碳原子上也出現紅框時,鍵結就連接完成了。
點選選擇,拖動各原子,稍微修飾外型。
完成後點選評估,即會自動給出一些該結構的特性,這樣檢索系統就算是接收到檢索者繪製的結構了。
筆者曾經以不同的電腦 (包含硬體及作業系統)、相同的瀏覽器、相同來自維基百科的圖檔進行上傳,一者可順利正確辨識,另一者卻因不明的原因,PATENTSCOPE完全無法判斷,最終是upload類似結構,再透過編輯器修改為欲檢索的結構 ,因此使用編輯器可說是必備技能。
實測子結構檢索
在一切就緒後,即可進行檢索,首先測試的是3. 子結構檢索,然而其結果呈現方式有些與眾不同,需要特別說明。
首先與以文字進行精確結構檢索不同,結果頁面並不會告訴檢索者全部檢索到多少筆公開/公告案,而是顯示檢索到多少結構。
當游標停留在一化學結構圖形上時,該圖形外框會轉變上圖中左側的格式,點選後會變成上圖中右側的格式,代表該格式以被選定,按下頁面右下方的檢索,即可得到與該結構有關的公開/公告案。
需要注意的是,上圖中左側結構上方有個筆記本的圖形,點選後該結構將被代入結構編輯器,在編輯器中可對該結構改動後進行新一輪檢索。
另一個重點是,子結構檢索的化學結構圖形結果是以分段的方式呈現,圖中可以看到這一階段共呈現了1,945筆結果,共82頁,而這7筆結果佔全部結果的29%,而且這個階段性結果會隨著當前網路傳輸能力而略有浮動。
跳到這個階段的最後一頁,按下顯示更多,即可進入第二階段的資訊。
可進入第二階段後即可看到,PATENTSCOPE已經呈現共3,618筆結果,佔全部結果的62%。
連續進行同樣的操作直到百分比數值消失,此時呈現的才是這是化學結構圖形結果全部的數量,共6,017筆。
由於子結構檢索直接呈現檢索結果的圖形,可以看出來這個檢索模式下採用的方法似乎與文字文模式檢索不同,確實以關鍵字化合物的骨架去代入 (fit in) 資料庫中各結構的骨架,若可以帶入較大化合物之一部分 ,則呈現該筆結果。
子結構檢索實測結果
針對子結構檢索,本次依然以乙酸乙酯、乙醯胺酚以及阿托品進行測試。下表之檢索結果均以化學結構圖形筆數記載。
〈表一〉※ 檢索日期:2020/12/8
化合物 |
乙酸乙酯 |
乙醯胺酚 |
阿托品 |
未勾選檢索骨架 |
1,555,210 |
6,017 |
17 |
勾選檢索骨架 |
1,555,210 |
6,017 |
17 |
以圖形進行精確結構檢索實測結果
以圖形進行精確結構檢索時,檢索結果呈現的方式與以文字進行精確結構檢索時相同,均以公開/公告案數量顯示。下表之檢索結果均以結果頁面數記載 (筆數 ≒ 頁面數 x 10)。
〈表二〉 以圖形進行精確結構檢索 (檢索日期:2020/12/8)
化合物 |
乙酸乙酯 |
乙醯胺酚 |
阿托品 |
未勾選檢索骨架 |
4,494 |
8,060 |
2 (19筆) |
勾選檢索骨架 |
4,495 |
8,060 |
3,328 |
透過IUPAC名稱以文字進行精確結構檢索 (檢索日期:2020/11/11) |
未勾選檢索骨架 |
4,490 |
8,020 |
2 |
勾選檢索骨架 |
4,491 |
8,020 |
3,319 |
數據變化趨勢的可能因素
首先,就表一而言,針對子結構檢索的部分是否勾選檢索骨架,就結果上可說是沒有差別。
再者,就表二而言,以圖形進行精確結構檢索時 (以公開/公告案數量呈現) 是否勾選檢索骨架,僅在阿托品的檢索結果發生劇烈變化 (未勾選檢索骨架為2頁,勾選檢索骨架則為3,328頁) 的可能原因如下,這樣的趨勢在透過IUPAC名稱以文字進行精確結構檢索時也出現過,經檢視後發現,未勾選檢索骨架時,所得的公開/公告案均記載了阿托品化學結構式,或者以IUPAC命名法記載 ((RS)-(8-Methyl-8-azabicyclo[3.2.1]oct-3-yl) 3-hydroxy-2-phenylpropanoate) 其名稱;但勾選檢索骨架時,即「檢索限定在化合物的一個固定部分,不包含立體化學與質子位置等訊息」時,只要出現了阿托品名稱,甚至沒有出現阿托品,只要有天仙子胺 (左旋阿托品) 的名稱或結構式,其案件都會被納入結果,故而造成此一懸殊的差距。
比較表一與表二,對阿托品以圖形進行精確結構檢索未勾選檢索骨架時的結果數量 (19筆) 與對子結構檢索時的結果數量 (17筆) 相近,經檢視後推測應為結果之呈現方式導致,如同前述子結構檢索時僅呈現檢索出的結構數量,但精確結構檢索時 (不論以文字還是圖形) 呈現的是公開/公告案數量,那麼同樣的結構出現在一個以上的公開/公告案時,就會造成子結構檢索結果數量大於精確結構檢索結果數量的狀況。由於乙醯胺酚其實就是普拿疼的活性成分,其同一結構很容易出現在不同公開/公告案中,因此也有類似的狀況。
而且,將化合物的骨架去代入 (fit in) 資料庫中各結構的骨架,似乎是子結構檢索的獨有機制,由於乙酸乙酯結構簡單,一部分具有乙酸乙酯結構的化合物在機率上較容易發生,在資料庫整體中的盛行率會較高,因此進行子結構檢索時的結果數量會比以圖形進行精確結構檢索的結果數量高出非常多 (子結構檢索時為1,555,210筆,以圖形進行精確結構檢索時約44,940筆)。
結論
以上探討僅基於三種化合物的實測,其對現象的推論未必全然正確,本文並非試圖逆向推導實質程式進行比對的機制,而是著重在方法學與現象的呈現。我們可以發現針對同一結構的各種檢索方式其結果或多或少有所偏異,因此在實際進行檢索時,建議對同一結構進行不同檢索方式的交叉比對。
備註:
- 在生活中追根究柢這些差異,或者可以說是滿足自己的好奇心;但在工作上,能順利完成既定目標才是王道。筆者彼時心中不斷默念:我是一個在進行檢索的專利從業人員,不是在debug的軟體工程師!
- 氫原子是最常見被取代的基團,因此比對的範圍並不包含氫原子。
作者: |
喻韜 |
現任: |
北美智權專利工程部專利工程研究組研究員 |
經歷: |
台灣知名法律事務所專利工程師 |
學歷: |
東吳法碩乙法律專業組碩士
台科大專利所碩士、清華大學生資所碩士
北科大電子系學士、東華大學生科系學士 |
專長: |
專利申請 (佈局、撰稿、答辯);
歐盟、美國、中國、台灣專利法規及相關判例研究;
台灣專利 舉發及訴訟 |
|
|
|
Facebook |
|
在北美智權報粉絲團上追踪我們 |
|
|
|
|
|
|
|