075期
2020 年 11 月 25 日
  北美智权官网 历期智权报   订阅北美智权报  
 
化学结构之专利检索 -Ⅰ
喻韬/北美智权 专利工程研究员

专利申请案事前检索的重要性已是老生常谈,然而专利检索有其局限性,除去一般性关键词精确度、检索工时与检索强度的权衡等等障碍,特定技术领域的检索也会出现不同的疑难杂症,化学领域即为一适例。首先,化学物质的表示至少有IUPAC命名以及化学式两种,前者虽可利用文字描述化学物质,但其使用与解读却异常繁杂,导致各国专利行政上倾向以化学式作为专利文件记载化学物质的标准。然而,不论化学式的类型,其在专利文件中均以图形的方式存在,一般官方提供的检索系统无法针对这些化学式图形进行检索。商业数据库囿于各种收费机制,则使得从业人员难以长时间透过实作来熟悉数据库运作的方式、锻炼检索的技巧。


图片来源 : shutterstock、达志影像

1. PATENTSCOPE

早在2016年,世界知识产权组织(WIPO)就已经在原有的PATENTSCOPE下推出了专门针对化学领域的免费检索工具,然而在当时仅能进行整体结构精准比对,由于对官能基的修饰与替换经常被认为是本技术领域中具有一般知识者之能力所及,因此,当时这项功能立意虽美,用处却有限。当时这套工具最实用的功能在于,号称能够对同一化学物质,以多种不同的命名方式来进行检索。


图片来源:https://www.wipo.int/patentscope/zh/news/pctdb/2016/news_0008.html

WIPO於2019年9月對這項服務推出了更新版本,該版本改變了原先的檢索方式,允許將輸入的結構定義為部分結構 (亞結構),而檢索出包含出該部分結構的化學物質。這個功能上的改進消除了前一版本最大的遺憾,使得檢索類似結構變為可行。本文接下來將簡單介紹此服務的使用方式,並對此服務進行簡單的實測。


图片来源:https://www.wipo.int/portal/zh/news/2019/article_0032.html

2. 以文字进行检索

进入PATENTSCOPE之后,点选「检索▼」以显示下拉式选单,即可见到「化合物」这个选项。

点选后,系统将会切换到化合物检索的专属画面。

当游标停在「检索类型」的下拉式选单时,会跳出批注标签,以简略呈现不同检索类型的释例。

进入检索类型的下拉式选单后则出现四种可选类型,以「化合物名称」进行检索时,可以接受的关键词类型较多,一般的俗称、商品名称、CAS[1]名称以及IUPAC名称[2];INN则是世界卫生组织给每种药品的一个官方的非专利性名称;InChI为国际化合物标识,是由国际纯粹与应用化学联合会和国家标准技术研究所联合制定的,用来标识化合物IUPAC名称的字符串;SMILES代表简化分子线性输入规范,是一种用ASCII字符串明确描述分子结构的规范。各种名称的详细内涵并非本文重点,暂且不表。

本文先以阿托品为例以说明该界面的操作。选定检索类型后,输入化合物名称(上图中1.);「检索骨架」这个选项的批注卷标说明是「检索限定在化合物的一个固定部分,不包含立体化学与质子位置等讯息」(上图中2.),而官方说明仅有指出检索将根据化合物的原子种类及其连接方式,如此说来,勾选此选项理当使得检索结果扩大,因为只要与关键词化合物具有相同的原子种类及其连接方式,即便另外连接其他官能基团,都会被认为是与关键词化合物相符;利用下拉式选单则可以选择查询的专利数据库 (上图中3.);另外在这个阶段,检索者就可先选择「在编辑器中显示」(上图中4.),系统将呈现关键词化合物的结构,检索者利用这个功能可以预先确认关键词是否发生错误(如下图) (尤其是以IUPAC名称、InChI或SMILES进行检索时,因为这种系统化的科学命名方式虽然准确,但相对复杂);最后就是按下「精确结构检索」,让系统呈现结果,但如果伴随勾选「检索骨架」,呈现的结果将会是「假性」精确结构检索。

3. 实测文字检索

笔者以三种复杂程度不同的简单化合物为例,实测对同一化学物质,以多种不同的命名方式来进行检索是否可以得到相近或一致的结果。下表中每一名称后的大括号中的蓝色数字是检索时「没有勾选检索骨架」,绿色数字则是「勾选了检索骨架」;其中数字代表检索结果在一页呈现10笔资料时的页面数。各化合物名称主要来自中/英文版本的维基百科。

化合物

乙酸乙酯

乙酰胺酚

阿托品

结构式

检索

关键词

化合物名称

一般名称

乙酸乙酯 {4490/4491}

Acetic ester{4490/4491}

Acetic ether {4490/4491}

Ethyl ester of acetic acid {0/0}

乙酰胺酚 {0/0}

对乙酰氨基酚 {8020/8020}

对乙酰氨基酚 {8020/8020}

对乙酰氨基酚 {8020/8020}

对乙酰胺酚 {0/0}

Paracetamol {8020/8020}

Acetaminophen {8020/8020}

阿托品 {2808/3319}

Atropine {2808/3319}

商品名称

None

普拿疼 {0/0}

必理通 {0/0}

泰诺 {0/0}

Tylenol {8020/8020}

Panadol {8020/8020}

Atropen {0/0}

CAS名称

Acetic acid ethyl ester {4490/4491}

Acetamide, N-(4-hydroxyphenyl)- {8020/8020}

Benzeneacetic acid, α-(hydroxymethyl)-(3-endo)-8-methyl-8-azabicyclo[3.2.1]oct-3-yl ester {0/0}

IUPAC名称

Ethyl acetate {4490/4491}

Ethyl ethanoate {4490/4491}

N-(4-hydroxyphenyl)acetamide {8020/8020}

(RS)-(8-Methyl-8-azabicyclo[3.2.1]oct-3-yl) 3-hydroxy-2-phenylpropanoate {2/3319}

INN

None

Paracetamol {8020/8020}

Atropine {2808/3319}

InChI

1S/C4H8O2/c1-3-6-4(2)5/h3H2,1-2H3 {4490/4491}

1S/C8H9NO2/c1-6(10)9-7-2-4-8(11)5-3-7/h2-5,11H,1H3,(H,9,10) {8020/8020}

1S/C17H23NO3/c1-18-13-7-8-14(18)10-15(9-13)21-17(20)16(11-19)12-5-3-2-4-6-12/h2-6,13-16,19H,7-11H2,1H3/t13-,14+,15+,16? {2808/3319}

SMILES

O=C(OCC)C {4490/4491}

CC(=O)Nc1ccc(O)cc1 {8020/8020}

CN3[C@H]1CC[C@@H]3C[C@@H](C1)OC(=O)C(CO)c2ccccc2 {2808/3319}

※ 检索日期:2020/11/11

4. 结论

本次实测在乙酸乙酯方面有两点值得注意,首先,Ethyl ester of acetic acid这种虽然查得到,但太少使用的名字不适合作为关键词,PATENTSCOPE并没有那么强大;再者是否勾选「检索骨架」,其结果差异不大。

在乙酰胺酚方面,以我国习用的名称进行检索将会没有结果,以中国习用的名称进行检索才能检索得到,进一步测试发现,这样的差异并不是繁简差异造成的,分别比对「對乙酰氨基酚」与「對乙醯氨基酚」(官能基部分同字但繁简不同);以及「乙酰氨基酚」与「乙酰氨基酚」(两官能基相对位置之定义词同字但繁简不同),都会得到一致的结果。而是该系统只能认得同一官能基的某些名称,例如「對乙醯氨基酚」与「對乙醯胺酚」的结果就截然不同。在商品名称测试结果则发现,系统仅能对英文商品名称有所反应,但阿托品的英文商品名称依然无检索结果。

在阿托品方面的测试结果则有趣得多,是否勾选「检索骨架」相差近500页 (5000笔) 结果,在反复检验之后发现阿托品的官能基修饰而成的化合物较多 (见下方比较图),相较于乙酰胺酚、乙酸乙酯的检索结果,可以合理的推测所谓「检索骨架」并非以关键词化合物的骨架去代入 (fit in) 数据库中各结构的骨架,若可以带入较大化合物之一部分,则呈现该笔结果;反而比较像是以关键词化合物的骨架,查找官能基修饰而成的化合物,背后的演算、比对原理并非重点,但检索者应对这种现象有所预期以提升检索的准确性。

另外,商品名称、CAS名称、IUPAC名称都无法呈现稳定的检索结果,反而是一般英文名称结果较为稳定,相较之下InChI、SMILES也可以呈现一致的结果,因此,对于新合成出的化合物,建议将其名称转换InChI或SMILES,再进行检索。

关于以结构式进行检索的实测将会在后续文件为读者呈现。

 

备注:

 

好消息~北美智权报有微信公众号了!

《北美智权报》内容涵盖世界各国的知识产权新闻、重要的侵权诉讼案例分析、法规解析,以及产业与技术新知等等。

立即关注北美智权微信公众号→ NAIP_IPServices

~欢迎读者分享与转发~


作者: 喻韬
現任: 北美智权专利工程部专利工程研究组研究员
经历: 台湾知名法律事务所专利工程师
学历: 东吴法硕乙法律专业组硕士
(台湾地区)台科大专利所硕士、(台湾地区)清华大学生资所硕士
(台湾地区)北科大电子系学士、(台湾地区)东华大学生科系学士
专长: 专利申请 (布局、撰稿、答辩);欧盟、美国、中国、台湾专利法规及相关判例研究;台湾专利 举发及诉讼

 


 





感谢您阅读「北美智权报」,欢迎分享智权报连结。如果您对北美智权电子报内容有任何建议或欲获得授权,请洽:Editorial@naipo.com
本电子报所登载之文章皆受著作权保护,未经本公司授权, 请勿转载!
© 北美智权股份有限公司 & 北美联合专利商标事务所 版权所有 234 台湾地区新北市永和区福和路389号五楼 TEL:+886-2-8923-7350