077期
2020 年 12 月 23 日
  北美智权官网 历期智权报   订阅北美智权报  
 
化学结构之专利检索 - Ⅱ
喻韬/北美智权 专利工程研究员

本次将延续北美智权报75期化学结构之专利检索—Ⅰ,介绍PATENTSCOPE中以结构式进行检索的方式,并实际以不同的结构式实测。


图片来源 : shutterstock、达志影像

上传结构

依照前次的方式进入化合物检索后,即可点选「上传结构」选项,进入其接口。

按下「Upload」后即可由本机选择想要上传的结构式。该接口中提示有可接受的文件格式,其中较不为一般人所知的是 .mol 这个文件格式,该格式最初为ChemDraw、ISIS/Draw等较为主流的分子结构编辑程序所采用,尔后逐渐变为通用文件格式。然而,笔者建议在专利工程师的日常工作中尽量采用/转存为图形格式,以避免与客户稿件往来时,或是电子送件时发生不兼容的意外;因为一旦发生意外,轻则需要付出额外的心力,重则失去较早的申请日。也因此,本文均以图形格式进行操作,不对 .mol 格式进行测试。

本次以乙酰胺酚 (檔名:Acetaminophen.png) 为例,化学结构图形上传后系统即自动开始分析、评估,以乙酰胺酚来说,这个过程大概只有三秒钟。

之后,页面便自动跳转至「结构化编辑器」并呈现对input分析、评估的output,此时检索者应该要检查output是否正确,如果系统呈现的结构式有误,则要进行修订,完成修订后,按下5. 评估以重新输入结构式,如果要放弃当前进度,则可以按下2. 重置以回到化合物检索最初的页面。

进行到这一步骤时,如果没有修改结构式的必要,基本上只要按下3. 子结构检索4. 精确结构检索,就可以收取检索结果了。与以文字进行检索类似,以结构进行检索时,4. 精确结构检索也可以选择是否搭配1. 检索骨架;而3. 子结构检索则是本文后段的重点。

化学结构化编辑器

本次实测中,upload各种结构式的图文件时,在upload乙酸乙酯之后,页面都回报错误讯息,即便变更为不同来源的图档。因此,笔者决定自行绘制该结构,其实就是自行绘制前面所提到的output,前述的output若发生辨识错误时,也是透过这个编辑器进行修正,故藉此机会简单介绍PATENTSCOPE所使用的化学结构化编辑器。

编辑器上缘任务栏有不同功能的按钮,当光标停留于其上时,会跳出说明功能的卷标,前六个按钮的功能较为常见,其作动方式类似于小画家、powerpoint中的等效按钮。较为特别的是6. 模板7. 键结以及8. 原子这三个按钮。

按下6. 模板后,任务栏第二行会提供各种碳数不同的碳环结构,供检索者依需求后制。需要注意的是,这些模板已经预设以氢原子补齐每个碳的空轨域,若要以其他原子/基团取代氢原子,在碳原子与其他原子/基团直接绘制键结即可,软件会自动依键结数量在该碳原子删除相同数量的氢原子。

按下7. 键结后,任务栏第二行会提供一键至三键的选项、纸面上/下方向的键结以及饱和碳链,最后一个选项的功能则是在绘制完成后,可以用来量测化学键性质。

至于8. 原子则提供切换每次鼠标左键点击时在编辑器中放置的原子种类。

较为特别的是,这个编辑器配合检索的目的,还提供了两种query atom,来替代不确定的原子种类。

绘制乙酸乙酯

首先放置乙酸乙酯的两个氧原子。选择氧原子后,在绘制区空白处分别点击左键即可。

点选碳链,将光标放置在下方氧原子令其出现红框时,按下左键不放,拉开光标,距离越远则碳链会自动加长。重复操作以绘制两个乙基。

点选双键,将光标放置在上方氧原子令其出现红框时,按下左键不放,拉动光标至目标碳原子上,至该碳原子上也出现红框时,键结就连接完成了。

点选选择,拖动各原子,稍微修饰外型。

完成后点选评估,即会自动给出一些该结构的特性,这样检索系统就算是接收到检索者绘制的结构了。

笔者曾经以不同的计算机 (包含硬件及操作系统)、相同的浏览器、相同来自维基百科的图档进行上传,一者可顺利正确辨识,另一者却因不明的原因,PATENTSCOPE完全无法判断,最终是upload类似结构,再透过编辑器修改为欲检索的结构[1],因此使用编辑器可说是必备技能。

实测子结构检索

在一切就绪后,即可进行检索,首先测试的是3. 子结构检索,然而其结果呈现方式有些与众不同,需要特别说明。

首先与以文字进行精确结构检索不同,结果页面并不会告诉检索者全部检索到多少笔公开/公告案,而是显示检索到多少结构。

当光标停留在一化学结构图形上时,该图形外框会转变上图中左侧的格式,点选后会变成上图中右侧的格式,代表该格式以被选定,按下页面右下方的检索,即可得到与该结构有关的公开/公告案。

需要注意的是,上图中左侧结构上方有个笔记本的图形,点选后该结构将被代入结构化编辑器,在编辑器中可对该结构改动后进行新一轮检索。

另一个重点是,子结构检索的化学结构图形结果是以分段的方式呈现,图中可以看到这一阶段共呈现了1,945笔结果,共82页,而这7笔结果占全部结果的29%,而且这个阶段性结果会随着当前网络传输能力而略有浮动。

跳到这个阶段的最后一页,按下显示更多,即可进入第二阶段的信息。

可进入第二阶段后即可看到,PATENTSCOPE已经呈现共3,618笔结果,占全部结果的62%。

连续进行同样的操作直到百分比数值消失,此时呈现的才是这是化学结构图形结果全部的数量,共6,017笔。

由于子结构检索直接呈现检索结果的图形,可以看出来这个检索模式下采用的方法似乎与文字文模式检索不同,确实以关键词化合物的骨架去代入 (fit in) 数据库中各结构的骨架,若可以带入较大化合物之一部分[2],则呈现该笔结果。

子结构检索实测结果

针对子结构检索,本次依然以乙酸乙酯、乙酰胺酚以及阿托品进行测试。下表之检索结果均以化学结构图形笔数记载。

〈表一〉※    检索日期:2020/12/8

化合物

乙酸乙酯

乙酰胺酚

阿托品

未勾选检索骨架

1,555,210

6,017

17

勾选检索骨架

1,555,210

6,017

17

以图形进行精确结构检索实测结果

以图形进行精确结构检索时,检索结果呈现的方式与以文字进行精确结构检索时相同,均以公开/公告案数量显示。下表之检索结果均以结果页面数记载 (笔数 ≒ 页面数 x 10)。

〈表二〉 以图形进行精确结构检索 (检索日期:2020/12/8)

化合物

乙酸乙酯

乙酰胺酚

阿托品

未勾选检索骨架

4,494

8,060

2 (19笔)

勾选检索骨架

4,495

8,060

3,328

透过IUPAC名称以文字进行精确结构检索 (检索日期:2020/11/11)

未勾选检索骨架

4,490

8,020

2

勾选检索骨架

4,491

8,020

3,319

数据变化趋势的可能因素

首先,就表一而言,针对子结构检索的部分是否勾选检索骨架,就结果上可说是没有差别。

再者,就表二而言,以图形进行精确结构检索时 (以公开/公告案数量呈现) 是否勾选检索骨架,仅在阿托品的检索结果发生剧烈变化 (未勾选检索骨架为2页,勾选检索骨架则为3,328页) 的可能原因如下,这样的趋势在透过IUPAC名称以文字进行精确结构检索时也出现过,经检视后发现,未勾选检索骨架时,所得的公开/公告案均记载了阿托品化学结构式,或者以IUPAC命名法记载 ((RS)-(8-Methyl-8-azabicyclo[3.2.1]oct-3-yl) 3-hydroxy-2-phenylpropanoate) 其名称;但勾选检索骨架时,即「检索限定在化合物的一个固定部分,不包含立体化学与质子位置等讯息」时,只要出现了阿托品名称,甚至没有出现阿托品,只要有天仙子胺 (左旋阿托品) 的名称或结构式,其案件都会被纳入结果,故而造成此一悬殊的差距。

比较表一与表二,对阿托品以图形进行精确结构检索未勾选检索骨架时的结果数量 (19笔) 与对子结构检索时的结果数量 (17笔) 相近,经检视后推测应为结果之呈现方式导致,如同前述子结构检索时仅呈现检索出的结构数量,但精确结构检索时 (不论以文字还是图形) 呈现的是公开/公告案数量,那么同样的结构出现在一个以上的公开/公告案时,就会造成子结构检索结果数量大于精确结构检索结果数量的状况。由于乙酰胺酚其实就是普拿疼的活性成分,其同一结构很容易出现在不同公开/公告案中,因此也有类似的状况。

而且,将化合物的骨架去代入 (fit in) 数据库中各结构的骨架,似乎是子结构检索的独有机制,由于乙酸乙酯结构简单,一部分具有乙酸乙酯结构的化合物在机率上较容易发生,在数据库整体中的盛行率会较高,因此进行子结构检索时的结果数量会比以图形进行精确结构检索的结果数量高出非常多 (子结构检索时为1,555,210笔,以图形进行精确结构检索时约44,940笔)。

结论

以上探讨仅基于三种化合物的实测,其对现象的推论未必全然正确,本文并非试图逆向推导实质程序进行比对的机制,而是着重在方法学与现象的呈现。我们可以发现针对同一结构的各种检索方式其结果或多或少有所偏异,因此在实际进行检索时,建议对同一结构进行不同检索方式的交叉比对。

 

备注:

 

好消息~北美智权报有微信公众号了!

《北美智权报》内容涵盖世界各国的知识产权新闻、重要的侵权诉讼案例分析、法规解析,以及产业与技术新知等等。

立即关注北美智权微信公众号→ NAIP_IPServices

~欢迎读者分享与转发~


作者: 喻韬
現任: 北美智权专利工程部专利工程研究组研究员
经历: 台湾知名法律事务所专利工程师
学历: (台湾地区)东吴法硕乙法律专业组硕士
(台湾地区)台科大专利所硕士、(台湾地区)清华大学生资所硕士
(台湾地区)北科大电子系学士、(台湾地区)东华大学生科系学士
专长: 专利申请 (布局、撰稿、答辩);欧盟、美国、中国、台湾专利法规及相关判例研究;台湾专利 举发及诉讼

 


 





感谢您阅读「北美智权报」,欢迎分享智权报连结。如果您对北美智权电子报内容有任何建议或欲获得授权,请洽:Editorial@naipo.com
本电子报所登载之文章皆受著作权保护,未经本公司授权, 请勿转载!
© 北美智权股份有限公司 & 北美联合专利商标事务所 版权所有 234 台湾地区新北市永和区福和路389号五楼 TEL:+886-2-8923-7350