自2022年底美国人工智能研究实验室OpenAI推出生成式聊天机器人ChatGPT后,即成为不同领域的业界追捧对象,好像只要跟ChatGPT沾上边,便会「钱」途及商机无限。虽然目前全球至少有5个国家禁止使用ChatGPT[1],及10多个国家及地区打算立法规管[2],但在庞大的商机[3]驱动下,仍有各国科技巨头纷纷投入ChatGPT的技术及应用研发。
洞烛机先是攻占市场的关键,而自由运营 (Freedom to Operate,FTO) 则是企业必须的商业安全考虑,因此台湾地区财团法人专利检索中心 (PSC) 特别制作了《AI聊天机器人专利分析报告》(下称《报告》),以「生成式聊天机器人」为主题,针对生成式聊天机器人运用在「专利检索」领域的能力进行评测,以确认生成式聊天机器人对专利从业人员是否有帮助。同时提供了「生成式聊天机器人」相关的技术探勘与专利布局建议,以利厂商抢占生成式聊天机器人的藍海商机。
图片来源 : shutterstock、达志影像
《报告》首先简介了聊天机器人(Chat Bot)的运作逻辑,指出它是一种自动化的计算机应用程序;有别于传统聊天机器人仅能给予用户较生硬且笼统的回应,AI聊天机器人藉由人工智能的技术,可以从用户输入的聊天内容识别用户意图(Intent)以及内容中的重要实体(Entity),进而分析用户需求并编写合适的响应内容。透过网页程序(Web)、实时通讯软件(Messenger)或是语音(Voice)接口,AI聊天机器人能模拟人类口吻与使用者进行对话或问答等互动,进而帮助人们更高效的处理大量的工作和交流需求,亦可协助企业和组织提供更有效的客户服务及协助。
图1. 聊天机器人类型
資数据源:《 AI聊天机器人专利分析》, 台湾经济部智慧财产局「112 年度专利检索创新增值服务计划」研发成果,
财团法人专利检索中心;刘恒旭 、李源峰,2023年10月
《报告》首先中介绍了目前聊天机器人的类型,主要有3种:第1种是基于规则模型(Rule-based model),透过由人预先建立对话之规则,使机器人接收到使用者输入特定词语时,能响应特定的答案;第2种为基于检索模型(Retrieval-based model),使用知识库储存预先定义好的响应内容,藉由机器学习,根据使用者输入的内容归类使用者的意图,再利用相似度计算找出合适的响应内容;第3种为生成式模型(Generative model),它不依赖预先定义好的响应内容,而是藉由大量数据进行训练,并透过机器学习、语言处理、递归神经网络来对用户输入之内容进行语义分析,再逐字生成响应内容,且此模型还可具有多轮式对话功能(即此种模型之聊天机器人能记忆之前的对话内容,并接续该对话)。《报告》认为第3种模型较前两种模型更具弹性、响应内容也可以更精准,更贴近一般人类的对话方式;因此《报告》特针对第3种「生成式聊天机器人」之技术领域进行专利检索及数据分析。
检索策略
根据前述内容,以「生成式聊天机器人」作为主题拟定检索策略,《报告》检索区域为全球,检索时间区间截至2023年06月30日,使用之资料库为Derwent Innovation,然而,由于「生成式人工智能」(Generative artificial intelligence,GAI)一词是近几年才出现的名词,若以「Generative AI」或「Generative artificial intelligence」作为主要关键词,搭配关键词「聊天机器人」之相关同义词进行检索的话,其搜寻结果笔數仅174件,考虑整体技术发展趋势可能有不足以代表该技术之发展现况的现象,故初始的检索策略先以「生成式人工智能」作为主要关键词,并额外使用人工智能相关之关键词,如「机器学习」、「神经网络」等,再增加聊天机器人相关的语言处理技术之关键词,并进行前述关键词之相关/衍生字词的扩展,分類号则以G06F、G06N、G06Q、G10L、H04L等相关分類号,所筛选之相关专利共2,887件,其中DWPI家族为1,925案。表1为「生成式聊天机器人」之检索策略。
表1. :《AI聊天机器人专利分析报告》检索策略
数据源:《 AI聊天机器人专利分析》, 台湾经济部智慧财产局「112 年度专利检索创新增值服务计划」研发成果,
财团法人专利检索中心;刘恒旭 、李源峰,2023年10月
专利历年申请趋势
在检索及筛选出2,887件相关专利后,《报告》即展开数据统计,并以图表方式呈现生成式聊天机器人技术领域在全球的布局趋势。针对申请量部分,是《报告》将检索结果之专利以申请号进行整并后的专利數量。从图2可见,专利申请之数量与每年研发出的语言处理模型数量有着正相关的影响,并于2021年达到高峰。由于2022年与2023年的申请数量因18个月未公开期的原因,先排除不表。就2015年到2021年的数据来看,生成式聊天机器人技术领域的专利申请量是现持续成长之走势。
图2. 专利申请趋势图
数据源:《 AI聊天机器人专利分析》, 台湾经济部智慧财产局「112 年度专利检索创新增值服务计划」研发成果,
财团法人专利检索中心;刘恒旭 、李源峰,2023年10月
全球前十大IPC分类号分析
《报告》将此次检索结果以IPC三阶分类号进行主要技术分类后,得出生成式聊天机器人目前技术主要分布在G06F数字数据处理、G06N运算模型、G10L语音分析或识别以及G06K图形数据读取等4大分类号之结果。其中又以数字数据处理及运算模型的分类号占比最大,前十大IPC中囊括7个分类号,这也与生成式聊天机器人的运作方式相互呼应;因生成式聊天机器人主要是在接收用户输入之数据,经由模型运算后,产生响应消息并回复给使用者,此一过程即需使用大量数据处理程序,因此分类号G06F以及G06N可视为生成式聊天机器人的主要分类号。
图3:全球前十大IPC分类号
数据源:《 AI聊天机器人专利分析》, 台湾经济部智慧财产局「112 年度专利检索创新增值服务计划」研发成果,
财团法人专利检索中心;刘恒旭 、李源峰,2023年10月
专利申请地区分析
接下来,《报告》将检索结果以申请号整并的方式对分析母体进行处理,将具有相同申请号之公开案和公告案去除重复者后仅留一笔纪錄,再进一步整理出「生成式聊天机器人」技术专利在全球各地区之布局狀态,详图4。
图4:全球专利主要申请地区(前十大)
数据源:《 AI聊天机器人专利分析》, 台湾经济部智慧财产局「112 年度专利检索创新增值服务计划」研发成果,
财团法人专利检索中心;刘恒旭 、李源峰,2023年10月
图4显示美国为相关专利数量最多的国家,总共有997件,占了整体数量的35%;紧随其后的为中国大陆,共有851案,占整体数量的30%;申请数量位居第3名的是WIPO,共有364件,占整体数量的13%;接下来是韩国的223件,占整体数量8%。总的来说集中度很高,前4名地区的申请量就占了全球的86%。
《报告》继续列出此领域专利申请案数量前20名的国家/地区,如表2所示。表2可见台湾地区的专利件数仅有16件,但已位居目前全球的第10名,甚至高于英国、德国等地。
表2. 申请案数量前20名国家/地区
数据源:《 AI聊天机器人专利分析》, 台湾经济部智慧财产局「112 年度专利检索创新增值服务计划」研发成果,
财团法人专利检索中心;刘恒旭 、李源峰,2023年10月
前10大专利权人分析
在专利权人分析的部分,《报告》将专利申请量近似的前10大专利权人分为3个群组,分别是第1群组为前3大,包括腾讯 (85案)、微软(84案)、以及IBM (83案),申请量的差距仅在伯仲之间,排名应随时产生变化;第2群组则是包括谷歌 (58案)、甲骨文 (55案) 及脸书 (54案);第三群组包括平安保险 (44)案、三星 (35案)、第一资本 (35案) 以及阿里巴巴 (26案)。如图5所示。
图5. 前十大专利权人
数据源:《 AI聊天机器人专利分析》, 台湾经济部智慧财产局「112 年度专利检索创新增值服务计划」研发成果,
财团法人专利检索中心;刘恒旭 、李源峰,2023年10月
《报告》指出前十大专利权人产业类型主要为ICT以及金融产业,其中ICT产业申请案量占比约为86%,产业中的专利权人包括腾讯、微软、IBM、谷歌、甲骨文、脸书、三星以及阿里巴巴。金融产业占比约14%,领域中专利权人包括平安保险、第一资本。至于专利权人所在地主要是美国及中国;美国企业包括微软、IBM、谷歌、甲骨文、脸书及第一资本;中国大陆企业包括腾讯、平安保险及阿里巴巴;而韩国企业则仅有三星入围,日本企业从缺。
此外,《报告》以申请号整并的方式查看前十大专利权人的变化,当透过两种整并方式比对,可以得知专利权人的布局惯性,如微软以全球布局总量216件跃升为第一名,对应家族案数可以发现微软大多布局2至3个地区,而腾讯则是114件当中有80件布局集中在中国大陆。
参考数据:
- 《 AI聊天机器人专利分析》, 台湾经济部智慧财产局「112 年度专利检索创新增值服务计划」研发成果,财团法人专利检索中心;刘恒旭 、李源峰,2023年10月 (注:有需要之读者可填写表格径向专利检索中心PSC索取。
备注:
好消息~北美智权报有微信公众号了!
《北美智权报》内容涵盖世界各国的知识产权新闻、重要的侵权诉讼案例分析、法规解析,以及产业与技术新知等等。
立即关注北美智权微信公众号→ NAIP_IPServices
~欢迎读者分享与转发~ |
|
|
作者: |
李淑莲 |
现任: |
北美智权报主编 |
学历: |
(台湾)文化大学新闻研究所 |
经历: |
半导体科技杂志(SST-Taiwan)总编辑
CompuTrade International总编辑
日本电波新闻 (Dempa Shinbun) 驻海外记者
日经亚洲电子杂志 (台湾版) 编辑 |
|
|
|