未来已来:人工智能创新如何获得专利保护?——对人工智能专利授权确权法律实践的观察凝练
未来已来:人工智能创新如何获得专利保护?——对人工智能专利授权确权法律实践的观察凝练
人工智能技术飞速发展,人工智能专利申请以及复审无效案件急剧增加。人工智能创新成果如何获得专利保护,成为法律实务的关键问题。
人工智能是一个极为广泛的技术类别,根据国家知识产权局《关键数字技术专利分类体系(2023)》,人工智能包括人工智能硬件平台、人工智能通用技术、人工智能关键技术。其中的机器学习、知识图谱、自然语言处理、智能语音、计算机视觉被定义为核心子技术。五大核心子技术的涉人工智能专利主要集中在国际专利分类号(IPC分类号)G06(计算、推算或计数)下,尤以G06F(电数字数据处理)、G06N(基于特定计算模型的计算机系)、G06V(图像或视频识别或理解)占比较高[1]。举例而言,波士顿联邦地区法院2024年1月开庭审理的S公司起诉某互联网企业人工智能专利侵权案中,三项涉案专利均属于G06F7/38技术分支。本文主要针对G06分类号下的涉人工智能的专利情况进行分析。
一、人工智能专利保护现状
第一,人工智能专利主要包括模型训练/应用专利、特定场景逻辑/决策专利两种类型。2020年2月1日实施修改的《专利审查指南》(以下简称“《指南》”)在第二部分第九章新增了第六节“包含算法特征或商业规则和方法特征的发明专利申请审查相关规定” ,指出涉及人工智能、“互联网+”等的发明专利申请一般包含算法或商业规则和方法,并具体结合10个例子说明了关于该类专利授权客体和新颖性/创造性的审查规则。经统计,G06分类号下的专利申请大多涉及算法特征。这里的“算法”特征,既包括机器学习方法/神经网络模型,也包括特定场景下基于计算机程序实现的处理逻辑/决策机制,如控制逻辑、通信机制等,也可能是商业规则。相应地,G06类人工智能专利可区分为模型训练/应用专利、特定场景逻辑/决策专利两类。
第二,经过大数据统计,涉及无效宣告请求的人工智能专利全部维持有效比率达到57%,主要争议集中在授权客体、公开充分性(实用性)和创造性的审查。针对人工智能专利提起的复审、无效请求,据统计主要集中于近5年[2]。基于对人工智能技术的理解,笔者通过在智慧芽全球专利数据库对相关的IPC分类号[3]进行限定,统计分析国家知识产权局近五年(2020年4月19日至2025年4月19日)针对G06F、G06N及G06V类中国发明专利作出复审、无效决定的情况。基于上述检索条件,发现近5年共计3750件中国AI发明专利/专利申请(同申请号合并)经历复审或无效程序。其中,7件专利先后经历复审和无效,另3667件专利申请经历复审,76件专利经历无效。上述3750件专利/专利申请,2613件专利/专利申请维持驳回、全部无效或部分无效。从复审结果看,仅约29%专利申请撤销驳回;从无效结果看,约57%专利全部维持,28%专利全部无效,15%专利部分无效。由此可以看出,这一类专利具有较高授权门槛,但获得授权后较为稳定[4]。从复审、无效理由看,主要集中在授权客体、公开充分性、实用性和创造性的审查。其中,公开充分性和实用性问题有一定相关性。
点击可查看大图
二、人工智能专利授权客体的边界把握
人工智能专利授权客体的判断涵盖A25.1(2)规定的智力活动的规则和方法和A2.2所述的技术方案。人工智能专利授权客体的边界在于,算法特征与应用场景技术特征密切关联共同解决了技术问题,且所解决的技术问题应当是计算机或网络技术上存在的问题。根据《指南》的规定,如果权利要求仅涉及抽象算法或单纯的商业规则/方法,则属于A25.1(2)规定的智力活动的规则和方法,不授予专利权;若除了算法特征或商业规则和方法特征,还包含技术特征,则不属于智力活动的规则和方法。如果不属于A25.1(2)排除获得专利权的情形,则需要就其是否属于A2.2所述的技术方案进行审查。根据《指南》列举的属于技术手段的情形[6]可知,符合客体要求的人工智能专利应当同时满足以下要件。
点击可查看大图
实务中,对于判断是否属于纯算法专利(即是否属于“智力活动的规则和方法”)相对容易,而对于算法特征与应用场景技术特征之间是否存在关联,且共同解决了计算机或网络技术上存在的技术问题的判断,则更具挑战。
在国家知识产权局第2419xx号复审请求审查决定中,涉案专利保护一种生成机器学习样本的组合特征的方法及系统(申请号:201710595xxx.x)。驳回决定认定权利要求1-28属于A25.1(2)规定的智力活动的规则和方法。在申请人修改权利要求后,原审查部门在前置审查意见书认定权利要求1属于A25.1(2)规定的智力活动的规则和方法,权利要求14不属于A2.2规定的技术方案。具体理由:1、权利要求1……虽然其采用了分箱运算以及其他相关的统计学相关的数学方法,但是上述算法与所述计算机系统内部结构之间并不存在技术关联,虽然申请人在权利要求1中限定了所述处理的数据记录的实际内容,但是也无法使得该应用特定场景的数据特性本身与所述计算机系统内部结构之间存在技术关联。由此,上述方法依然属于人的智力活动的规则和方法。此外,权利要求14虽然保护一种系统……该权利要求14的方案并不能被认为给计算系统的内部性能带来改进,上述权利要求14中样本预处理相关的算法改进手段也不能被认为是技术手段,其所解决的问题也不是技术问题。由此,权利要求1和14也都不属于技术方案,不符合专利法第2条第2款的有关规定。对于所述人工智能技术的相关领域,其相关的IPC号请申请人参见G06N下的各个组,上述组与人工智能更相关。而基于上述IPC的解释可以看出,所述相关专利为利用机器学习的计算机系统,而非机器学习算法本身。基于上述可知,本申请并未采用技术手段。因而坚持原驳回决定。
第一次复审通知书省略前置审查意见中关于权利要求14不符合专利法第2条第2款的有关规定的认定,保留其他内容。在申请人再次修改权利要求后,第二次复审通知书坚持认为修改后的权利要求1-26不属于A2.2规定的客体。在申请人第三次修改权利要求后,第三次复审通知书认为修改后的权利要求1-26中的方案不是单纯的人为制定和调整的算法规则,不属于A25.1(2)规定的不被授予专利权的客体,但也不属于A2.2规定的客体。
本文认为,上述案例强调了构成A2.2规定的技术方案的第二个要件,即算法特征与应用场景技术特征密切关联共同解决了技术问题,且所解决的技术问题应当是计算机或网络技术上存在的问题。本案专利申请人多次修改权利要求,主要是将算法输入数据限定为特定领域中具有确切技术含义的数据。专利申请人期望证明专利符合《指南》列举的构成技术方案的情形(1),但情形(1)要求数据具有特定领域含义的同时,对应算法的执行还应能够直接体现利用自然规律解决某一技术问题的过程,如此才可体现“存在技术关联”。此外,本案体现了应加强对A25.1(2)和A2.2的区分适用。A25.1(2)重点审查是否还包含应用场景技术特征。A2.2则在此基础上进一步强调两类特征之间是否存在技术关联(即算法特征如何应用到特定场景),是否共同解决了技术问题。
三、人工智能专利充分公开及实用性判定
对34件涉及A26.3条款和2件涉及A22.4条款的专利复审、无效审查决定书进行分析,人工智能系统在训练之前可以视为通用模型,而在训练之后则转变为解决特定问题的专门系统。这一转变需要训练数据,使其成为专门人工智能系统定义的一个核心部分[7]。然而训练数据或训练过程在专利申请中应进行多大程度的披露,实务中仍在持续探索。在国家知识产权局第13262xx号复审请求审查案中,涉案专利保护一种支付操作的控制方法和系统(申请号:202010440xxx.x)。该案的驳回决定仅指出A22.3创造性问题,但在复审过程中,国家知识产权局依职权审查了A22.4实用性和A26.3充分公开性的问题。涉案专利保护一种在购物场景中通过采集用户目标脑波数据和商品信息,输入AI模型,输出确定“待识别目标对象的身份信息”的方案。在权利要求的撰写上,权利要求1保护模型应用过程,权利要求2保护模型训练过程。国家知识产权局最终以两层逻辑理由坚持将其驳回。具体理由为:“首先,本申请中并未具体说明如何训练机器学习模型。说明书中仅含糊地记载了“……”简而言之,在训练该机器学习模型时,输入数据是历史脑波数据和历史购物操作信息,输出数据是身份信息,样本的数量取决于若干用户的数量……“若干”并不是一个较为清晰的数值范围,获取场景需要与目标场景保持一致,并不意味着就明确了该样本的数据特点。比如,是否要对样本区分性别、年龄?具体采集脑波数据的哪些参数?幅度?频率?时间范围?这些在说明书中均无记载。所谓的训练方案看起来更像是一些设想,而不是具体的训练方法。其次,对于机器学习而言,应当考察学习模型所涉及输入训练数据与模型输出结果之间的关联性,但当前的说明书中并未具体说明两者之间为何以及如何存在关联性,亦未给出评估结果或实验数据证明两者的关联性,本领域技术人员难以确定待识别目标对象处于目标场景中的目标脑波数据、当前支付操作所对应的商品信息和待识别目标对象的身份信息之间是否具有关联关系。虽然,复审请求人用三份证据试图证明用脑电波数据来确定身份进而完成支付存在可能性,但那只能说理论上可以实现……”。
本案相比常规的模型应用类方案提出了更为严格的披露要求。结合本案,对于脑波等前沿领域人工智能专利,说明书达到充分公开要求,需要记载以下三方面内容:限定明确的数据含义,包括输入数据和输出数据的类型、属性、内容以及如何获取等;说明采取的具体模型,如该模型并非本领域已知模型;记载对该模型如何进行训练和优化,使得本领域技术人员经说明书的教导可以实现其所要保护的人工智能解决方案。
四、人工智能技术创造性判定
根据《指南》的规定,对既包含技术特征又包含算法特征或商业规则和方法特征的发明专利申请的创造性审查的审查标准为:两类特征“功能上彼此相互支持、存在相互作用关系”,即两类特征紧密结合、共同构成了解决某一技术问题的技术手段,并且能够获得相应的技术效果。在第55072无效宣告请求审查决定中,涉案专利保护一种建立废钢等级划分神经网络模型方法(申请号:201910958076.8),权利要求1限定了较为复杂的技术特征,一定程度上以专利保护范围换取专利稳定性。对此,请求人将其划分为四类特征,并基于提交的三篇现有技术认为第一类应用场景特征为证据1所公开,其他特征(如神经网络机构、图像识别方式、图像信息等)为证据2和3公开或属于公知常识。
点击可查看大图
国家知识产权局认为,涉案专利与证据1存在以下三方面区别:一、应用场景不同;二、所采用的方法步骤不同;三、所选取的重要参数和所采用的具体模块构成不同。关于应用场景,“涉案权利要求1是一种建立废钢等级划分神经网络模型的方法,所述模型用于废钢收储的等级分类检测,其应用场景为废钢等级划分;而证据1公开的是建立废钢种类识别神经网络模型的方法,其应用场景为废钢种类识别。”
根据对上述内容的分析,本案呈现了以下评判方向和认定逻辑:第一,输入输出数据不同,通常可认定应用场景不同。对于模型训练/应用专利,特定应用场景下的输入数据和/或输出数据融合在模型建立、训练方法的各个步骤(数据获取、预处理、特征提取和训练等)。因而,该类专利的应用场景通常可通过模型的输入和输出数据(尤其输出数据)予以体现。第二,应用场景不同,通常可认定各个步骤执行方法不同。如上所述,输入数据和/或输出数据融合在模型建立/训练方法的各个步骤,因而模型输入输出数据的不同常导致模型构建过程中大部分步骤也会有所差异。当然,上述评判方向有个逻辑前提,即各个算法步骤之间相互关联。本案正是三个区别特征相互关联,使其具备创造性。
[注]
[1] 涉机器学习专利的IPC分类号主要包括:G06N与G06F;涉知识图谱、自然语言处理专利的IPC分类号主要包括:G06F与G06N;涉智能语音专利的IPC分类号主要包括:G10L与G06F;涉计算机视觉专利的IPC分类号主要包括:G06N与G06V。
[2] 《 中国人工智能专利授权及无效数据分析》,https://mp.weixin.qq.com/s/95mmYMJvgkImP2Gj25uFYA.
[3] 限于时间精力,所使用的IPC分类号包括:G06F(G06F16*、G06F17*、G06F30/27、G06F40*、G06F21/32)、G06N(G06N3*、G06N20*、G06N99*、G06N5* 、G06N7*)及G06V(G06V*、G06V30*).
[4]需说明的是,该统计分析结果仅针对特定类别的人工智能专利,不能等同代表全类别人工智能专利的授权确权情况。
[5]该专利数量的统计范围限于前述3750件专利。
[6]情形(1):涉及算法的各个步骤体现出与所要解决的技术问题密切相关;例如,算法处理的数据是技术领域中具有确切技术含义的数据,算法的执行能直接体现出利用自然规律解决某一技术问题的过程,并获得了技术效果。
情形(2):算法与计算机系统的内部结构存在特定技术关联,能够解决如何提升硬件运算效率或执行效果的技术问题,从而获得符合自然规律的计算机系统内部性能改进的技术效果。
情形(3):利用算法等挖掘数据中符合自然规律的内在关联关系,解决提升具体应用领域大数据分析可靠性或精确性的技术问题,并获得相应的技术效果。
[7]《人工智能发明的披露充分性》https://mp.weixin.qq.com/s/Qy9cIx-DlYnXlQJl-WlCxw.