浅谈人工智能模型的法律保护——全国首例未经许可使用他人模型结构与参数案件述评
浅谈人工智能模型的法律保护——全国首例未经许可使用他人模型结构与参数案件述评
2025年3月31日,北京知识产权法院对原告北京抖音科技有限公司诉被告亿睿科信息技术(北京)有限公司侵害著作权及不正当竞争纠纷一案作出二审判决,维持一审北京市朝阳区人民法院认定被告未经许可使用原告“变身漫画特效”模型构成不正当竞争,但不构成著作权侵权的判决。[1]本案亦是全国首例针对未经许可使用他人模型结构与参数行为作出侵权认定的生效判决。
一、案例简介
(一)事实概要
原告为抖音APP的运营者,开发“变身漫画特效”并上线于抖音APP,该特效可以将用户拍摄的真人照片、视频转换为漫画风格,被用户广泛使用。被告为B612咔叽APP的运营者,在抖音APP上线“变身漫画特效”之后,B612咔叽APP上线“少女漫画特效”。两款APP内置争议特效功能相似,同时处理相同照片能够得到相似的结果;作为对比,案外人开发的其他人像动漫化平台处理相同照片得到的结果与两款APP争议特效处理结果存在显著差异。
原告主张其开发之变身漫画成像是美术作品、视听作品,同时主张变身漫画特效对应之模型结构和参数系其核心竞争优势,受到反不正当竞争法保护,认为被告行为构成侵权,要求法院判令被告停止侵权、消除影响、赔偿损失500万元及合理开支24万余元。
原告开发特效对应模型的过程分为:①风格设定②风格化量产③模型训练④用户生成之四个阶段。①风格设定阶段,确定变身漫画成像标准为“像”(相似)和“美”。②风格化量产阶段,聘请手绘师对照Faceu软件[1]公开的5万余张真人照片以前一阶段设定的风格为标准绘制漫画。③模型训练阶段,在CycleGAN模型[2]的基础上调整结构与参数并使用前一阶段产生的真人照片和手绘师绘制的漫画进行训练,过程中反复调整模型结构、参数和输入真人照片和漫画的成对数据(如由手绘师手动修复模型无法调整的漫画瑕疵等)。④用户生成阶段,将训练好的模型供抖音APP调用,用户通过抖音APP使用“变身漫画特效”。该模型如输入内容相同则输出结果大致相同。
专家意见指出,案涉原告模型针对特定日本漫画风格迁移任务作了特定设计,与其他GAN模型在结构等方面存在明显不同,而原被告模型除部分细节存在对输出结果存在微小影响的差异外基本一致,原被告同时设计出相似模型的可能性较小。被告未提交充分的证明其独立研发和原被告模型存在实质性差异的证据。
(二)法院认为
关于著作权侵权,本案一审法院结合《著作权法》及其实施条例中“创作”的概念指出,著作权法意义下的创作行为不是单纯积累素材、数据、创造生成工具的行为,也不能是按照特定规则机械完成工作、缺乏创作空间的行为。前述第②阶段之风格化量产阶段属于积累数据的工作,第③阶段之模型训练阶段属于创造生成工具的行为;而第④阶段中,用户使用该特效生成的内容与真人存在唯一或有限的局限性,无法体现人的思想、情感与个性。因此,原告在四个阶段中均没有进行著作权法意义上的创作行为,变身漫画成像本身并非著作权法保护的客体。二审中由于原被告双方未对著作权问题提出上诉,二审法院未对著作权问题进行评价。
关于不正当竞争。二审法院在归纳适用《反不正当竞争法》第2条认定不正当竞争的要件的基础上进行了分析。其一,竞争关系上,原被告均通过APP为用户提供视频和照片的拍摄服务,具有直接竞争关系;其二,被诉行为不属于知识产权专门法保护及反不正当竞争法第二章规定的具体不正当竞争行为的情形;其三,被告使用了原告的模型结构及参数,并且该行为违反了人工智能模型领域公认的,不得未经许可直接使用他人通过数据训练改进而来的模型结构和参数的商业道德;其四,原告为案涉模型投入大量经营资源,模型为其取得了创新优势、经营收益和市场利益,原告享有受反不正当竞争法保护的合法权益;其五,原被告案涉产品效果相似,存在较强替代作用,被告对原告竞争利益造成了实质损害;其六,被诉行为扭曲了模型正常供求机制,如不规制则将助长“搭便车”行为,无法恢复扭曲的供求机制和创新机制,使市场激励机制失灵,扰乱人工智能模型领域的竞争秩序。二审法院基本确认了一审法院关于被告行为构成不正当竞争的认定,并据此维持一审法院判决。
二、人工智能模型的反不正当竞争法保护路径
本案中,法院适用《反不正当竞争法》第2条对原告主张的模型结构和参数进行了保护。在司法实务更多关注人工智能模型训练数据和生成内容本身侵权的当下,对于模型结构与参数本身的评价将具有更显著的意义。二审法院详细地列出了适用第2条进行保护的要件,并基于本案事实进行了具体分析,为人工智能模型的保护角度和方式开创了示范性先例,笔者认为亮点如下:
首先,法院肯定了人工智能模型开发者所应享有的反不正当竞争法上的合法权益的边界,即竞争利益不能通过给予宽泛的竞争优势或交易机会来推断,而是要具体结合人工智能模型开发者的实际开发投入、效果功能进行综合评价。这就要求人工智能模型开发者应当在维权过程中详尽对开发过程、开发投入以及基于模型结构和参数的应用产生的产品效果进行充分举证,而不能仅仅从产品本身推导出竞争性利益。
其次,法院以判决的方式明确了人工智能模型领域的商业道德标准,即“从事人工智能模型研发经营的企业不得未经许可直接使用他人通过数据训练改进而来的模型结构和参数”,本质上对人工智能领域“不劳而获”行为进行了否定性的商业道德评价。
第三,在行为事实是否成立的判断上,接触+实质性相似的基本法则同样适用于人工智能模型结构和参数比对领域,同时对于自主研发的举证责任同样归属于被告承担。
第四,实质性替代作用依旧是合法权益是否被损害的基本判断准则。只不过笔者这里需要强调的是,基于法院裁判的逻辑,实质性替代作用的判断不应拘泥于模型结构和参数本身,而是应当延伸至基于该模型结构、参数的特效产品。因为在判断用户群体、目标市场、产品提供途径等方面,只有商业化的产品才能发挥出价值衡量的尺度,而模型结构、参数的保密特性导致其价值衡量往往需要通过产品本身得出。
第五,人工智能模型市场竞争秩序的判断需要结合行为对市场运行的准入机制、供求机制、价格机制、信息机制、信用机制、创新机制等的影响进行综合判断,“搭便车”“不劳而获”型的侵权行为,往往对价格机制和创新机制的损害是最大且最为直接的。
那么这里可能会有一个疑问,本案为什么不考虑商业秘密的《反不正当竞争法》保护角度呢?目前对于人工智能模型的保护,似乎以商业秘密角度保护的呼声是最高的。笔者认为,本案通过商业秘密保护可能存在一个无法绕过的障碍,即在无证据证明被告系通过非法或员工跳槽等方式获取模型结构或参数数据的情况下,唯一相对合理的解释是“技术破解”,这也恰恰印证了法院的调查事实,即根据专家意见“技术人员可以通过技术手段提取模型本身并进行解密,从而获得模型的结构和参数”。而技术性破解往往会落入“反向工程”的范畴[4],这恰恰是商业秘密侵权案件中法定的可抗辩胜诉角度之一,原告没有选择商业秘密的保护路径至少对于本案来讲是十分合理且审慎的。
三、人工智能模型的著作权保护路径
本案原告在著作权保护上主张了模型输出结果的美术和视听作品的保护角度。对此,一审法院完整地评价了模型开发应用全阶段的各行为均非著作权法意义上的创作行为,并未予以支持。如在②风格化量产阶段,虽然输入的数据系用户拍摄的照片,可能具有一定独创性,且手绘师依据真人照片绘制的漫画单独来看同样可能具有一定独创性,进而受到保护,然而相关工作整体对于模型本身而言属于“积累数据的工作”。再如④用户生成阶段,用户在具体使用案涉特效时,本身是拍摄照片或视频的过程,该过程产生的照片或视频可能具有独创性,然而用户拍摄真人照片或视频也与成像效果存在唯一或有限的对应性,成像本身无法体现人的思想、情感与个性。笔者赞同法院关于著作权问题的论述,但如果抛开原告主张的权利作品类型,而仅从模型角度思考,模型本身是否可以类比计算机软件作品予以保护呢?这确实是一个值得深入思考的问题。
计算机软件作品本身在著作权法各例示作品中的地位便并不寻常——计算机软件本身就是极为特殊的一类作品。计算机软件的作用不是展示文学、艺术和科学美感,传递思想感情或特定信息,而是指挥计算机完成任务,对于其保护方式早期亦存在较大争议。[5]美国Boudin法官曾指出“将版权法适用于计算机程序就像是在拼接一个各部分之间无法适应的七巧板。”[6]假设将真人照片转换为漫画的工具不是人工智能模型而是传统的计算机软件(例如Photoshop等传统计算机软件也可以通过风格化滤镜等传统图像操作实现真人漫画化),则开发该类计算机软件的过程也属于创造生成工具的行为,此时除非出现算法与计算机语言表达的混同,则恐难以否定该类计算机软件受到著作权法保护。从用户角度看,在“黑箱”的处理过程中,对于类似的输入,模型和传统计算机软件都能给出一定的输出,如此讨论模型与传统计算机软件的区别便存在价值。
如前文所述,计算机软件是指挥计算机完成任务的工具。在生成式人工智能迅猛发展之前,传统计算机软件通常由人类手动编写。亦即,人类根据计算机程序语言和编码规范将算法转写为源代码形式,对于固定的输入,传统计算机软件可以给出固定或符合预期的输出;但对于人工智能模型,则更多是事先以大量的输入和输出使得人工智能模型拟合出逻辑的过程。
视语言性质,传统计算机软件中的源代码可能编译为二进制目标程序,对于目标程序,虽然人类不可直接轻易识读但其与源代码相对应,法律对此给予等同保护。《计算机软件保护条例》第3条第1项对此有明确规定。模型和目标代码同样作为人类难以轻易识读的二进制文件形式,对于模型结构部分,模型开发的结构设计阶段是高度要求设计者创造性和智力的阶段,暂且不提模型的最终使用需要传统计算机软件的配合,模型这一二进制文件同样需要通过传统源代码等表达形式定义结构,虽然在可逆性与确定性上存在差异且模型包含参数部分,这一过程存在类比为源代码编译为目标代码的过程可能性。司法当前热议的提示词与生成内容关系的案例或亦可作一定类比:如承认详尽的、具有独创性的提示词生成的内容可以受到保护,则定义结构的代码到模型文件的过程或许也存在一定相似之处。
而对于参数部分,笔者试以简单的数学函数打一个极为粗略且不尽精确的比方:传统计算机软件中,人类程序员首先选定了一种结构形式(如y=f(x)=ax+b),由人类程序员通过计算机程序语言告知计算机参数a与b究竟为何,计算机软件即可根据每次不同的x的输入给出y的值的输出;然而在人工智能模型层面,对于人类首先选定的结构(此处同样使用y=f(x)=ax+b粗略举例,实际远比该示例复杂),人类以大量成对的x和y进行训练以便其拟合出合适的a和b的值,最终得到二进制形式的模型文件。基于著作权法对计算机软件作品保护的代码表达确定性视角来看,训练的结果和编写的结果相比,模型参数确实存在著作权法层面保护的弱势。
诚然,根据著作权法原理,著作权法不保护算法本身而保护程序本身的表达(无论是源程序还是目标程序)。即使是传统计算机软件,其最具价值的设计思想和实用性功能也未得到著作权法层面的保护,对于模型而言本身亦是如此,但亦以计算机软件作品代码保护形式类推对其结构进行一定程度的保护,以防止他人接触后使用,可能存在一定的可行性和探讨空间。
四、本案延伸问题的讨论
(一)开源模型问题
传统开源许可证本是针对传统计算机软件设计的,虽然也存在将其用于计算机软件作品之外的其他作品的情况,但将其用在模型之上也存在一定贴合性。[7]如前文所述,本案原告选用的开源模型适用的许可证本身条件非常宽松。一审法院以被告未提交证据证明涉案开源模型属于强著作权许可类型,因此对被告关于GAN模型的答辩意见未予采纳。[8]
传统软件即使涉及输入和输出,其输出权利归属亦通常不存疑问地与输入一致。在生成式人工智能迅猛发展且AIGC权利归属规则尚不完全明朗的当下,CreativeML Open RAIL-M等许可证专门针对模型的许可作出了安排,并设置了关于模型输出内容权属的特别约定。在传统计算机软件视角下,开源许可证系对著作权许可问题作出安排疑问不大[9],但由本案延伸讨论,在本案适用《反不正当竞争法》第2条时二审法院归纳的各要件下,其他违反开源许可证使用他人开源模型的行为是否可能被评价为违反人工智能模型领域的其他商业道德?对权利人维权会导致什么样的后果?也是非常值得思考的问题。
(二)模型训练数据合法性问题
全球视域内已有多起案件涉及数据权利人起诉模型开发运营企业未经授权使用其数据。我国被称为“全球首例生成式AI服务侵犯著作权的生效判决”的AI形象侵权一案中,AIGC平台应原告方“生成A”的简单提示词要求即生成出A的形象,平台最终被法院判决侵权。[10]该案涉及训练数据本身侵权问题,权利人基于训练数据本身主张权利。然而,假设有充分的证据证明模型基于存在权利瑕疵的数据训练,其模型的结构与参数是否还能得到保护呢?
本案中被告辩称原告适用非法获取的数据进行训练获得的竞争性利益不应受到保护。一审法院认为该问题不影响本案评价,二审法院指出被告未提交证据证明,人脸照片数据与人工智能模型的结构和参数之选择和使用直接相关,进而均未支持被告这一抗辩。
在传统著作权法领域,即使是基于他人作品进行未经授权的改编,法律依然承认未经授权改编后的作品权利存在,未经许可他人不得使用。虽然模型开发训练者完全可以购买或通过其他渠道获取,并使用权利完全无瑕疵的类似质量的成对数据得到相似的模型结构与参数,且模型结构与参数本身不会包含训练中使用的成对数据,但训练数据与模型本身结构重要性不相上下的语境下,使用有权利瑕疵的数据可能使得模型训练者得到节省开发训练资源的“搭便车”的效果。瑕疵训练数据是否将对其竞争性利益产生足以否定该利益存在的影响,可能仍需个案具体衡量。或许可以类比的是,在传统著作权法语境下,改编作品确实能够形成新的作品权利内容,但基于公平诚信角度考虑,改编作品的使用同时也不得侵害原作品权利人的合法权益。基于这个角度,瑕疵训练数据训练所形成的人工智能模型或参数本身或许仍旧能够获得反不正当竞争法项下的权益内容之司法认可,但瑕疵可能将对其维权或多或少产生行权障碍,比如无法获得侵权禁令甚至赔偿等,对此人工智能模型的开发企业应当值得关注。
[注]
[1] 北京知识产权法院(2023)京73民终3802号民事判决书。可参见知产宝:《典型案例 | 全国首例!北京知识产权法院:未经许可直接使用他人训练模型的结构与参数构成不正当竞争行为》,https://mp.weixin.qq.com/s/0ryGs8-97p0sObhjwpl-jg。
[2] 由原告关联公司开发运营的自拍APP。
[3] 一款开源图像到图像转换模型,例如可以实现将图片中的马转换为斑马、风景图季节由夏天转换为冬天等。模型介绍详见https://github.com/junyanz/CycleGAN。该模型适用较为宽松的许可证,仅要求保留版权声明、许可证和免责声明即可再行分发该模型,无论是否进行了修改。判决中显示的本案最终选用的pix2pix模型亦采用相同条件。
[4] 虽然学界可能对此有不同的声音,但笔者仅从审慎角度予以推断原告维权角度选择的可能性供读者参考。
[5] 王迁:《知识产权法教程》(第七版),中国人民大学出版社2021年版,第135页。
[6] “Applying copyright law to computer programs is like assembling a jigsaw puzzle whose pieces do not quite fit.” See 49 F.3d 807, 34 U.S.P.Q. 2d (BNA) 1014, 1995 WL 94669, 1995 U.S. App. LEXIS 4618.
[7] 许可人完全可以选择GFDL及Creative Commons系列许可证用以开放许可文字作品等传统作品类型,但将用于计算机软件的开源许可证用于文字作品等其他传统作品类型的情况,可参见如https://www.gnu.org/licenses/gpl-faq.html#GPLOtherThanSoftware,并非完全不可行。
[8] 虽然我国司法实务针对开源许可证的讨论通常均针对GPL等具有传染性、条件较为严格的许可证展开,但对于仅具有署名等类似宽松要求的许可证在违反时同样可能存在达到解除条件成就或合同自始不生效的效果的空间。
[9] 例如广州知识产权法院(2019)粤73知民初207号民事判决书认为GPL是附解除条件的著作权许可格式合同。
[10] 广州互联网法院(2024)粤0192民初1xx号民事判决书。