以全球范围AIGC诉讼为例梳理AIGC的侵权认定和权利限制规则
以全球范围AIGC诉讼为例梳理AIGC的侵权认定和权利限制规则
AIGC的迅速发展已在全球范围内引发海量AIGC诉讼案件,而从所涉权利类型来看,大致可分为4类:(1)AIGC平台或AIGC产品用户起诉他人使用其通过AIGC产品生成内容而侵权;(2)原权利人起诉AIGC平台将其权利内容用于训练而侵权;(3)平台用户起诉平台擅自使用其上传至平台的内容而侵权;(4)人格权益权利人起诉AIGC平台侵权。
一、全球范围内涉及AIGC的诉讼案件分类梳理
1、AIGC产品生成内容的权利人对外维权
此前,针对主流AIGC产品生成内容的约定模式,笔者此前已发表《以全球主流AIGC产品用户协议为例梳理AIGC生成内容的权利归属与使用限制》一文进行分析。通观全球范围内的AIGC产品,基于商业及风险控制的考量,AIGC平台可以按不同模式与用户约定相关生成内容的权利归属:①用户拥有所生成内容的所有著作权,平台可以或不可以在一定条件下使用;②平台拥有所生成内容的所有著作权,用户可以在一定条件下使用;③用户与平台共有所生成内容的所有著作权,用户和平台可以在约定的条件下使用;④平台与用户约定所生成内容著作权流入到公共领域,任何人都可以进行参阅。笔者认为,在平台全部或部分拥有AIGC产品生成内容的著作权时,即使法院贯彻“工具论”视点认为用户原始地、完整地拥有AIGC产品生成内容的著作权,平台与用户的协议也有效地将权利的全部或部分继受地转让给平台或释出到公共领域。同理,即使法院认定平台也参与了作品的创作而应作为AIGC的作者或共同作者,协议对权属的约定仍优先,由此,主流AIGC产品生成内容的权利人一般是平台用户,用户则是此类诉讼案件的主要原告。
在中国既有的侵权诉讼案例“春风送来了温柔”一案[1]中,法院贯彻了“工具论”的观点,认定原告在AIGC平台上所选择、编排的提示词,使用的参数、选定具体图片等的行为体现了原告的智力投入,体现了原告的审美选择和个性判断,具有独创性。在生成式人工智能大规模发展前,某计算机写作辅助系统著作权权属[2]一案中,法院也进行了近似说理。
美国版权局已拒绝对数件AIGC进行版权注册,但承认如用户使用的提示词较为复杂时,提示词本身可以作为文字作品受保护;亦承认人类可以通过对AI生成内容进行选择或安排的方式使最终完成的作品作为整体取得人的独创性,并对应获得版权保护。美国版权局鼓励作者主动披露提交注册的作品中人类参与创作的程度,以促使其作品得到注册。[3]例如,Elisa Shupe使用ChatGPT完成小说AI Machinations: Tangled Webs and Typed Words,该小说被美国版权局拒绝版权注册申请。但后续在布鲁克林法学院提供的专业支持下, Shupe通过行政复议最终获得了对小说整体版权的注册。[4]然而,前述观点和案例并非承认AIGC的文字或图片本身作为文字作品或美术作品受保护,相对而言保护范围更小,这与前述中国既有侵权案例的法院认定存在一定差异。若个案中用户采用的提示词非常简短而难以被认定为具有独创性,在采纳人工智能不能作为著作权主体这一观点的前提下,相关作品可能被认定不具有独创性而不受保护,此时著作权权利自始不存在,无论平台与用户如何约定著作权归属均无效,对于他人未经授权使用相关内容的行为,平台与用户也无法主张著作权侵权。此外,如第三人仅复制传播相关AIGC中仅由AI生成的部分而非作品整体等能够体现作者选择或安排的部分,作者亦无法对该第三人主张权利。
意大利法院在RAI Radiotelevisione v Chiara Biancheri案中认为该案中借助软件创作的数字花卉受著作权保护,其指出使用软件创作作品的行为本身并不会导致作品不受著作权法保护,判定软件的输出结果是否受保护需要确定人类的创造性输入是否存在及多大程度上存在。只要作品展示了可被外部世界感知的人类创作行为,即便是微小的,它就符合法律所保护的范畴。[5]虽然该案发生在生成式人工智能快速发展前且本身与人工智能关系不大,但意大利法院在本案的说理可供将来AIGC相关案件参考。
在捷克,一原告声称其为通过AIGC平台创作的图像的作者,要求法院确认其作者身份,并要求被告从其网站上删除涉案图像。法院认为,原告未能提供证据证明其是人工智能创造的图像的作者,也未能证明图像是根据其具体任务创造的;此外,该人工智能创造的图像不符合法律所指的版权作品的概念特征,因为其不是自然人创作活动的独特结果。 捷克法院的判决对纯AIGC的可版权性采取了否定的观点。
2、原权利人主张AIGC产品使用其内容进行数据训练侵权
在中国,被称为“全球首例生成式AI服务侵犯著作权的生效判决”的AI奥特曼侵权一案中,AIGC平台应原告方“生成奥特曼”的简单提示词(prompt)要求即生成出奥特曼形象,平台最终被法院判决侵权。[7]而AI奥特曼侵权案即涉及训练数据侵权问题。此外,北京互联网法院于2024年6月20日开庭审理了全国首例涉及AI绘画大模型训练著作权侵权案。[8]中国针对训练数据侵权的案例的审理及此后权利限制立法动态值得进一步关注。
除前述两起案件外,美国有关训练数据侵权进而起诉AIGC平台的案件数量较多,例如,Getty Images (US), Inc. v. Stability AI, Inc.,Getty作为全球性的图片平台,指控被告AIGC平台将其权利作品用于训练;Tremblay v. OpenAI, Inc.,原告是个人作家,指控OpenAI未经授权使用其作品用于训练;Kadrey v. Meta Platforms, Inc.,原告指控Meta在其大型语言模型LLaMA的训练过程中未经授权使用了原告的作品。(本文章后附有相关案例简介供参阅。)而除文字与图像平台外,2024年6月24日,美国环球音乐、华纳音乐、索尼音乐等音乐公司提起了对AI音乐生成平台Suno[9]及Udio[10](后者公司名为Uncharted Labs)的诉讼。而该等权利人主张AI音乐生成平台侵权的案例亦值得进一步关注:相关案件与既有其他生成内容(文字、图像等)的案件存在哪些共性?各自又有哪些特征?
3、平台用户主张AIGC平台违约
与前述案件性质稍有不同的是美国Doe v. G平台案。本案中,原告提起集体诉讼,主张被告运营G平台的公司及其关联公司使用用户上传到平台上的源代码进行AI代码生成工具的训练。鉴于G平台用户协议明确:对用户上传内容的权利归属约定为用户享有权利,平台仅就用户上传内容拥有运营所需的权利;如用户已经选择了一种开源许可证,则适用该许可证。虽然开源许可证给出的条件大多非常宽松,但绝大多数开源许可证均要求为作品署名,而AI生成的代码并不会为作为其代码直接来源的训练数据署名,故本案中原告除主张与其他AIGC案件相似的侵权外,还主张被告违反用户协议(违约)。[11]此案同时警示了拟采用自家运营平台数据训练的公司在用户协议中约定相关内容权属及明确可将用户内容将用于AI训练的重要性。
4、人格权益权利人主张人格权
2024年3月,美国田纳西州众议院通过了《确保肖像、声音和图像安全法案》(Ensuring Likeness, Voice and Image Security Act)。法案于同年7月1日生效。该法案规定“每个人都享有在任何媒体上以任何方式使用其姓名、照片、声音或肖像的财产权”。“声音”作为本法案的重点,“照片、声音或肖像”取代了原有多数规定中的“照片或肖像”。该法案中,“声音”定义为某一媒介中可轻易辨认并可归属于某一特定个人的声音,无论该声音是包含该个人的真实声音还是模拟声音(the actual voice or a simulation of the voice)。该定义虽然没有直接指明AIGC场景,但“模拟声音”这一列举显然使得该法案的保护范围及于AIGC场景。
2024年4月,北京互联网法院公开宣判全国首例AI生成声音人格权侵权案,明确认定在具备可识别性的前提下,自然人声音权益的保护范围可及于AI生成声音。同时,即使取得了包含相关声音的作品或制品的著作权或邻接权,亦不能在未取得人格权益授权时直接将其用于AI训练并生成新的声音。[12]
在美国,2024年5月16日,配音演员Paul Skye Lehrman及Linnea Sage对AI公司LOVO提起诉讼称其AI文字转声音功能未经授权使用了其声音,该案尚在进一步审理过程中。[13]作为以AI技术创建“数字人”的案例,在Main Sequence, Ltd. v. Dudesy, LLC案中,原告起诉被告在未经其授权的情况下擅自使用AI以已故喜剧演员George Carlin的风格和声音创作喜剧节目I'm Glad I'm Dead。[14]2024年6月,被告在该案中已被发布永久禁令,禁止发布相关内容。隐私权方面,目前在侵犯用户隐私权领域具有代表性的案件为Clearview AI, Inc. v. Consumer案。本案中,多名消费者共同起诉Clearview,声称其在未经同意的情况下,非法采集和使用了消费者在社交网站上的照片,违反了《伊利诺伊州生物识别保护法》(Illinois Biometric Information Privacy Act)。[15]除此之外,美国还存在AI生成关于名人的虚假内容被起诉诽谤的案例。[16]
不同于著作权中涉及的AI创作主体问题,在AI的语境下,人格权益的保护本无特殊之处,前述法案或案例并未突破既有理论,一定程度上符合预期,其再次确认了声音权益等人格权益的保护同样及于AI时代的相关行为。
二、著作权与反不正当竞争法上请求权的竞合
前述案件除主张著作权保护外,亦有可能通过反不正当竞争法展开诉讼。例如,在中国的新闻爬取案中,原告系新闻平台的运营者,在2020年至2022年间花费上千万元向几十家媒体采购了大量新闻资讯。被告实时抓取包括原告运营的新闻平台在内的上千家网络媒体的各类新闻信息,在进一步智能去重后,在涉案产品新闻栏目中直接向网络用户提供。法院认为无论单条新闻数据是否构成作品,均不影响其整体作为数据集合成为数据权益的保护客体,其具有巨大的商业价值,能够为原告带来竞争优势,被告行为属于不正当竞争,需赔偿原告100万元。[17]本案中,原告对相关新闻享有全部或部分著作权,或得到了有关许可,可能可以基于著作权上的请求权提起诉讼;而正如法院的判决,其亦可以基于反不正当竞争法上的请求权提起诉讼。此乃请求权的竞合。前述Silverman v. OpenAI案及美国发生的多起AIGC著作权诉讼中,原告亦提起了基于不正当竞争的主张。
本文认为,在前述被训练的原作品权利人起诉的情境及中国法律语境下,如拥有经营者身份的原告的大量作品被AIGC平台未经授权用于训练,或是原告系某个拥有维权权利的作品集合平台,则确存在其以《反不正当竞争法》第2条等条款作为请求权基础提起反不正当竞争诉讼的可能。基于前述中国的案例,其可能不需再分别对单个作品进行逐一举证。不过,具体涉及AIGC的反不正当竞争诉讼是否同样适用整体判断的裁判规则,还有待进一步观察。此外,由于存在知识产权专门法与反不正当竞争法竞合时对立说、补充说、平行说的争议[18],在原告明确拥有基于著作权的请求权时,法院是否允许其直接以不正当竞争为由起诉,亦有待进一步观察与讨论。
三、侵权认定及权利限制规则分析
笔者认为,在原作品权利人起诉的场景下,只要主张权利的原作品满足著作权法上有关作品的要件,便只需讨论被告是否对原告作品进行了著作权法意义的使用及是否存在权利限制情形,而与AIGC本身的权属问题无涉。
著作权侵权判定通常遵循“接触+实质性相似”的规则,在现有立法下,这一规则的适用在AIGC相关著作权诉讼案件中也不例外。在“实质性相似”这一要件中,AIGC的著作权诉讼案件相比一般的著作权诉讼案件并不存在特殊性。对于“接触”要件,纵观既有的司法案件,原告通常均通过测试相关模型能否输出自己享有权利的内容来辅助证明。日本文化厅的相关讨论还提出了“只要AIGC与原作品实质性相似,就应当推定‘接触’要件成立,此后被告可以通过证明原作品没有对AIGC的产生作出贡献推翻该要件的成立”的观点。[19]在美国Andersen v. Stability AI Ltd.[20]及Silverman v. OpenAI[21]等案件中,原告在起诉状中也使用了类似方法进行证明,前者使用相关的提示词要求作画获得了与原作品基本一致的生成结果,而后者使用如“详细概括XX小说的第一部分”作为提示词获得了ChatGPT生成的详细摘要。对于前者,原告还提交了其具体作品确实被包含在训练数据集中的证据,这对于“接触”要件的证立更为有利。[22]
而通观全球范围的相关诉讼案例,被告一般会以管辖错误、原告主张权利的作品未注册[23]、原告未指明具体被侵权作品等程序或实质理由进行抗辩,而合理使用抗辩则较为可能获得支持。但权利限制规定上,中国《著作权法》中对于权利限制采取了封闭式的立法模式且暂无专门针对AIGC或与之高度相关的数据处理方面的权利限制规定。在域外,美国存在适用《版权法》第107条(17 U.S.C. 107)四要素[24]合理使用抗辩的可能,这实际上也是诸多实际诉讼案件中被告采取的抗辩之一,但是否能够实际适用,还有赖相关案件判决的进一步判断;日本2018年修改后的《著作权法》第30条之四规定不以享受作品中表达的思想或感情为目的时,可以对作品进行信息解析等不伴随自然人知觉识读的计算机处理,前提是不能对著作权人利益造成不当损害。这为AI大模型的训练提供了著作权权利限制的依据,但前述前提的存在仍被指责较为模糊[25],且理论上仍不能适用于AI输出内容包含涉嫌侵权内容的情形;欧盟于2019年3月发布了《单一数字市场版权指令》(Directive on Copyright in the Digital Single Market, 2016/0280(COD)),指令第4条明确成员国应将以文本和数据挖掘为目的对可合法访问的作品或其他内容进行复制与提取的行为,规定为文本与数据挖掘版权例外,但权利人可以声明保留。这实际上赋予了在数据处理阶段使用行为的合法性,但成员国可以对指令的要求作出进一步细化。
此处,本文将通过美国一个实际案例再对权利限制规则进行解析。虽Thomson Reuters v. ROSS Intelligence一案起诉于生成式人工智能快速发展之前,但本案涉及将数据用于机器学习,对生成式人工智能案例具有较大参考意义。本案中,原告Thomson Reuters拥有知名综合性法律数据库Westlaw。原告称被告ROSS Intelligence非法复制Westlaw的案例摘要等内容训练AI产品。被告主张了合理使用抗辩。针对合理使用,本案讨论指出,被告的使用无疑是商业性质的,但作品转换性使用程度强时,使用是否为商业性质在判断是否构成合理使用上的重要性更弱,因此需着重关注本案被告的转换性使用程度。本案回顾了Sega Enterprises Ltd. v. Accolade, Inc., 977 F.2d 1510 (9th Cir. 1992) 及Sony Computer Entertainment Inc. v. Connectix Corp., 203 F.3d 596 (9th Cir. 2000) 等案件中有关中间阶段使用的主张,这些案件为AI最终生成内容与其学习的受版权保护的作品并不实质相同的情况提供了支持,但被告行为性质是否前述案件相似,仍有赖于进一步的事实认定。此外,有关公共利益的讨论亦需十分慎重:允许AI使用受版权保护的作品训练是否符合公共利益?作品权利人可能以对作品的保护激励和对原始内容创作者的利益保护作为抗辩理由,AI平台可能抗辩称通过AI等技术公众获取到相关信息将更为便捷——AI的价值恐仍需通过转换性程度、公众是否可免费使用、是否侵占创作者的市场等因素来认定。[26]在生成式人工智能时代下,OpenAI等头部生成式人工智能企业亦频频援引合理使用抗辩。[27]法院在此后给出的结论将很大程度上影响相关企业的发展。
扫描二维码可查看
附件:全球范围AIGC著作权诉讼案件简介
*由于文件较大,缓存需要时间,
扫描二维码后请稍等片刻
[注]
[1] 北京互联网法院(2023)京0491民初11279号民事判决书。
[2] 广东省深圳市南山区人民法院(2019)粤0305民初140xx号民事判决书。
[3] See Copyright Registration Guidance for Works Containing AI-Generated Material, available at https://www.govinfo.gov/content/pkg/FR-2023-03-16/pdf/2023-05321.pdf; THALER v. PERLMUTTER, 1:22-cv-01564, (D.D.C.); Re: Second Request for Reconsideration for Refusal to Register Théâtre D’opéra Spatial (Sep. 5, 2023), https://www.copyright.gov/rulings-filings/review-board/docs/Theatre-Dopera-Spatial.pdf; Re: Second Request for Reconsideration for Refusal to Register SURYAST (Dec. 11, 2023), https://www.copyright.gov/rulings-filings/review-board/docs/SURYAST.pdf; and Re: Zarya of the Dawn (Feb. 21, 2023), https://www.copyright.gov/docs/zarya-of-the-dawn.pdf.
[4] Kate Knibbs, How One Author Pushed the Limits of AI Copyright, https://www.wired.com/story/the-us-copyright-office-loosens-up-a-little-on-ai/. See also Detailed Record View of Registration record TX0009377452, https://publicrecords.copyright.gov/detailed-record/36317712.
[5] Supreme Court of Cassation, Civil Division, Section 1 (Corte Suprema di Cassazione, Sez. 1 Civ.) 16 January 2023 – 1107/2023.
[6] S. Š. v. TAUBEL LEGAL, č. j. 10 C 13/2023- 16.
[7] 广州互联网法院(2024)粤0192民初1xx号民事判决书。
[8] 参见北京互联网法院:《北京互联网法院开庭审理全国首例涉及AI绘画大模型训练著作权侵权案》,2024年6月20日,https://mp.weixin.qq.com/s/cyskAz1cASBaNIYQpGpGsA。
[9] UMG Recordings, Inc. v. Suno, Inc., 1:24-cv-11611, (D. Mass.)
[10] UMG Recordings, Inc. v. Uncharted Labs, Inc., 1:24-cv-04777, (S.D.N.Y.)
[11] Doe 3 v. G*, Inc., 4:22-cv-07074, (N.D. Cal.)
[12] 参见北京互联网法院:《全国首例AI生成声音人格权侵权案一审宣判》,2024年4月23日,https://mp.weixin.qq.com/s/_GxGaG6Q2NYHJWQuOtMyrQ。
[13] Lehrman v. Lovo, Inc., 1:24-cv-03770, (S.D.N.Y.)
[14] Main Sequence, Ltd. v. Dudesy, LLC, 2:24-cv-00711, (C.D. Cal.)
[15] In Re: Clearview AI, Inc., Consumer Privacy Litigation, 1:21-cv-00135, (N.D. Ill.)
[16] Mark Walters v. OpenAI, L.L.C., 23-13843, (11th Cir.)
[17] 参见天津高法:《勿让“爬虫”变“害虫”,肆意爬取数据涉不正当竞争》,2023年8月7日,https://mp.weixin.qq.com/s/E0gr90Y1UEdIanJ9UUV9OA。
[18] 对立说认为,知识产权专门法保护的,反不正当竞争法不再保护;补充说认为,反不正当竞争法补充保护知识产权专门法保护范围外的部分;平行说认为二者平行保护,互不排斥、影响。
[19] 文化庁著作権課「令和5年度 著作権セミナー AIと著作権」48頁(2023年6月)(https://www.bunka.go.jp/seisaku/chosakuken/pdf/93903601_01.pdf)。
[20] Andersen v. Stability AI Ltd., 3:23-cv-00201, (N.D. Cal.)
[21] Silverman v. OpenAI, Inc., 3:23-cv-03416, (N.D. Cal.)
[22] See Exhibit B (Plaintiff Images in LAION-400M), Andersen v. Stability AI Ltd., No. 3:23-cv-00201, Doc. 129-2 (N.D. Cal. filed Nov. 29, 2023), available at https://storage.courtlistener.com/recap/gov.uscourts.cand.407208/gov.uscourts.cand.407208.129.2.pdf.
[23] See 17 U.S.C. 411(a).
[24] 即考察使用目的及性质(包括系为商业目的或非营利教育目的)、被使用的作品性质、所使用部分的实质性及其在作品中所占比例、使用结果对作品潜在市场与价值的影响。
[25] 官方资料解释称是否构成该前提的例外情形,具体应交由司法具体个案判断,标准大致是判断是否对作品原有市场造成了替代,并举例称目的本为信息解析用的数据库商品不能依该条复制并进行信息解析。文化庁著作権課「デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定に関する基本的な考え方」9頁(2019年10月24日)(https://www.bunka.go.jp/seisaku/chosakuken/hokaisei/h30_hokaisei/pdf/r1406693_17.pdf)。
[26] Thomson Reuters Enterprise Centre GmbH v. ROSS Intelligence Inc., 1:20-cv-00613, (D. Del.)
[27] 如前文所述的Silverman v. OpenAI案等。
[28] 原告也在英国起诉。See [2023] EWHC 3090 (Ch).