浅议AI文生图的可版权性问题
浅议AI文生图的可版权性问题
在“大数据+大模型+大算力"的架构下,以ChatGPT为代表的人工智能大模型已经可以协助用户完成诸多复杂任务,成为人们提高工作效率的首选工具。由此衍生的有关人工智能生成物(AIGC)的可版权性问题也引发了广泛热议。本文将以近期北京互联网法院作出的AI文生图著作权侵权纠纷案判决为起点,探讨影响AI文生图可版权性的主要因素。
一、司法实践立场
北京互联网法院在2023年11月27日作出的“AI文生图著作权纠纷案"(“春风图案")判决书中,首次在司法层面认可了AI文生图的可版权性,支持原告拥有AI文生图《春风送来了温柔》的著作权的主张。在该案中,原告通过某社交平台发布了一张由开源软件生成的AI文生图,而被告在其某内容创作平台账号发布的诗歌文章中未经原告同意使用了截去署名水印的涉案图片。因此,原告诉至法院,主张其拥有涉案AI文生图的著作权,并指称被告侵犯了其署名权及信息网络传播权。
在判决书中,法院在现行《著作权法》的框架下,从“是否属于文学、艺术和科学领域内"“是否具有一定的表现形式"“是否属于智力成果"“是否具有独创性"四个方面,深入剖析了涉案AI文生图的可版权性问题。尽管法院强调对该问题作出认定应建立在个案分析基础之上,但其在判决书中表露出来的“相对较低"的认定门槛也释放出了中国法院认定AI文生图属于著作权保护客体的积极信号,为今后类似案件的处理提供了良好参照。
二、认定难点和争议
相较于北京互联网法院在“春风图案"中的认定思路和结论,美国版权局及法院对于AIGC是否构成作品这一问题明显持有更为审慎的态度,迄今已在多个版权登记申请案例中否认AIGC的可版权性,作出与中国目前司法实践相反的认定。在法学理论和实务领域,支持者主张著作权分析框架应“宽进宽出"以起到鼓励作品创造和传播的立法目的,而质疑者则提示版权认定应维持一定门槛以确保可版权作品的质量。这些争议和分歧在人工智能时代显得尤为瞩目,如何应对这些“科技与狠活"给版权体系带来的挑战也成为如今全球面临的共同难题。
在版权构成要素方面,由于AI文生图同样由线条和色彩构成,呈现形态与传统美术作品无实质差异,并且系基于用户端输入的文本指令生成,因此通常容易满足“艺术领域"“具有一定表现形式"和“智力投入"三个要件。但是,AI文生图是否具有“独创性"是实务中的认定难点,本文将着墨于此,重点讨论作品独创性及与之相关的问题。
(1)关于独创性
独创性是作品构成要件中最重要的因素,也是作品体现创作者思想和情感的内在要求。目前我国现行法律未明确定义何为作品的“独创性",仅最高人民法院在《关于审理著作权民事纠纷案件适用法律若干问题的解释》第十五条中对此进行了语义解释,即作品应系“独立完成"并且具有“创作性"。“独立完成"是一个客观指标,司法实践中通常较为容易认定;而“创作性"的认定则带有主观色彩,并无明确的法律边界,法官需要结合全案证据进行综合考量。
在“春风图案"中,北京互联网法院认为作品的“创作性"应体现出作者的个性化表达。在AI文生图场景下,用户利用大模型生成图片时输入的文本指令越具有差异性,对画面元素、布局构图描述越明确具体,越能体现出用户的个性化表达。因此,法院着重考察了涉案图片的生成过程细节,认为原告对于图片人物及其呈现方式等画面元素通过提示词进行了设计,对于画面布局构图等通过参数进行了设置,体现了原告的选择和安排;而随后屡次增加提示词、修改参数的调整修正过程则体现了其审美选择和个性判断。这些选择、判断和安排使得涉案图片与其他作品存在明显差异性,体现了原告的个性化表达,因此具备“独创性"要件。
在不考虑是否“有人创作"这一点的情况下,AIGC可能具有“独创性(差异性)"已在多个司法案例中被中国法院所认可[1]。但是,由于在我国人工智能模型自身成为创作者存在法律逻辑障碍,因此AIGC所蕴含的独创性成分中有多少来源于人的智力投入,从而使得输入指令的用户有资格成为AIGC的著作权人则成为认定难点。这个问题本质上也是版权认定的“老问题"——独创性要件应以“有无"还是“高低"为判断标准。在“春风图案"中,北京互联网法院倾向于认为不宜为独创性要件设定过高的认定门槛,其认为AI文生图本质上是人利用工具进行创作的作品,创作过程中进行智力投入的是人而非人工智能模型。因此,即使随着人工智能的发展迭代,人在AIGC中的投入越来越少,但只要其仍然体现了人的独创性智力投入,就不应影响其生成的作品适用著作权制度加以保护。
美国的版权登记情况呈现出与中国司法实践完全不同的结果,迄今为止美国版权局尚未在版权登记案例中承认AIGC的可版权性。对于独创性要件,美国版权局在2023年3月发布的《版权登记指南:包含AI生成材料的作品》[2]中阐明了认定原则:若AIGC是在人类主导及机器辅助下完成,则可具有可版权性;若AIGC包含的版权传统元素(如内容的选择和安排)实际上由机器而非人类进行构思和执行,则不具有可版权性。该指南所显露出来的“人类投入应显著大于机器投入"的独创性要求,也实际体现在了美国版权登记案例中。在“太空歌剧院案"[3]中,美国版权局拒绝了Jason Allen通过使用AI大模型Midjourney创作的一幅名为《Théâtre D’opéra Spatial》图像的版权登记申请,认为该幅图像中包含的AI生成内容已经超过最低限度,因此不能将其整体登记为作品。尽管Allen主张其在图像生成过程中至少输入了624次文本指令,并且使用Photoshop和Gigapixel等图像处理软件对初始图像进行了调整处理,但美国版权局仍然认为这并不足以证明Allen有足够多的独创性智力投入。
上述案例体现了美国版权局在AI文生图的独创性方面近乎苛刻的认定标准,其重点关注AI模型的运行逻辑和功能,并且似乎十分在意AI文生图中人类投入和机器投入的“相对比例"情况,只有当人类投入达到“主导地位"而机器投入仅起到辅助作用时,AIGC才具有可版权性。事实上,在目前AI大模型的技术架构下,AI文生图在很多方面展示了人类与机器共同创作、协同交互的可能性,人类投入和机器投入的边界变得模糊,分清主次也愈发困难。在多次繁复的交互过程中,人类输入的文本指令与AI大模型基于海量数据、算法和算力给出的反馈相互交织,所生成的图像质量不断迭代。因此,若用户所提供的文本指令和参数、选择和安排造就了AI文生图的独创性,即使所谓机器投入的比重较高,我们理解似乎也不宜拒绝用户对该等AI文生图主张著作权,这也与作品应满足“最低限度的创造性"的理论观点和实践要求相符。
(2)关于人类控制力
即便认可人类投入满足要求,构成独创性表达,AI文生图的可版权性仍然面临另一阻碍——人类投入对于AI文生图的最终生成是否具有控制力,这在本质上同样是在强调AI的“辅助工具"属性。以传统美术作品的形成为例,当画笔作为工具在人类的完全控制下绘出线条和色彩时,最终形成的画作具有可版权性不存争议。但是,AIGC是应用算法、规则和模板的结果,输入完全相同的文本指令在不同的AI大模型下可能得到完全不同的图像。特别是,在用户自身并不具备美术知识并且输入的文本指令多为抽象性描述的情况下,其通常并不能够准确预见输出内容,更多的是在AI大模型输出的多个结果中进行选择。这些选择最终是否准确反映了用户最初的指令和思想,是否体现了用户对图像生成过程的“控制",从而使得AI文生图体现用户的“个性化表达",是实践中面临的棘手问题。
在“黎明的扎利亚案"[4]中,美国版权局展现了对AI文生图生成过程是否体现了人类控制力的重重忧虑。该案中,Kristina Kashtanova申请将其创作的《Zarya of the Dawn》漫画书进行版权登记。由于该漫画书中的部分图像系Kristina使用AI大模型Midjourney生成,美国版权局拒绝了该等AI文生图的版权登记申请,仅认可该漫画书中的文本内容以及Kristina对其中文字和图像元素的选择和编排构成可予以登记的作品。美国版权局认为,尽管Kristina输入了文本指令,但涉案AI文生图中的“传统作者元素"系由Midjourney完成。在此过程中,Midjourney并非受到Kristina完全控制和指导的工具,其所生成的图像不具有可预见性,背后未蕴含Kristina的“掌控思想(master mind)",因此不能登记为作品。
关于人类控制力的要求在我国著作权法项下也有原则性规定。《著作权法实施条例》第三条规定,“著作权法所称创作,是指直接产生文学、艺术和科学作品的智力活动",这在一定程度上体现了对人类控制力的要求。在AI文生图案中,北京互联网法院认可原告通过输入指令、设置参数等方式对生成的图像进行了独创性投入,但是对于该等指令和操作究竟是“间接影响"或是“直接导致"了最终图像的生成并未作详细论述。
著作权法项下的“直接产生"意在强调人类与作品之间的紧密联系关系,排除提供纯粹辅助性工作构成创作的可能性。在AI文生图场景下,这种紧密联系关系不应要求构成美术作品的线条和色彩等传统元素必须由人类亲自执笔绘制,否则将完全否定AI文生图的可版权性,这与当前主流著作权法理论和实践趋势均不相符。遵循相同逻辑,认定AI文生图是否构成作品似乎亦不应简单考量其是否是在人类的完全控制下生成。尽管通过AI模型最终生成的图像并非完全可预见,但在图像生成过程中,用户繁复多次的文本指令和参数调整实际上在逐渐限缩机器随机性并增强确定性,而AI大模型的处理始终是在人类指示的方向上进行细化,仍然有大量的用户选择保留在了最终的图像中。从这个角度看,用户操作不应一概认定为“纯粹辅助性工作",即使最终图像在物理意义上系由用户通过AI大模型“间接"生成,但不能否认用户操作“直接"促成了最终图像中的“传统作者元素"的形成。
(3)思想还是表达
关于AI文生图可版权性的另一争议焦点在于用户输入的指令和操作属于思想还是表达。否定的观点认为,文本指令相当于对所生成图像的理念和风格等进行的辅助性指导,不构成图像中的表达,属于思想范畴而不应受到版权保护。我们认为,这一观点本质上仍是弱化了AI文生图中的人类贡献,片面地强调机器贡献。
思想与表达之间的界限并非泾渭分明。不可否认,若用户仅在AI模型中输入少量、简单、抽象、宽泛的提示词,生成的图像具有很强的随机性,则该等由承载信息量极少的文本指令生成的图像应属于思想,不应予以版权保护。但是,若用户输入大量、复杂、具体的文本指令,设置特定的参数,并且经过多次调整、修订和迭代,此时该等“指令+参数"等用户输入的文本信息所构成的整体可能在一定程度上传达视觉感受,从而使得最终生成的文生图能够体现用户的个性化表达。
思想是人类的主观想法,若对其予以版权保护将产生垄断效果,阻碍创作良性发展,这也是版权法思想与表达二分的应有之义。因此,在AI文生图系基于用户的大量投入、选择和编排而生成,体现了用户的个性化表达,难以为他人再次重复创作,并且不会导致对其他创作的封锁的情况下,亦不应否认该等AI文生图的可版权性。
三、结语
可以预见,人工智能领域的高速发展势必会对现有知识产权法律体系带来更大的挑战。除了可版权性问题以外,人工智能生成物的版权归属、版权侵权、数据合规等诸多问题同样处于争议和讨论之中。可以肯定的是,面对层出不穷的与人工智能生成物有关的侵权纠纷,探索一条适当的法律保护路径已经刻不容缓。我们认为,在AI文生图满足“最低限度独创性"要件的前提下,不应局限于传统版权思维,一概否定其具有可版权性,而应转向厘清版权背后涉及的多元主体利益分配问题。此外,对于未满足独创性要件却仍然含有大量人类投入的AIGC,是否应通过邻接权等其他相关制度予以适当保护,这一问题亦值得积极探索。
[注]
[1] 例如,广东省某人民法院在“某侵害著作权纠纷案"中,对通过人工智能生成文章的独创性问题进行了分析,认为“判断涉案文章是否具有独创性,应当从是否独立创作及外在表现上是否与已有作品存在一定程度的差异,或具备最低程度的创造性进行分析判断"。基于对涉案文章生成过程的分析,法院最终认为涉案文章具有一定的独创性。
[2] United States Copyright Office, Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence, published on March 16, 2023.
[3] United States Copyright Office, Re: Second Request for Reconsideration for Refusal to Register Théâtre D’opéra Spatial, September 5, 2023.
[4] United States Copyright Office, Re: Zarya of the Dawn, February 21, 2023.