“你的输入,我的模型”:AIGC服务协议知识产权条款研究与企业防火墙策略
“你的输入,我的模型”:AIGC服务协议知识产权条款研究与企业防火墙策略
生成式人工智能(Generative AI)工具在飞速发展,应用领域包括语言大模型、图像生成、视频生成等,为人们的生活和工作带来了前所未有的变革与便利。用户服务协议作为用户与AI工具提供商之间的契约,其服务使用条款对使用者和AI工具提供商的权利义务有重要影响,涉及商业用途许可、知识产权归属、内容生成责任与风险承担等诸多法律问题。本文梳理国内外主流生成式AI工具的用户服务协议,就其涉及的知识产权条款进行梳理总结,并结合目前案例中生成式AI涉及的知识产权侵权案件进行探讨和分析,提示开发者在二次开发、商用集成、部署发布时需要特别注意的条款。
生成式人工智能技术的发展为社会带来了巨大的机遇,但其用户服务协议中知识产权条款的不明确也给用户和开发者带来了诸多法律风险和纠纷隐患,包括知识产权侵权纠纷、知识产权权属纠纷等。
一、国内外大模型公司和用户之间的知识产权纠纷
2024年2月8日,广州互联网法院宣判了国内首例公开的生成式人工智能(AIGC)服务侵犯版权案件,即“广州奥特曼案”[1]。原告上海新创华文化发展有限公司自2019年起从版权人—圆谷制作株式会社获得奥特曼角色系列形象在中国大陆地区的版权独占授权。被告是一家未公开披露名称的AI公司,其运营的Tab网站(化名)提供AI对话和AI生成绘画功能。被告某AI平台因用户输入“奥特曼”相关提示词即可生成相似形象,且供用户查看和下载,被法院认定侵犯原版权的复制权与改编权,且被告AI公司,作为服务提供者,未尽到合理注意义务,法院判决停止侵权并赔偿1万元。
“广州奥特曼案”作为国内首例公开的认定AI侵犯版权的案件,迅速引发了国内外对生成式人工智能版权问题的广泛关注。这一案件不仅凸显了生成式人工智能在版权保护方面面临的挑战,也拉开了全球范围内对此类问题司法实践的序幕。在AIGC飞速发展的当下,不同国家和司法地区都在积极探索如何应对这一新兴技术带来的法律难题,以更好地保护版权人的合法权益。从国内到国外,从理论探讨到司法实践,全球都在寻求技术创新与知识产权保护之间的动态平衡。
2023年1月,视觉艺术家Sarah Andersen等多位艺术家在美国对Stability AI、Midjourney、DeviantArt等AI大模型公司提起版权侵权集体诉讼(Andersen v. Stability AI Ltd.)。这些AI公司被指控未经授权,将艺术家受版权保护的作品用作AI软件的训练图像。在生成式AI的运作机制中,训练数据作为基石,为AI模型学习风格、构图、色彩等艺术要素提供基础素材。然而,这些作品由AI公司从互联网爬虫获取,未经原作者—艺术家许可就被纳入训练体系用于模型训练,随后软件输出“风格”类似的图像;将原作者姓名纳入AI提示词库,诱导用户生成模仿这些艺术家风格的作品,移除或篡改原作品的作者签名、水印等。基于此,原告指控Stability AI等公司构成了版权侵权行为,违反了美国数字千年版权法DMCA(Digital Millennium Copyright Act)等行为。
这一案件引发了全球法律界和科技界的高度关注和讨论。它不仅凸显了AI技术对传统版权法的冲击,也推动了各国司法机构更为积极地进行审理,以探索合理的法律解决方案。
目前,关于美国艺术家集体诉讼案,2024年8月12日美国加利福尼亚州北区法院作出裁决。尽管原告提出的包括不当得利和违约行为在内的部分诉求被驳回,但法官拒绝了被告关于驳回原告版权侵权索赔的动议。法院允许版权侵权主张进入证据开示阶段,案件仍在审理中[2]。随着案件的审理与推进,其结果势必将对全球生成式人工智能产业的发展与版权保护产生深远影响。
上述国内外案例揭示了大模型公司与用户之间在知识产权领域所面临的复杂纠纷局面。这些纠纷不仅表现为对原作者版权的侵权,也包括大模型公司在数据获取、作为训练数据进行使用、以及用户生成内容管理等诸多问题。这些问题的存在,不仅对原作者的合法权益构成了威胁,也给整个大模型行业的健康发展带来了潜在的风险和挑战。因此,为了有效应对这些问题,规范各方行为,促进AIGC行业的健康有序发展,保护知识产权,需要对国内外主流大模型开发商的用户服务协议进行深入梳理,明确其中关于用户输入内容知识产权归属等相关规定,从而为各方提供清晰的法律指引和行为准则。
二、国内外主流大模型开发商用户服务协议梳理
1. 用户输入内容的知识产权归属
通常情况下,用户享有对其输入内容(Input)的知识产权。以OpenAI为例,其明确声明用户保留对输入内容的所有权,这一规定为用户提供了清晰的权属指引,确保用户在使用AI工具时能够放心地投入自己的创意与成果[3]。AI视频工具Pika Labs同样声明用户保留其输入内容的所有权[4],这体现了对用户知识产权的尊重与保护。
国内主流大模型服务提供商亦在用户服务协议中对此问题进行了明确规定。DeepSeek[5], 月之暗面kimi[6], 腾讯元宝[7]在其用户服务协议中明确规定:用户输入内容的知识产权归属于输入者或者依法享有该知识产权的权利人所有,用户使用AI工具服务不会对输入内容权利归属产生影响。这一规定不仅符合知识产权保护的基本原则,也为用户在使用AI工具时提供了稳定的法律预期,使用户能够明确知晓自己的权利边界。同时,这些协议还强调用户使用AI工具服务不会对输入内容权利归属产生影响,进一步消除了用户在使用过程中的后顾之忧。
2. 输出内容的知识产权归属
在明确了用户输入内容的权利归属后,我们自然而然地将目光投向了AI工具的另一端——即由模型生成的输出内容。如果说输入内容的知识产权归属是相对清晰、业界已形成普遍共识的地带,那么输出内容的知识产权问题则进入了一片更为复杂且充满争议的水域。
输出内容(Output)的知识产权归属无疑是知识产权条款中最受关注的部分。不同国家和地区对于生成式人工智能的输出是否构成版权法意义上的“作品”尚未达成共识。一方面,用户在使用AI工具时,通过不断调整输入提示词,结合AI工具算法的高度参与,共同塑造了输出内容。然而,这种由人机协作产生的成果是否应受到版权法的保护,目前仍存在广泛的争议。若输出内容被认定为版权法下的“作品”,那么其知识产权归属问题便显得尤为关键。对于输出内容如果构成版权法下的“作品”,其知识产权归属问题,各AI工具平台在条款中对用户的权利做出了规定,普遍约定生成内容的版权在一定程度上归属于输入者。
例如,OpenAI在条款中声明:“对于您提供的输入,您保留所有权利;对于模型生成的输出,您拥有其权利。我们将输出的所有权利与利益转让给您[8]”也就是说,用户输入的内容仍归用户所有,模型生成的内容(无论文本还是图像)也归用户所有,OpenAI不对输出主张权利。Google针对其生成式AI服务在云服务条款中一般不主张用户内容版权,Google Cloud明确规定客户对其数据和应用保留所有知识产权,Google保留AI模型和服务的知识产权[9]。
Midjourney采取区分收费级别的授权策略,付费用户拥有独占商业使用权,免费用户的输出则默认开放共享、禁止商业用途。Midjourney条款规定付费订阅用户拥有所创作图像的版权或使用权[10]。但同时附有例外:若用户属于年收入超100万美元的公司,必须购买Pro或Mega高级计划才能拥有生成内容版权;免费用户虽拥有版权,但仍可能须接受平台对内容的公开展示与再许可条款,免费用户或基础会员所生成的图像默认是公开的、可被他人查看和再创作[11]。
DeepSeek用户协议规定: 在符合法律规定和我们的条款的条件下,您对本服务的输入与输出享有以下权利:(1)您保留在提交的输入中拥有的任何权利、所有权和利益(如有);(2)我们将本服务输出的内容的任何权利、所有权和利益(如有)归属于您。(3)您可将本服务的输入与输出应用于广泛的使用场景中,包括个人使用、学术研究、衍生产品开发、训练其他模型(如模型蒸馏)等[12]。
腾讯元宝:服务协议5.3款,您上传至本服务平台的内容以及您使用本服务生成的内容,权利归您或依法享有该知识产权的权利人所有,您使用本服务不会对前述内容及本服务生成的内容的权利归属产生影响。请您在使用前述内容时,注意遵守相关法律规定[13]。
Kimi: 在未侵害他人合法知识产权或其他权利并遵守本协议的前提下,您在法律允许的范围内,拥有对您输入和输出内容的知识产权、其他权利和对内容负责的义务。由于技术限制,我们无法保证其他用户的内容与您的内容完全不一致,不排除会出现输出内容雷同的情况,鉴于此,您对输出所享有的权利无法当然及于其他用户的内容[14]。
豆包:服务协议8.1 在你使用本软件及相关服务期间,你可以向本软件及相关服务提交文本、音频或其他内容或信息(合称“输入”),并接收响应你的输入而生成的内容(称“输出”)。在你和公司之间,在适用法律允许的范围内,你提供的输入的知识产权归属于你或者依法享有这些知识产权的权利人。公司不主张输出内容的所有权。如果输入和/或输出本身包含了公司享有知识产权或其他合法权益的内容,则前述输入和/或输出的相应权利仍由公司享有,不因包含在输出当中而改变其权属[15]。
在生成式人工智能工具的用户协议中,国内外的AI工具普遍明确了用户对于输出内容的知识产权享有权,同时公司自身不主张或放弃对输出内容的所有权。
同时,用户普遍有责任确保其拥有使用输入内容的合法使用,特别强调当输入内容包含第三方知识产权时。以Kimi为例,其用户协议中明确规定:“在未侵害他人合法知识产权或其他权利并遵守本协议的前提下,您在法律允许的范围内,拥有对您输入和输出内容的知识产权、其他权利和对内容负责的义务[16]。” 这一条款不仅明确了用户对输入和输出内容的知识产权享有权,同时也强调了用户在使用过程中必须遵守法律法规,不得侵犯他人的知识产权。用户在享有权利的同时,也承担着确保其使用内容合法性的义务,这体现了权利与责任的平衡。
豆包在其用户协议中也有类似的表述:“8.3 你理解并承诺,输入均应为你享有知识产权或已获取权利人合法授权的内容,不存在任何违反适用的法律法规、侵犯他人合法权益(包括但不限于版权、专利权、商标权等知识产权及人格权、个人信息权益等其他权益)、违反公序良俗的内容[17]。” 这一规定进一步细化了用户的责任范围,明确指出用户在使用AI工具时,必须确保输入内容的合法性,不得包含任何侵犯第三方知识产权或其他权益的内容。
从以上可见,在生成式人工智能工具的用户协议中,国内外的AI工具提供商普遍明确了用户对于输出内容的知识产权享有权,同时公司自身不主张或放弃对输出内容的所有权。且规定用户普遍有责任确保其拥有使用输入内容的合法使用,特别强调当输入内容包含第三方知识产权时不得侵犯他人的知识产权。用户在享有权利的同时,也承担着确保其使用内容合法性的义务,这体现了权利与责任的平衡。
除了上述权利归属和合法使用的问题,AI工具提供商在模型训练、数据保留、商业使用等方面对用户输入和输出内容的使用权利,同样是争议和纠纷的焦点。下文将对这些方面进行详细梳理。
3. AI工具提供商使用用户输入和输出的权利 (模型训练、数据保留)
3.1 默认不训练,可选择退出
OpenAI明确表示“发送到 OpenAI API 的数据不会用于训练或改进 OpenAI 模型,除非用户明确选择为此目的共享您的数据”[18]。这一政策为用户提供了明确的保障,确保用户的数据不会在未经许可的情况下被用于模型优化。Google Cloud AI/ML服务也遵循类似原则 “未经客户事先许可或指示,Google不会使用客户数据来进行训练或微调任何AI/ML模型。[19]” 这一规定进一步强化了用户对其数据的控制权,确保用户能够自主决定其数据的使用方式。
腾讯元宝在其用户服务协议中指出:“针对您上传至本服务平台的内容以及您使用本服务生成的内容,除非您开启‘体验优化计划’,否则我们不会将前述内容用于模型优化。” 用户可以随时通过“设置-数据管理-体验优化计划”调整授权,关闭该计划后,后续上传和生成的内容将不会用于模型优化[20]。”这一灵活的机制为用户提供了更多的选择权,使其能够根据自身需求决定是否参与模型优化。
3.2 默认开启数据用于模型训练,可选择退出
Deepseek: “为向您提供连续、高质量的服务,在经安全加密技术处理、严格去标识化且无法重新识别特定个人的前提下,我们可能会将服务所收集的输入及对应输出,用于模型训练和服务的优化。在此前提下,您同意授予深度求索在全球范围内一项免费的、非排他的许可使用权,以使我们对前述内容进行处理。如您拒绝将您的数据用于模型训练,可以在产品内通过关闭“数据用于优化体检”来选择退出,关闭后您的输入和输出不会再用于我们的模型训练[21]。”
3.3 授权AI工具提供者使用数据进行模型训练
Midjourney:授予Midjourney非常广泛的、永久的许可,允许其将输入和输出用于几乎任何目的,包括准备衍生作品,这可能包括模型训练[22]。” 这种广泛的许可为Midjourney提供了更大的灵活性,但也要求用户在使用服务时充分了解并接受这一条款。
Kimi在其用户协议中规定: 为了提升您使用本服务的体验,您授予我们一项免费的的使用权,以在法律允许的范围内将您输入输出之内容及反馈用于模型服务优化[23]。
豆包进一步明确了数据使用的范围:8.2 为了提升你使用本软件及相关服务的用户体验、使你的内容得到更好的分享和推广,你授予公司和/或关联方一项免费的、全球范围内的、可转让的、可分许可及再许可的使用权,在法律允许的范围内使用你的内容,例如用于模型服务优化、品牌推广与宣传[24]。
注:本表基于截至2025年第二季度公开信息进行概述,具体条款以各平台最新版用户协议为准
通过上述分析可以看出,不同AI工具提供商在用户数据的使用上采取了不同的策略。一些提供商如OpenAI和Google Cloud,采取了较为保守的策略,明确表示不会在未经用户同意的情况下使用用户数据进行模型训练,这体现了对用户数据隐私和控制权的高度重视。而像腾讯元宝和DeepSeek等AI提供商,则在确保数据安全和匿名化的前提下,为用户提供了选择退出的机制,既满足了服务优化的需求,又尊重了用户的自主选择权。此外,Midjourney和Kimi等提供商则通过明确的用户协议,获得了更广泛的数据使用许可,这为它们在模型训练和业务拓展方面提供了更大的灵活性,但同时也要求用户在使用服务前充分了解并接受相关条款。这些不同的策略反映了AI行业在数据使用和用户隐私保护之间的平衡尝试,也为用户在选择AI工具时提供了重要的参考依据。
三、专业洞察与实操合规建议
在讨论了上述规则和服务条款的复杂性后,开发者必须采取一套多维度的合规策略,以便在充分利用生成式AI强大能力的同时,有效避开潜在的法律风险。
1. 输出内容的知识产权归属条款
输出内容的知识产权归属问题复杂且存在争议,目前业界尚未形成统一共识。尽管多数AI工具平台约定生成内容的版权归输入者所有,或认为知识产权归属不因输入而改变,这种规定虽在一定程度上激励了用户使用AI工具创作,但也可能引发法律风险,尤其在输出内容涉及多用户输入或平台技术贡献时,归属问题易变得模糊。
实操合规建议:对于AI提供者,协议中应明确输出内容知识产权归属规则,涵盖不同情形下的判定标准,如用户输入独创性、平台算法参与度等。同时,平台需加强输出内容审核管理,对侵权或争议内容及时处理。对于用户,应保存输入内容原始记录、生成过程截图等证据,以证明对输出内容的知识产权归属。若计划将输出内容用于商业等重要场合,建议提前咨询专业律师,保障自身权益。
2. AI工具提供商使用用户输入和输出的权利条款
数据使用与模型训练是生成式AI领域的核心问题。当前,各平台依据自身服务特色及用户需求,制定了多元化的数据使用政策。这些政策从默认不训练、用户可选择退出,到默认开启数据用于模型训练但提供退出选项,再到授予平台广泛的使用权限。这些条款在一定程度上展现了平台在用户权益保护与技术优化之间的平衡。然而,随着生成式AI的广泛应用,知识产权纠纷日益增多,这提醒AI提供商在制定相关条款时必须更加审慎。
企业在制定用户输入输出内容使用权利规定条款时,应充分考虑用户数据隐私保护、模型训练合规性及商业利益平衡。建立透明灵活的数据使用政策,明确告知用户数据可能用于模型训练等目的,以及用户选择退出的方式和后果。平台需加强数据使用监管审计,确保数据使用符合协议约定和法律法规,防止数据滥用或泄露,特别是涉及医疗等个人隐私数据。
用户在使用AI工具时,应仔细阅读数据使用条款,了解数据可能的使用方式,并根据自身需求和风险承受能力做出选择。若不同意平台政策,可选择其他符合要求的平台。同时,用户应关注平台的数据安全措施和隐私保护政策,确保数据安全。
3. 责任条款
尽管各大平台的用户责任条款均强调用户应确保输入内容的合法性、不得侵权且责任自负,平台亦承担监管、审核及删除的义务,但问题仍时有发生。
建议平台建立强有力的内部治理规范。企业需制定明确的AIGC工具使用政策,并对员工进行专业培训,严禁输入敏感、保密或未授权的第三方内容。对于所有计划对外发布的AI生成内容,特别是视觉资产,应建立人工审查流程,评估其与现有知识产权的潜在相似性,以防范侵权风险。
同时,对关键AI创作过程保留详细记录,包括平台版本、系列提示词、关键参数设置及生成日期等信息。这些记录在未来权利归属或侵权纠纷中,可作为证明人类创造性投入和内容来源的关键证据。
四、结语
AI技术的快速发展往往领先于监管框架的完善,因此法律专业人士必须更加审慎地解读并提供建议,以应对这些新颖复杂的条款所带来的不确定性。在生成式AI广泛应用的时代,知识产权问题不仅关系到用户的权益保障,也影响着整个行业的创新与发展,知识产权版图正在诉讼、协商与市场竞争中被重塑。对用户而言,关注点必须从单纯的“我是否拥有它?”转向更成熟的“我可能要承担什么风险?”服务协议不再是可有可无的“勾选项”,而是决定商业成败和法律风险的关键文件。通过审慎地选择服务、理解条款、建立内部规范,企业和开发者才能在驾驭这场技术革命的同时,安全地驶离法律的暗礁区。
[注]
[1](2024)粤0192民初113号。
[2]Andersen v. Stability AI Ltd., 23-cv-00201-WHO (N.D. Cal. Aug. 12, 2024) https://perma.cc/HCT3-NHVV.
[3]OpenAI Services Agreement, accessed May 31, 2025, https://openai.com/policies/services-agreement/.
[4]Terms & Conditions - PIKA, accessed May 20, 2025, https://www.pika.group/terms-conditions.
[5]DeepSeek 用户协议 https://cdn.deepseek.com/policies/zh-CN/deepseek-terms-of-use.html
[6]Kimi用户服务协议https://www.kimi.com/user/agreement/modelUse?version=v2.
[7]腾讯元宝用户服务协议https://rule.tencent.com/rule/202403110001
[8]OpenAI Services Agreement, accessed May 31, 2025, https://openai.com/policies/services-agreement/.
[9]Google Cloud Terms of Service, accessed May 20, 2025, console.cloud.google.com
[10]Terms of Service, accessed May 20, 2025, https://docs.midjourney.com/hc/en-us/articles/32083055291277-Terms-of-Service.
[11]Terms of Service, accessed May 20, 2025, https://docs.midjourney.com/hc/en-us/articles/32083055291277-Terms-of-Service.
[12]DeepSeek 用户协议 https://cdn.deepseek.com/policies/zh-CN/deepseek-terms-of-use.html
[13]腾讯元宝用户服务协议https://rule.tencent.com/rule/202403110001
[14]Kimi用户服务协议https://www.kimi.com/user/agreement/modelUse?version=v2.
[15]用户协议https://www.doubao.com/legal/terms.
[16]Kimi用户服务协议https://www.kimi.com/user/agreement/modelUse?version=v2.
[17]用户协议https://www.doubao.com/legal/terms.
[18]https://community.openai.com/t/does-the-openai-api-get-access-to-the-data-i-send-it-or-store-the-data/599538.
[19]Service Specific Terms, accessed May 20, 2025, https://cloud.google.com/terms/service-terms.
[20]腾讯元宝用户服务协议https://rule.tencent.com/rule/202403110001.
[21]DeepSeek 用户协议 https://cdn.deepseek.com/policies/zh-CN/deepseek-terms-of-use.html
[22]Terms of Service - Midjourney, accessed May 20, 2025, https://docs.midjourney.com/hc/en-us/articles/32083055291277-Terms-of-Service.
[23]Kimi用户服务协议https://www.kimi.com/user/agreement/modelUse?version=v2.
[24]用户协议https://www.doubao.com/legal/terms.