ARTICLES

专业文章

大模型时代的开源许可证：从GPL到开放权重，代码、数据与模型输出的法律边界（下篇）

作者：薛熠 2026-06-18 语音播报

在中篇，我们详细拆解了开源许可证的完整风险谱系，分析了GPL Copyleft 效力的触发条件与司法边界，对比了不同许可证的义务强度与商业友好度，并结合典型判例，阐释了法院在衍生作品认定、模块独立性、开源合规与权利救济等问题上的裁判观点｡

第五部分：商业与跨境——开源是竞争策略，也受国家监管约束

开源不是单纯的法律负担，也不是天然的公益选择。它可以用来挑战垄断、建立生态、降低采用门槛；但当技术跨境流动、模型权重公开下载、云服务全球部署时，许可证允许并不等于监管放行。

开源与闭源的商业竞争：从Red Hat到DeepSeek

开源和闭源不是纯粹技术选择，而是商业模式选择。

早期开源商业模式以支持服务为主。Red Hat通过Linux发行版、企业订阅、安全更新、认证和技术支持实现收入。这证明了软件本身免费并不意味着无法商业化。

随后，双许可和开放核心模式兴起。企业可以提供社区版开源，同时通过企业版、高级功能、管理工具、安全功能、商业授权获得收入。MySQL、MongoDB、Elastic、GitLab等项目都在不同程度上采用过类似策略。

云计算又改变了关系。云厂商可以基于开源软件提供托管服务，快速获得收入，却未必向原项目公司付费。这催生了SSPL、Elastic License等反云厂商许可证，也引发社区分叉和“伪开源”争议。

AI大模型领域正在重演类似博弈。闭源模型通过API、订阅、企业授权和高性能模型形成壁垒；开放权重模型通过本地部署、微调、社区评测和衍生模型扩大影响力。DeepSeek-R1采用MIT License开放权重和代码，降低了全球开发者部署和蒸馏门槛，也迅速推动生态扩散。Meta Llama则通过开放权重吸引开发者，同时保留月活门槛、命名要求和使用政策，以平衡开放和商业控制。

这些案例说明，开源与闭源并不是二选一的价值判断，而是围绕项目属性、商业模式和生态关系作出的制度安排。进入具体许可证选择时，关键不在于给项目贴上“开放”或“封闭”的标签，而在于判断哪些资产适合开放、哪些能力需要保留、下游是否应当回流贡献，以及企业能否承受相应的合规和竞争后果。

企业如何选择许可证：项目属性决定答案

许可证选择没有万能答案。企业可以从四个维度判断。

第一，项目是否为核心竞争力。如果项目是通用工具、基础库、示例代码或生态吸引组件，宽松许可证更利于采用。如果项目是核心产品或差异化算法，可能不适合开源，或仅适合开放部分。

第二，是否希望衍生作品回流。如果希望所有下游修改持续开源，可以考虑GPL或AGPL。如果更重视商业采用和行业标准化，则MIT、BSD、Apache 2.0更合适。

第三，是否涉及专利。如果项目涉及关键技术专利，Apache 2.0通常比MIT/BSD更稳健，因为其专利授权和终止机制更清楚。

第四，是否为AI模型。AI项目往往不适合一个许可证覆盖全部资产。代码可以用MIT或 Apache 2.0；模型权重可采用模型专用许可或标准许可；训练数据需另行确认数据许可；文档、模型卡、商标和输出使用政策也可能需要单独安排。

尤其对AI模型，企业应避免“许可证错配”。例如，用MIT License发布代码不等于开放权重；开放权重不等于开放训练数据；即便公开训练数据集或训练数据清单，也不当然说明其中包含的文字、图片、音频、代码等第三方作品已经获得原权利人授权；许可证允许商业使用，也不等于免除出口管制、隐私合规和高风险应用责任。

出口管制：许可证允许，不代表国家允许

点击可查看大图

开源许可解决的是权利人是否授权的问题；出口管制解决的是国家是否允许特定技术、软件、物项或技术资料跨境流动的问题。二者不是同一套规则。

美国《出口管理条例》（Export Administration Regulations，简称“EAR”）对已公开发布的技术和软件设有不受EAR管制的规则，这对开源软件具有重要意义。但加密软件需要特别分析。美国商务部工业与安全局（Bureau of Industry and Security，简称“BIS”）官方说明显示，公开可得的加密源代码在满足相应通知要求后才不受EAR管制；公开可得的加密目标代码、mass market软件、出口管制分类号（Export Control Classification Number，简称“ECCN”）、加密项目许可例外（Encryption Commodities, Software and Technology，简称“ENC”）等也有不同规则。如果企业把开源加密组件集成到专有产品中，产品整体仍可能受EAR规制。

中国则通过《出口管制法》《技术进出口管理条例》和《中国禁止出口限制出口技术目录》管理相关技术出口。2023年新版目录取代2020年调整内容，列明若干禁止或限制出口技术。对于AI大模型而言，模型权重、训练方法、数据处理技术、网络安全能力、深度包检测、战略预警等是否落入具体控制要点，需要结合技术内容判断。

中美技术博弈使问题更复杂。高性能GPU、先进计算芯片、半导体制造设备、电子设计自动化（Electronic Design Automation，简称“EDA”）工具、加密技术、网络安全技术和特定AI能力都可能触发出口管制或制裁。一个模型即使用MIT License发布，如果其跨境提供涉及受管制技术资料、受限最终用户或敏感用途，仍可能需要出口管制审查。

企业在发布重要开源项目或AI模型前，应至少完成三项检查：上游许可证是否允许发布；模型、代码、数据、商标、专利和商业秘密是否存在第三方权利障碍；目标法域出口管制、制裁、数据出境和AI监管是否适用。

第六部分：落地治理——把开源合规从清单变成流程

企业面对开源风险，不能只在产品上线前补一份许可证清单。识别、审批、隔离、履约、留痕，以及采购、外包、并购和AI模型使用中的准入审查，都应进入常态化治理。

中欧AI监管：开源例外、应用端治理与透明义务

AI模型开源不能只从许可证角度判断，还要放入监管框架中观察。中国目前并没有一部专门的“开源软件法”，开源协议效力主要依赖民法典合同编、著作权法、计算机软件保护条例、反不正当竞争法等一般规则解释适用；AI应用端则会叠加生成式AI 服务、个人信息、数据安全、内容标识和行业监管要求。也就是说，企业面对的不是单一许可证问题，而是知识产权、数据、内容安全、网络安全和商业秘密共同构成的治理问题。

中国政策层面对开源的重视正在提升。“十四五”规划提出完善开源知识产权和法律体系，鼓励企业开放软件源代码、硬件设计和应用服务；2025 年《国务院关于深入实施“人工智能+”行动的意见》也提出促进开源生态繁荣，并在全球合作部分提出推动人工智能技术开源可及。对企业而言，这并不意味着“政策鼓励开源”即可替代合规审查，而是意味着开源会更深地进入研发、产业协作和AI产品发布流程，合规体系也必须同步前移。

欧盟《人工智能法案》则从风险监管角度处理开源。其风险分级结构包括被禁止AI、高风险AI、透明度义务和通用AI模型义务等。对于开源，法案设置了一定例外：免费开源许可下发布的AI系统一般不适用该法案，除非其被投放市场或投入使用为高风险AI系统、被禁止AI系统，或触发特定透明度义务。对于通用AI模型，免费开源发布的提供者可在某些义务上获得减轻，但如果模型具有系统性风险，或者涉及版权合规政策、训练内容摘要等义务，仍可能受监管约束。

中欧规则的共同启示是：开源可以成为创新、透明、安全审查和产业协作的工具，但不能自动排除监管责任。中国企业如果面向境内公众提供生成式AI服务，需要关注知识产权、个人信息、内容安全和标识义务；如果模型面向欧盟市场发布或供欧盟用户使用，还要看模型用途、风险分类、是否作为通用AI模型、训练数据版权政策、文档透明度和下游部署者合规支持。

企业开源合规体系：从“上线前看一眼”到全流程治理

点击可查看大图

成熟企业不能依赖上线前临时审查开源许可证。开源合规应嵌入研发、采购、模型训练、产品发布和售后流程。

第一，识别。通过软件成分分析（Software Composition Analysis，简称“SCA”）工具识别代码库中的开源组件、版本、许可证、安全漏洞和传递依赖。AI项目还应识别模型基座、微调数据、评测数据、合成数据、蒸馏来源、模型卡和第三方API。

第二，分类。将许可证按风险分级：MIT、BSD、Apache 2.0多数情况下为低至中风险；LGPL需关注库修改和链接方式；GPL、AGPL需关注分发、网络交互和衍生范围；SSPL、Elastic License、OpenRAIL、Llama License等自定义许可证需逐条审查商业限制、用途限制和兼容性。

第三，审批。建立开源组件引入审批、对外开源审批、员工社区贡献审批、AI模型发布审批和出口管制审查机制。高风险许可证、核心产品依赖、商业发布和跨境发布应纳入法务、知识产权、信息安全和研发部门共同审查。

第四，隔离。对GPL、AGPL等高风险组件采用清晰架构边界，包括独立进程、独立服务、容器化部署、API调用、动态链接、双仓库、模块分层等。但隔离必须真实反映功能独立性，而不是形式包装。

第六，留痕。建立软件物料清单（Software Bill of Materials，简称“SBOM”），记录组件名称、版本、许可证、引入时间、审批记录、替换记录和发布范围。AI项目还应建立数据来源清单、训练日志、权重版本、模型评测、红队测试、输出相似性检测和权利投诉处理记录。

第七，响应。开源合规不是一次性工作。组件漏洞、许可证变更、上游项目转向SSPL或Elastic License、模型许可更新、监管规则变化，都可能改变风险状态。企业需要定期审计和更新。

企业开源治理的两个身份：引入使用与对外发布

开源治理首先要分清企业所处的位置。企业可能是开源项目的使用方，把外部代码、组件、模型、数据集引入自己的产品或服务；也可能是开源成果的发布方，把自研代码、模型权重、数据集、文档或接口对外开放。前者关注“拿来用”是否合规，后者关注“放出去”是否有权、是否合适、是否会改变商业边界。许多风险之所以难处理，正是因为同一项目会同时发生这两件事：先引入外部开源组件，再对外发布产品、插件、模型或衍生成果。

先看使用方。企业引入外部开源项目时，风险并不只来自许可证文本，通常可以分为六类。

第二是专利风险。开源许可证不当然授予所有专利。企业使用开源组件实现某一技术标准或功能时，仍可能落入第三方专利。AI框架、推理优化、音视频编解码、通信协议和加密算法尤其需要关注。

第三是商业秘密风险。员工对外贡献代码、引入GPL组件导致源代码公开、开源项目暴露技术路线、第三方通过开源代码进行反向分析，都可能影响商业秘密保护。

第四是数据和隐私风险。AI模型和开源数据集可能包含个人信息、敏感个人信息、未授权作品、商业秘密、爬取数据或受限数据。即使模型代码开源，数据使用仍可能违反个人信息保护、数据安全或平台条款。

第五是安全风险。开源组件可能存在漏洞、后门、供应链投毒、依赖混淆、恶意维护者接管、签名失效等问题。SBOM和漏洞响应机制不仅是法律合规，也是网络安全和产品责任管理。

第六是出口管制和制裁风险。加密软件、网络安全工具、先进计算能力、AI模型权重、受限技术资料、受制裁主体访问，都可能使开源项目进入出口管制和制裁规则视野。

再看发布方。企业主动对外开源时，问题不是“能不能公开”这样简单。对外发布一旦发生，许可文本、权利范围、下载对象、商业安排和下游再利用方式都会影响后续生态，至少应回答五个问题。

第一，开源目的是什么。是为了吸引开发者、建立标准、提升品牌、推动生态、降低维护成本，还是为了商业产品导流？不同目的决定不同许可证。如果目的是最大化采用，MIT或 Apache 2.0更合适；如果目的是确保社区贡献回流，GPL、AGPL或MPL可能更合适；如果目的是开放模型但控制超大商业使用，自定义模型许可可能更符合商业策略，但不宜轻易称为OSI意义上的开源。

第二，开源对象是什么。开源代码、开放权重、开放数据、开放文档、开放API、开放评测集，是完全不同的法律动作。代码可以用软件许可证；数据可能需要Creative Commons、Open Data Commons或自定义数据许可；模型权重可能需要模型专用许可；商标和品牌不应随代码许可一并无限开放。

第三，权利是否干净。企业需确认拟开源代码是否包含第三方代码、员工个人代码、外包交付物、客户代码、商业秘密、专利敏感技术、个人信息、受限数据和违反上游许可证的内容。对外开源后再撤回，往往难以完全消除影响。

第四，是否影响商业模式。开源可能带来生态，也可能降低产品差异化。企业应明确哪些部分开放，哪些部分保留，如何通过云服务、企业版、认证、支持、数据、模型服务或增值功能实现商业化。

第五，是否涉及跨境。若开源项目面向全球发布，可能涉及出口管制、加密通知、制裁名单、数据出境、模型安全和目标市场监管。尤其是AI模型权重，一旦公开下载，传播范围很难控制。

因此，引入使用和对外发布应放在同一套开源治理流程中处理：引入阶段确认上游义务和技术边界，发布阶段确认企业自身权利基础和向下游授权的范围，并在代码、模型、数据和文档层面分别留痕。开源治理不应由法务部门单独完成，而需要研发、法务、知识产权、信息安全、合规、采购、产品和业务部门共同参与。

企业使用开源或开放权重模型：准入审查与许可链条

企业使用开源或开放权重模型时，至少要建立一套模型准入审查。

第一，确认模型来源。模型是否来自官方仓库，是否为第三方镜像、量化版、微调版、合并版或蒸馏版。不同版本可能适用不同许可证，第三方上传者未必有权重新授权。

第二，确认基座模型。很多模型是基于Llama、Qwen、Mistral、DeepSeek、Phi等基座微调而成。上游基座许可证可能继续约束下游模型。若模型卡只写“MIT”，但实际基座是Llama，企业需进一步确认许可链条是否一致。

第三，确认权重许可和代码许可是否一致。某些项目代码采用Apache 2.0，但权重采用自定义许可；有些项目权重开放但训练代码不开放；有些项目模型卡允许研究用途但限制商业用途。

第四，确认输出使用规则。是否允许将模型输出用于商业产品、是否允许用于训练其他模型、是否允许蒸馏、是否要求标识来源，以及是否限制特定场景。

第五，确认数据和隐私风险。模型是否披露训练数据来源，是否可能记忆个人信息、版权文本、商业秘密或敏感内容。企业在高风险行业部署模型时，还需做输出测试和安全评估。

第六，确认部署场景。内部辅助工具、面向公众服务、医疗、金融、教育、招聘、信用评估、司法、公共治理等场景的监管要求不同。开源模型本身不等于部署服务合规。

第七，确认出口和制裁风险。模型权重跨境下载、提供给境外主体、向受制裁地区开放API、使用加密功能或网络安全能力等行为，都可能触发额外审查。

企业场景一：商业APP使用GPL框架

假设一家企业开发商业APP，为实现沙盒、插件化、虚拟化运行或图像处理功能，引入一个GPLv3框架。研发团队认为该框架只是辅助功能，APP的核心商业价值是视频美颜、社交运营或会员服务，因此无需开源。

这个判断可能过于乐观。法律风险不取决于企业主观上认为哪个功能“核心”，而要看GPL框架与商业APP的技术关系。如果商业APP复制、修改或嵌入GPL框架，并通过该框架实现关键功能，二者形成紧密整体，则分发APP时可能触发GPL义务。即使APP另有大量自主代码，也不能当然排除GPL影响。

更稳妥的方案是在项目早期就做架构隔离：尽量避免将GPL框架直接嵌入闭源主程序；若必须使用，考虑是否存在LGPL、Apache 2.0、MIT等替代组件；如无法替代，评估是否可以接受整体GPL发布；若采用服务化或进程隔离，也应保留架构独立性证据。

企业场景二：SaaS服务使用AGPL组件

假设一家云服务企业在后端使用AGPL许可的数据库、知识库系统、模型服务框架或监控工具，并对外提供API。研发团队认为公司并没有把软件副本分发给用户，因此不需要提供源代码。

这个判断对GPL可能有讨论空间，但对AGPL就很危险。AGPL的设计正是为了覆盖网络交互场景。如果企业修改AGPL程序并通过网络让用户与其交互，通常需要向交互用户提供对应源代码访问方式。

因此，企业在SaaS场景中应将AGPL组件设为高风险。常见控制措施包括：禁止在核心闭源服务中引入 AGPL；使用商业许可替代 AGPL；将 AGPL 组件作为独立开源服务提供并履行源代码义务；或采用许可证风险更低的替代方案。

企业场景三：基于开放权重模型做行业应用

假设一家企业下载Llama、DeepSeek、Qwen或Mistral模型，在本地微调后用于法律、医疗、金融或教育场景。企业认为模型“开源”，因此可以直接商业化。

此时至少要分四层审查。

第一，许可证是否允许商业用途。DeepSeek-R1主模型的MIT许可相对宽松；Llama 3.3则存在月活门槛、命名、署名、使用政策等要求；某些模型仅允许研究用途或非商业用途。

第二，基座模型和蒸馏模型是否存在不同许可。一个模型可能标注为MIT，但其某个蒸馏版本基于Llama，仍可能带有Llama许可链条。企业不能只看模型名称或页面标签。

第三，行业应用是否触发监管。医疗辅助诊断、金融风控、招聘筛选、教育评分等场景可能在欧盟构成高风险AI，在中国也可能涉及个人信息、算法备案、生成式AI服务、行业监管和内容安全。

第四，输出和数据是否合规。模型可能生成侵权内容、泄露训练数据片段、产生虚假信息或歧视性结果。企业需要通过提示词策略、输出过滤、人工复核、日志留存和投诉机制控制风险。

企业场景四：对外发布自研大模型

假设一家中国AI企业准备在全球发布自研模型权重，并计划用MIT License吸引开发者。这个策略有明显优势：采用门槛低、社区反馈快、便于建立行业影响力。但发布前仍需完成完整审查。

首先是权利审查。训练数据是否包含未经授权的版权作品，是否包含个人信息或敏感个人信息，是否包含第三方商业秘密；同时核查数据来源是否违反平台条款，以及数据清洗和标注外包合同是否约定权利归属。

其次是模型资产审查。模型权重是否完全自研，是否基于第三方基座模型继续训练，是否使用其他模型输出进行蒸馏，是否存在上游许可证限制，是否使用第三方专利技术。

再次是发布材料审查。模型卡是否准确描述能力和限制，是否夸大性能，是否说明训练数据摘要，是否提示禁止用途和安全风险，是否保留商标控制，是否避免把非OSI许可称为“开源”。

最后是跨境审查。模型能力是否涉及受限制出口技术，权重跨境下载是否构成技术资料出口，是否向受制裁主体开放，是否涉及加密、网络安全或先进计算能力。即使许可证允许全球使用，国家出口管制规则也可能另行限制。

企业开源政策：哪些组件可以直接用，哪些必须升级审批

一份可执行的企业开源政策，不能只写“遵守开源许可证”。它应当把许可证和使用场景结合起来。

对于LGPL、MPL等弱Copyleft许可证，企业可以设置为条件准入。审批重点是是否修改了库或文件、是否静态链接、是否能够满足重新链接或文件级开源义务，以及是否会与专有代码形成不可分割整体。

对于GPL、AGPL、SSPL、Elastic License、Commons Clause、OpenRAIL、自定义模型许可证等，应设置为高风险准入。研发团队不能自行引入到商业产品中，必须由法务、知识产权和架构团队共同判断。尤其是AGPL和SSPL，在云服务场景中可能影响整个服务栈或服务端代码开放义务。

对于未知许可证、无许可证项目、仅在README中写“free to use”的项目，应设置为禁止或特殊审批。没有许可证并不等于自由使用。默认情况下，著作权仍由作者保留，复制、修改和分发都可能缺乏授权。

对于AI模型，还应设置单独准入规则：仅允许研究用途的模型不得用于商业产品；限制特定行业或用途的模型不得进入相应业务线；基座许可证不清晰的微调模型不得上线；训练数据来源不明的模型不得用于高风险场景；输出权属和蒸馏规则不清晰的模型不得用于再训练。

开源合同条款：采购、外包和并购中不能遗漏

开源风险不仅发生在企业内部研发，也会通过采购、外包和并购进入企业。

在软件采购合同中，采购方应要求供应商披露产品中使用的开源组件、许可证类型、版本号、是否修改、是否触发源代码提供义务、是否存在已知许可证冲突和安全漏洞。供应商应承诺其使用开源软件符合许可证要求，并在因开源违规导致第三方索赔时承担相应责任。

在软件外包合同中，应明确外包方不得未经委托方书面同意引入GPL、AGPL、SSPL等高风险组件；如需使用开源组件，应提供清单并经审批。外包成果交付时，应随附SBOM、许可证文本、NOTICE文件、源代码提供说明和开源合规声明。

在AI模型采购或合作开发合同中，条款应进一步覆盖训练数据来源、模型基座、权重权属、微调数据权属、输出使用权、是否允许蒸馏、是否使用第三方模型输出、是否存在用途限制、是否符合目标市场监管要求。传统软件采购条款不足以覆盖这些内容。

在投融资和并购尽调中，开源合规应作为知识产权尽调重点。被投企业若核心产品大量使用GPL/AGPL组件却未履约，或核心模型基于限制性模型许可训练，可能影响估值、交割条件、赔偿条款甚至交易可行性。对于AI公司，还应审查训练数据授权、模型权重来源、数据标注合同、GPU云服务合规、模型卡披露和对外开源记录。

常见误区：开源合规里最容易踩的坑

第一个误区是“放在GitHub上就是开源”。GitHub是代码托管平台，不是许可证。没有明确许可证的代码，通常不能被当然复制、修改和商业使用。企业使用无许可证仓库代码，风险反而更高。

第三个误区是“GPL禁止商用”。GPL不禁止收费，不禁止商业服务，也不禁止企业使用。它要求的是在触发条件下传递相同自由并提供源代码。把GPL理解为“不能商用”，会导致企业既误判风险，也错失可合规使用的场景。

第四个误区是“只要动态链接就安全”。动态链接通常比静态链接风险低，但不是绝对安全。若主程序与库之间功能高度依赖、接口并非标准接口、分发方式使二者形成一个整体，仍可能产生争议。

第五个误区是“模型开放权重就是开源”。开放权重只是AI开放的一种形式。训练数据、训练代码、模型架构、权重许可、输出规则、蒸馏规则、使用政策和商业门槛都会影响其是否符合开源定义。

第六个误区是“内部使用不用管”。某些许可证义务确实主要在分发时触发，但内部使用仍可能涉及安全漏洞、专利、商业秘密、数据合规和员工贡献风险。若内部系统未来转为对外服务或嵌入产品，早期忽视会变成上线障碍。

第七个误区是“开源合规是法务的事”。开源合规需要研发识别依赖、架构设计隔离、信息安全管理漏洞、采购控制供应商、法务解释许可证、知识产权评估专利和商业秘密、业务决定商业策略。任何单一部门都无法独立完成。

标准与工具：SBOM、SCA和开源AI定义的意义

开源合规正在从人工审查走向标准化工具链。

SCA工具可以扫描代码库，识别开源组件、许可证、版本、安全漏洞和传递依赖。它不能替代法律判断，但可以解决“企业不知道自己用了什么”的基础问题。没有组件识别，后续所有合规判断都没有对象。

SBOM则是软件物料清单。它记录产品中包含哪些组件、版本、供应商、许可证和依赖关系。SBOM在供应链安全、漏洞响应、政府采购和企业审计中越来越重要。发生Log4j类漏洞时，企业能否快速判断自身产品是否受影响，很大程度取决于是否维护准确SBOM。

对AI项目而言，传统SBOM还不够。企业可能需要模型物料清单（Model BOM）或AI物料清单（AI BOM），记录模型基座、权重版本、训练数据来源、微调数据、评测数据、许可证、模型卡、安全测试和部署环境。未来AI监管和采购审计很可能要求类似清单。

OSI发布的Open Source AI Definition（开源 AI 定义）意义也在于此。它试图把传统开源的“可使用、可研究、可修改、可分享”原则迁移到AI系统中，并要求提供足以理解和修改系统的信息。即使产业界尚未完全接受该定义，它也为判断“开放权重”“开源AI”“开放模型”之间的差异提供了参照。

从法律实践角度看：开源审查速查表

开源审查速查表：节点、问题与留痕

点击可查看大图

从法律实践角度看，开源审查不应只形成一份抽象法律意见，而应在项目关键节点留下可复核的判断依据。软件、模型和数据项目越复杂，越需要把许可证审查、权利来源审查、架构审查、安全审查和跨境审查放进同一套流程。

使用速查表时，应注意两个原则。第一，表格只能提示审查入口，不能替代个案判断。例如 GPL义务是否触发，仍要结合复制、修改、链接、分发和模块关系分析。第二，审查结论应当证据化。代码来源、组件版本、许可证文本、审批记录、模型训练记录、数据来源、访问权限、员工贡献记录和对外发布记录，都可能在争议、融资、采购、并购或监管问询中成为关键材料。

如果企业暂时无法建立完整系统，至少应先做到三件事：建立开源组件和模型来源台账；对 GPL、AGPL、SSPL、Elastic License、自定义模型许可、未知许可证和跨境发布设置升级审批；在每次产品发布时同步生成许可证清单、NOTICE文件、SBOM或AI BOM、源代码提供说明、模型卡、数据摘要、安全说明和用户使用限制。

结语：开放与控制之间的制度重组

开源的下一阶段不是简单扩大开放，也不是重新闭源，而是在开放协作、商业控制、权利保护和监管责任之间重新设计制度边界。

结语：开源的下一阶段，是开放与控制之间的制度重组

开源许可协议走到今天，已经不只是软件行业内部的协作工具。它同时连接著作权、专利、商业秘密、反不正当竞争、出口管制、AI监管和平台竞争。

在传统开源语境下，争议通常集中在代码使用授权和Copyleft义务的触发条件：企业能否复制、修改、集成或分发特定代码，以及在何种情况下需要公开修改部分或衍生作品的源代码。

进入AI时代后，问题被进一步拆解为更复杂的权利链条和责任链条：公开代码或受版权保护作品能否用于模型训练，模型权重是否具有可保护利益，模型输出的权利归属如何判断，许可证能否约束蒸馏模型和合成数据，开放权重能否称为开源，模型发布是否触发出口管制，下游高风险应用又应由谁承担责任。

这些问题目前没有一个统一答案。更准确的判断是：开源许可正在从“源代码许可”走向“技术系统治理”。它不会替代著作权、专利、商业秘密和监管合规，也不会自动化解AI训练数据和模型输出的法律不确定性。但它会继续作为企业组织生态、争夺标准、降低采用门槛和塑造竞争格局的重要工具。

对企业而言，最稳健的态度不是害怕开源，也不是迷信开源，而是把开源放进完整的知识产权和合规战略中：该开放的开放，该隔离的隔离，该保密的保密，该审查的审查。只有这样，开源才不会只是风险来源，而能成为真正的竞争资产。

上一篇：专利池的产业实务与合规操作下一篇：内幕交易认定的法律争议问题研究

打印中伦文章

法律报告 >

《新经济系列：低空经济法律与合规指南》

出版物 >

【中伦三十周年系列文集】

月度精选 >

中伦深度观察2026年6月

专业文章

最新交易

中伦为Ferguson以16亿美元收购FloWorks项目提供中国法律支持

中伦襄助中际旭创在香港联交所主板上市

最新动态

最新荣誉

ARTICLES

大模型时代的开源许可证：从GPL到开放权重，代码、数据与模型输出的法律边界（下篇）