ARTICLES

专业文章

“AI声音侵权”之我见

作者：陈志军佀荣天 2024-09-20 语音播报

引言

人们通过五感，即“形、声、闻、味、触”来对外在世界进行感官上的认知，在《红楼梦》第三回“托内兄如海荐西宾，接外孙贾母惜孤女”中，王熙凤初登场时，未见其人，先闻其声，寥寥数语就将其人物性格勾画的淋漓尽致，声音对于个人的识别作用可见一斑。

随着人工智能（AI）技术在生成声音领域的飞速发展和广泛应用，AI生成的声音与特定自然人的声音的差异也将变得越来越难以区分。伴随而来的“AI声音侵权”的相关问题是笔者今日想要探讨、分享的。

一、AI声音的广泛应用

AI声音技术已经广泛应用于多个领域且早已深入大家的日常生活，例如：智能手机或部分APP中的语音助手功能、客服服务、智能家居、车载系统、线上教育、语音识别、语音翻译以及娱乐行业，可以说几乎覆盖了衣食住行各个领域。

在AI声音技术的应用场景中，某些应用场景只需要AI语音将内容清晰准确的输出、传达给使用者即可，对于AI声音的音色特征没有特别要求，即不需要AI声音表现的与某一特定自然人相似。而某些应用场景则需要AI声音的音色特征与某一特定自然人（通常为艺人、声优等）相似，甚至以此为其主要卖点，在这些应用场景下，AI声音可能已经无形中侵犯了他人的权益。

二、AI声音的争议性事件

1、明星AI翻唱——“顶流AI歌手孙燕姿”

目前各大自媒体平台均有一类十分热门的视频或音频，即明星AI翻唱：使用某些AI软件，以明星的其他作品作为素材进行训练，通过生成式模型合成目标音色的音频。

2023年5月，歌手孙燕姿在其个人社交平台上发布了《我的AI》一文，成为华语乐坛较早公开回应AI翻唱的艺人，虽然其文中并未提及AI翻唱是否侵犯其个人权益，但她的回应也引发了社会大众对于AI翻唱乃至AI声音是否侵权的思考。

2、全国首例AI声音侵权案

2024年8月26日，北京互联网法院发布了《北京互联网法院服务保障新质生产力加快发展白皮书》（以下简称“白皮书”），白皮书中包括了北京互联网法院服务保障新质生产力十大典型案例，其中“殷某某诉某智能科技公司等人格权侵权案”系国内首例依法判决的AI生成声音侵权案件。该案的基本案情、裁判要点及裁判结果如下：

（1）基本案情

原告殷某某是一名配音演员，其经朋友告知，发现他人利用其配音制作的作品在多个知名APP广泛流传。经声音筛选和溯源，发现上述作品中的声音来自于被告一某智能科技公司运营的平台中的文本转语音产品。原告曾接受被告二某文化传媒公司的委托录制录音制品，被告二为录音制品的著作权人。后被告二将原告为其录制的录音制品的音频提供给被告三某软件公司。被告三仅以原告录制的一部录音制品作为素材进行AI化处理，生成了涉案文本转语音产品并在被告四某网络科技公司运营的云服务平台对外出售。被告一某智能科技公司与被告五某科技发展公司签订在线服务买卖合同，由被告五向被告三下单采购，其中包括了涉案文本转语音产品。被告一某智能科技公司采取应用程序接口形式，在未经技术处理的情况下，直接调取并生成文本转语音产品在其平台中使用。原告主张，被告的行为已经严重侵犯了原告的声音权益，被告一某智能科技公司、被告三某软件公司应立即停止侵权、赔礼道歉，五被告应当赔偿原告经济损失、精神损失。

（2）裁判要点

a)原告声音权益及于涉案AI声音

自然人声音以声纹、音色、频率为区分，具有独特性、唯一性、稳定性特点，能够给他人形成或引起一般人产生与该自然人有关的思想或感情活动，可以对外展示个人的行为和身份。自然人声音的可识别性是指在他人反复多次或长期聆听的基础上，通过该声音特征能识别出特定自然人。利用人工智能合成的声音，如果能使一般社会公众或者相关领域的公众根据其音色、语调和发音风格，关联到该自然人，可以认定为具有可识别性。本案中，因被告三系仅使用原告个人声音开发涉案文本转语音产品，而且经当庭勘验，该AI声音与原告的音色、语调、发音风格等具有高度一致性，能够引起一般人产生与原告有关的思想或感情活动，能够将该声音联系到原告本人，进而识别出原告的主体身份。

b)被告关于获得原告合法授权的抗辩不能成立

被告二对录音制品享有著作权等权利，但不包括授权他人对原告声音进行AI化使用的权利。被告二与被告三签订数据协议，在未经原告本人知情同意的情况下，授权被告三AI化使用原告声音的行为无合法权利来源。因此，被告二、被告三关于获得原告合法授权的抗辩不能成立。

c)未经许可使用原告声音构成侵权

被告二、被告三未经原告许可AI化使用了原告声音，构成对原告声音权益的侵犯，其侵权行为造成了原告声音权益受损的后果，应承担相应的法律责任。被告一、被告四、被告五主观上不存在过错，不承担损害赔偿责任。因此，综合考量被告侵权情节、同类市场产品价值、产品播放量等因素，对损害赔偿予以酌定。

（3）裁判结果

被告一、被告三向原告书面赔礼道歉，被告二、被告三赔偿原告经济损失25万元。双方当事人均未提起上诉。[1]

三、AI声音侵权的法律分析

根据《中华人民共和国民法典》（以下简称《民法典》）第四编人格权第一千零二十三条第二款的规定，对自然人声音的保护，参照适用肖像权保护的有关规定。明确了自然人的声音权益属于人格权的一种，且参照自然人的肖像权进行保护。

根据《中华人民共和国著作权法》（以下简称《著作权法》）的规定，表演、录音录像等与自然人声音相关的音声作品均为《著作权法》保护的范畴。

我们知道对于需要表现出某些特定声音特质的AI声音的形成需要以特定自然人的语音片段作为AI的训练素材，并且输出与特定自然人声音相似的AI声音，在这个过程中可能就会涉及侵犯他人著作权和/或人格权。

1、AI声音侵犯他人著作权

根据《生成式人工智能服务管理暂行办法》第七条的规定，生成式AI服务提供者开展预训练、优化训练等训练数据处理活动时，如涉及知识产权的，不得侵害他人依法享有的知识产权。

全国网络安全标准化技术委员会于2024年2月29日发布的《生成式人工智能服务安全基本要求》（TC260-003）中也明确规定了在使用商业语料时，应有具备法律效力的交易合同、合作协议等，交易方或合作方不能提供语料来源、质量、安全等方面的承诺以及相关证明材料时，不应使用该语料，应对交易方或合作方所提供语料、承诺、材料进行审核。并且明确对服务提供者提出了知识产权方面的安全保护要求，包括：语料用于训练前，应对语料中的主要知识产权侵权风险进行识别，发现存在知识产权侵权等问题的，服务提供者不应使用相关语料进行训练；例如，语料中包含文学、艺术、科学作品的，应重点识别语料以及生成内容中的著作权侵权问题。

根据上述规定可以看出，我国目前已经制定了相应的法律法规对AI声音训练等环节的知识产权保护进行了规定，若AI声音训练过程中使用的物料未取得相关著作权人的许可，或生成的AI声音本身构成对作品的改编而未取得相关著作权人的许可，均有可能构成著作权侵权。

2、AI声音侵犯他人人格权

“AI声音侵权案”即是确认了自然人的声音权益及于AI声音的典型案例。该案对于如何认定AI声音侵犯他人人格权具有极大的指导意义。

首先，该案明确声音权益及于AI声音，《民法典》将人格权独立成编，首次以立法形式将保护“声音”写入民法典，明确参照适用肖像权的形式保护自然人的声音，体现了对人格权益全面尊重和保护的立法精神。[2]

其次，该案明确声音权益应当具有可识别性，根据《民法典》第一千零一十八条第二款的规定，肖像是通过影像、雕塑、绘画等方式在一定载体上所反映的特定自然人可以被识别的外部形象。《民法典》虽未直接对“声音”进行定义，但考虑到《民法典》第一千零二十三条第二款的规定，自然人具有可识别性的声音也应当受到法律的保护。本案中，法院认为自然人声音的可识别性是指在他人反复多次或长期聆听的基础上，通过该声音特征能识别出特定自然人。利用人工智能合成的声音，如果能使一般社会公众或者相关领域的公众根据其音色、语调和发音风格，关联到该自然人，可以认定为具有可识别性。

此外，该案明确了即便AI声音在生成过程中使用的训练素材已经取得了相关的著作权授权，但其生成、输出的AI声音在未取得声音主体自然人许可的情况下，仍然会侵犯声音主体自然人的人格权益。

最后，该案还明确了在AI声音侵权案件中，对于责任及赔偿损失的认定应当综合考量侵权者的主观因素、侵权情节、同类市场产品价值、对被侵权者造成的损害等因素。

四、如何合法合规地使用AI声音

根据上述法律法规、案例分析，不难看出，合法合规地使用AI声音需要建立在取得相关著作权人、声音主体自然人的合法授权或许可的前提下，否则将有可能侵犯他人的著作权或人格权益。除此之外，考虑到AI声音与自然人的个人信息、网络安全等方面的密切联系，在使用AI声音时至少还应当注意以下事项：

1、考虑到自然人的声音属于《中华人民共和国个人信息保护法》（以下简称《个人信息保护法》）规定的可识别的自然人有关的信息，AI声音生成若使用自然人的声音作为语料的，根据《个人信息保护法》《生成式人工智能服务管理暂行办法》以及《生成式人工智能服务管理暂行办法》的规定，取得相应自然人的个人同意，履行个人信息保护义务。

2、根据《生成式人工智能服务管理暂行办法》及《生成式人工智能服务管理暂行办法》的规定，确保生成的AI声音内容应当合法合规，不得存在违反社会主义核心价值观的内容、不得存在包含歧视性的内容。对于将生成式AI用于安全需求较高的特定服务类型的，例如自动控制、医疗信息服务、心理咨询、关键信息基础设施等，不得存在内容不准确或内容不可靠的情形。

3、AI声音的服务提供者应当严格按照《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》以及《生成式人工智能服务管理暂行办法》的规定，在生成或者编辑的信息内容的合理位置、区域进行显著标识。

五、结语

我国目前对于生成式AI是秉持着发展和安全并重、促进创新和依法治理相结合的原则，采取有效措施鼓励生成式AI创新发展，对生成式AI服务实行包容审慎和分类分级监管。

而随着生成式AI技术的飞速发展并且与人们的生活联系越来越紧密，可预见的是未来因生成式AI而产生的争议和纠纷也会与日俱增，而在我国的立法与司法实践中，关于生成式AI相关侵权行为的认定等方面仍有模糊之处，例如：生成式AI输出的作品是否具有著作权，在认定生成式AI侵犯他人著作权的案件中举证责任的归属与界限，生成式AI在训练过程中是否适用合理使用等。

目前我国仍处于AI技术飞速发展的阶段，相关立法及司法实践也在不断地更新、调整，我们期待着会有越来越多的“AI声音侵权案”来为AI领域的司法实践提供指引、借鉴，我们同时也期望随着我国相关立法的日益完善，能够为AI技术的稳步发展保驾护航。

[注]

[1] 参见北京互联网法院：《北京互联网法院服务保障新质生产力十大典型案例》，2024年8月26日，https://baijiahao.baidu.com/s?id=1808549382862581256&wfr=spider&for=pc。

[2] 参见北京互联网法院：《全国首例AI生成声音人格权侵权案一审宣判》，2024年4月23日，https://mp.weixin.qq.com/s/_GxGaG6Q2NYHJWQuOtMyrQ。

上一篇：新《公司法》下债权人基于股东出资责任主张权利的要点分析下一篇：美国301调查应对策略及关税措施影响分析

打印中伦文章

法律报告 >

《智能汽车风控全景报告：驾驭未来的法律挑战》

出版物 >

【中伦三十周年系列文集】

月度精选 >

中伦深度观察2025年7月

专业文章

最新交易

中伦助力北京杰思金材收购上市公司跃岭股份控制权

中伦助力南方润泽科技数据中心REITs项目成功上市

最新动态

最新荣誉

ARTICLES

“AI声音侵权”之我见