涉人工智能的版权问题之“公平处理”
涉人工智能的版权问题之“公平处理”
一、什么是人工智能?
人工智能 (Artificial Intelligence, “AI”) 是建立在大数据基础之上的一种计算机程式的进阶版,其融合并深度学习了包括哲学、语言学、心理学、认知科学、脑科学、计算机科学等多个学科的成果。现时人工智能的应用范围甚广,涵盖人面识别、人声识别、剖析 (profiling)、网络聊天系统、数据分析、自动化决策 (无人驾驶) 等等。这些系统需要加进和整合各式各类的内容,包括文章、资讯、图片等。人工智能的设计者需不时从内容提供者处获取新的信息和素材,让人工智能可以持续更新和深度学习, 以促进其不断完善。但这些大数据的采集是否已经获得了内容提供者的许可,这是需要格外关注的重要问题。
二、纽约时报诉Open AI等案 (No 1:23-cv-11195)
2023年12月27日, 纽约时报决定在美国纽约控告ChatGPT的母公司Open AI及其投资人,指控他们侵犯版权。这是全球首宗大型报业涉及人工智能的诉讼案。很多人都在密切关注这起案件的结果,希望法庭的判决能够厘清公平处理作为AI 的允许作为的界线。
纽约时报在其诉讼文书中指出,ChatGPT未经许可擅自提取并复制使用了其报业团队旗下的资料文库, 一字不差地出现在ChatGPT生成的内容中。纽约时报亦声称 ChatGPT有时会凭空合成一些文章,并将其冒充为纽约时报的新闻报道。
根据纽约时报采访一位哈佛专家的报道[1],该专家分析称,这次诉讼所指控的侵权行为可归纳为以下三种情况:
(一)ChatGPT在构建自己的数据文库时,曾在互联网上取得大量资讯 (包括纽约时报的文章);
(二)ChatGPT在深度学习/训练时, 会复制这些资讯 (而其中一种侵权行为就是未经许可的复制);
(三)当 ChatGPT进行分析处理时,有时会一字不改地引用纽约时报的文章。
三、Open Al 的答辯
2024年, Open AI及其投资人双双提出撤销纽约时报申请的抗辩书。他们主张自己的行为并没有侵犯版权, 即使曾使用纽约时报的文章, 亦属于版权法中“公平处理 (Fair Use)”的范畴,因此不构成侵权。这一案件仍在审理中。美国的版权法中 “公平处理”是侵犯版权的法定抗辩,其中涉及四步测试[2],包括:
(一)使用的目的和性质,包括是否为商业用涂或非牟利教育用途;
(二)版权作品的性质;
(三)被使用部分占整个作品的比例;
(四)此种使用对版权作品潜在市场或价值的影响。
由于科技日益发展及进步, 美国的版权法刻意地弹性处理“公平处理”, 以此方式与时并进。这种灵活的“公平处理”模式,也引起了韩国和澳大利亚等国对类似法规纳入其版权法体系的考虑。
其实,新进科技而引发的版权问题已不是第一次出现。约十年多年前,谷歌将一些停版或断版的旧书扫描为数字化电子书并提供在线访问,当时亦引发一轮版权纠纷。美国法院在2013年认为谷歌将书籍扫描及下载的行为是“变革性的 (transformative)”[3],属于公平处理,不构成版权侵犯。这亦提高了书籍的曝光度和可知度,间接推动书藉在市场上的销售,对版权持有人没有坏影响。
过去的一年,Open Al多次遭到不同的内容供应商在美国各州提起版权侵权诉讼。其中一件案件的原告曾在纽约法院申请暂停在纽约进行的同类案件[4],又或者把纽约案件转到加州审理,但是这一申请未获接受。这意味着,美国不同地区的法院对类似的版权纠纷,可能会作出不同的判决结果。
四、香港的版权条例 (Cap 528)
反观香港《版权条例》,在允许作为之中, 公平处理需涉及两个要素:
(一)有关处理必须是公平;及
(二) 处理版权作品之用途只局限于特定目的 (这与美国的公平处理并没有局限于某些用途, 是明显不同)。這些特定目的是包括(i) 研究或私人研习; (ii)批评、评论、引用及报道和评论时事 (但此项处理需附有足够的确认声明); (iii) 戏仿, 讽刺,营造滑稽及模仿; (iv)教学; (v)公共行政。
按香港《版权条例》,香港的法庭亦需考虑以下因素:(一) 公平处理的目的和性质;(二) 作品的性质;(三) 就该作品的整项而言,所处理的部分所占的数量及实质程度;(四) 该项处理如何影响该作品的潜在市场价值或价值。
在香港,有关公平处理版权的判例并不多,只有三宗案例[5],全都是程序上的争议。唯一可以肯定的是, 能否成功地提出公平处理作为抗辩理由, 需要综合多个因素及作多方面考虑, 所以很难以简易程序来处理, 需要在审讯期间作全面探讨, 才能最终做出判断。
五、总结
无可厚非,科技一直走在法例之前, 法律亦需不停步地改进,以迎合现实的改变。人工智能技术的快速普及,也给版权保护带来新挑战。在这背景下,能早点厘清版权公平处理的界线,就显得尤为重要。
请注意,本文章仅就提述项目作一般概述,并不构成任何法律意见,如需进一步作法律咨询,请联络本所律师。
[注]
[1] Does ChatGPT violate New York Times’ copyrights? - Harvard Law School. (2024, March 22). https://hls.harvard.edu/today/does-chatgpt-violate-new-york-times-copyrights/
[2] Section 107, US Copyright Act
[3] Rajan, M. T. S. (2024, February 28). Is Generative AI Fair Use of Copyright Works? NYT v. OpenAI - Kluwer Copyright Blog. Kluwer Copyright Blog. https://copyrightblog.kluweriplaw.com/2024/02/29/is-generative-ai-fair-use-of-copyright-works-nyt-v-openai/
[4] Bill Ridgeway, Zick Faigen and Alex Sim.
Reuters.com/lgal/legalindustry/judge-denies-plaintiffs-effort-intervene-new-york-copyright-actions-against-2024-04-17/
[5] Konami Corporation and other v. Info Power Ltd [2006] HCMP 2589/2006; Capcom Co Ltd & another v. Poineer Technologies Ltd & another [2008] HKCU 368 & 627