三位作者对人工智能初创公司 Anthropic 提起 诉讼 ,指控该公司未经许可使用他们的版权作品来训练其 Claude 语言模型。
Andrea Bartz、Charles Graeber 和 Kirk Wallace Johnson 向加州法院提起诉讼,指控 Anthropic “盗版”了他们的著作,用于开发其 AI 系统。作者声称 Anthropic 从非法网站下载了盗版书籍,用作训练数据。
诉讼称,Anthropic“通过窃取数十万本受版权保护的书籍建立了价值数十亿美元的企业”。诉讼称,该公司“无视版权保护”,并“大规模盗窃版权作品”来训练其Claude 模型。
Anthropic 尚未对这些指控发表实质性评论,只是表示“知道”这一法律行动。此案与针对微软和 OpenAI 等其他 AI 公司使用受版权保护的材料开发大型语言模型的类似诉讼案有关。它凸显了内容创作者和 AI 公司在知识产权方面日益紧张的关系。
根据投诉,Anthropic 使用名为“The Pile”的数据集来训练 Claude。据称,该数据集包含一组名为“Books3”的盗版电子书,其中包含近 20 万本从未经授权来源下载的书籍。
作者认为,Anthropic 明知自己在未经许可的情况下使用了受版权保护的作品。他们声称,该公司“故意偷工减料,依靠偷来的材料来训练他们的模型”,而不是获得适当的许可。
诉讼称,Anthropic 的行为损害了作家的利益,剥夺了他们的图书销售和许可收入。诉讼称,该公司的人工智能模型现在与人类撰写的内容竞争,威胁到作家的生计。
就背景而言,Anthropic 将其 Claude 模型定位为 OpenAI 的 ChatGPT 和其他著名 AI 聊天机器人的竞争对手。该公司已筹集了数十亿美元的资金,估值超过 180 亿美元。
批评者认为,人工智能公司应该为使用其作品作为训练数据的作者和出版商提供补偿。谷歌等一些公司已经开始与新闻机构和其他内容提供商达成许可协议。
然而,人工智能开发人员认为,使用受版权保护的材料进行机器学习属于版权法的“合理使用”规定。他们辩称,他们的模型并不是复制训练文本的精确副本。
这场辩论涉及版权如何适用于人工智能开发的复杂法律和道德问题。法院可能需要确定人工智能训练是否构成版权侵权或变革性合理使用。
对于作者来说,这起诉讼代表着他们试图控制自己的作品在人工智能开发中的使用方式。他们认为,从人工智能中获利的公司应该向创作者支付报酬,因为创作者的作品推动了这项技术的发展。
如果法院裁定公司必须获得培训中使用的所有受版权保护材料的许可,此案可能会对人工智能行业产生重大影响。这可能会增加人工智能开发的成本和复杂性。
Anthropic 一直致力于开发“安全且合乎道德”的人工智能系统。该公司首席执行官将其描述为“专注于公共利益”。然而,作者的诉讼挑战了这一形象,指控 Anthropic 通过侵犯版权来建立其业务。
该投诉寻求对涉嫌故意侵犯版权的行为进行法定赔偿,并寻求禁令以防止 Anthropic 进一步未经许可使用作者的作品。
随着人工智能能力的不断增强,知识产权争议可能会愈演愈烈。内容创作者认为,他们的作品应该受到保护和补偿,而人工智能公司则力争获取广泛的数据集,以改进他们的模型。
类似针对 Anthropic 的案件结果可能有助于塑造人工智能开发的法律和监管格局。它可能会影响公司如何处理训练数据收集,以及广泛的许可是否会成为常态。
目前,这起诉讼加剧了大型人工智能公司在使用版权材料方面面临的法律挑战。随着法院努力解决这些问题,他们的裁决可能会对人工智能和内容创作的未来产生深远影响。
该案为 Andrea Bartz 等人诉 Anthropic PBC 案,美国加利福尼亚州北区地方法院,案号 3:24-cv-05417。