[ad_1]
Sarah Silverman 正在起诉 OpenAI。 周五,这位喜剧演员兼作家与小说家克里斯托弗·戈尔登 (Christopher Golden) 和理查德·卡德雷 (Richard Kadrey) 一起对 Meta ()。 该组织声称,这些公司在未经同意的情况下,使用受版权保护的材料(包括他们出版的作品)来训练他们的大型语言模型。
投诉主要围绕 OpenAI 和 Meta 据称用于训练 ChatGPT 和 LLaMA 的数据集。 就 OpenAI 而言,虽然它的“Books1”数据集大致符合古腾堡计划(一个著名的无版权图书存储库)的大小,但原告的律师认为“Books2”数据集太大,无法从其他任何地方获得比所谓的“影子图书馆”非法获取受版权保护的材料,例如 Library Genesis 和 Sci-Hub。 日常盗版者可以通过直接下载来访问这些材料,但对于那些生成大型语言模型的人来说可能更有用,许多影子库还以批量 torrent 包的形式提供书面材料。 Silverman 的诉讼涉及这位喜剧演员的律师和 ChatGPT 之间的交流。 西尔弗曼的法律团队要求聊天机器人进行总结 尿床者, 她于 2010 年出版的回忆录。聊天机器人不仅能够勾勒出书中的全部内容,而且它所转述的一些段落似乎是逐字复制的。
Silverman、Golden 和 Kadrey 并不是第一批起诉 OpenAI 侵犯版权的作者。 事实上,该公司在如何培训 ChatGPT 方面面临着一系列法律挑战。 仅在六月份,该公司就收到了两起单独的投诉。 其中一项是一项广泛的集体诉讼,指控 OpenAI 通过抓取数据来训练 ChatGPT 和 DALL-E 背后的大型语言模型,从而违反了联邦和州隐私法。
[ad_2]
Source link