[ad_1]
一个烫手的山芋: 包括詹姆斯·帕特森 (James Patterson)、玛格丽特·阿特伍德 (Margaret Atwood) 和乔纳森·弗兰岑 (Jonathan Franzen) 等杰出人物在内的 8000 多名作者签署了一封公开信,要求六大人工智能公司的领导者在未事先获得同意并提供补偿的情况下,不要将他们的作品用于训练模型。
这封信由专业作家组织作家协会发表,是写给 OpenAI、Alphabet、Meta、Stability AI、IBM 和微软的老板的。 它呼吁首席执行官们在未经同意、信用或补偿的情况下使用作者的作品来训练他们的大型语言模型,这是“固有的不公正”。
“这些技术模仿并反省我们的语言、故事、风格和想法。数以百万计的受版权保护的书籍、文章、散文和诗歌为人工智能系统提供了‘食物’,这些是没有账单的无尽的食物,”信中写道。 。
“你们花费了数十亿美元来开发人工智能技术。你们对我们使用我们的著作进行补偿是公平的,否则人工智能将变得平庸且极其有限。”
据称,人工智能系统训练所用的许多书籍文本都来自臭名昭著的盗版网站。
NPR 写道,作家协会即将发布的一份报告显示,2009 年至 2019 年间,作家的收入下降了 42%,去年全职作家的收入中位数降至 23,000 美元。 ChatGPT 和 Bard 等生成式人工智能增加了他们的压力,而且一些公司已经用这些系统取代了员工,所以很容易理解愤怒的来源。
作者协会首席执行官玛丽·拉森伯格表示,这封信的目的是说服人工智能公司与作者和解,而不必走上昂贵而漫长的诉讼途径。 并不是所有作者都在避免法律诉讼:Sarah Silverman、Paul Tremblay 和 Mona Awad 是针对 Meta 和/或 OpenAI 的集体诉讼的原告,因为他们使用盗版作品来训练他们的程序。
OpenAI 在一份声明中(通过《华尔街日报》)表示,ChatGPT 接受了“许可内容、公开内容以及由人类人工智能培训师和用户创建的内容”的培训,并补充说该公司尊重创作者和作者的权利。
不仅仅是作者的作品被用于人工智能训练。 谷歌本月早些时候更新了其隐私政策,明确表示该公司保留收集和分析人们在网络上分享的几乎所有内容以训练其人工智能系统的权利。
人工智能公司的文本抓取目前是一个有争议的问题。 埃隆·马斯克表示,Twitter 限制了每天可以阅读的推文数量,据称是为了解决平台上“极端水平”的数据抓取和“系统操纵”问题。 他还威胁要起诉已向 OpenAI 投资数十亿美元的微软非法使用 Twitter 数据。
自从关闭对其 API 的免费访问以停止数据收集以来,Reddit 也面临着一系列麻烦。 此举导致超过 8,000 个 Reddit 子版块被关闭以示抗议,一些子版块还转向了 NSFW。
[ad_2]
Source link