Meta Platforms 在其首席执行官马克·扎克伯格的批准下,使用盗版版权书籍训练其人工智能模型。
根据新披露的法庭文件,一组作者声称这家社交媒体巨头知道他们正在使用盗版作品来训练他们的人工智能系统。
作者在法庭文件中表示,Meta 在发现过程中生成的内部文件表明,该社交网络公司了解盗版书籍。《卫报》报道,其首席执行官扎克伯格支持使用 LibGen 数据集,这是一个巨大的在线图书档案。尽管该公司的人工智能执行团队内部警告称,这是一个“我们知道是盗版的”数据集,但情况还是如此。
美国作家塔内西斯·科茨、喜剧演员莎拉·西尔弗曼和其他起诉该公司侵犯版权的作家在周三向加州联邦法院公开的文件中提出了这些指控。
作者于 2023 年将 Meta 告上法庭,指控这家社交媒体公司滥用他们的书籍来训练人工智能模型,特别是 Llama,这是为其聊天机器人提供动力的大型语言模型。
Library Genesis 或 LibGen 数据集起源于俄罗斯,是一个“影子图书馆”,声称包含数百万本小说、通知书以及科学杂志文章。
2024 年,纽约联邦法院要求 LibGen 的匿名运营商向一群出版商支付3000 万美元版权侵权赔偿金
这是众多其他指控之一,指控作者、艺术家和其他人的受版权保护的作品在未经所有者同意的情况下被用来训练 ChatGPT 聊天机器人等生成人工智能工具。创意专业人士警告说,未经同意使用他们的作品会危及他们的商业模式。
据路透社报道,被告辩称他们合理使用了受版权保护的材料。
据报道,在 Meta 案件中,作者周三请求法院允许提交更新的申诉。他们在论点中指出,新证据表明社交网络公司使用了人工智能训练数据集 LibGen,其中包括数百万份盗版作品,并通过点对点种子进行分发。
据他们称,扎克伯格“尽管 Meta 的人工智能执行团队(以及 Meta 的其他人)担心 LibGen 是‘我们知道是盗版的数据集’,但还是批准了 Meta 使用 LibGen 数据集。”
该文件还引用了一份提及扎克伯格名字缩写的备忘录,并指出“升级到 MZ 后”Meta 的人工智能团队“已被批准使用 LibGen”。
去年,美国地区法官文斯·查布里亚 (Vince Chhabria) 驳回了有关 Meta 人工智能模型生成的文本侵犯作者版权以及 Meta 非法剥夺图书版权管理信息的指控。这是指有关作品的信息,包括标题、作者姓名和版权所有者。
然而,原告被允许修改他们的主张。作者在本周的辩论中表示,证据支持了他们的侵权主张,并证明有理由重新提起版权管理信息案件,并增加了新的计算机欺诈指控。
在周四的听证会上,法官表示,尽管他对欺诈指控的实质内容持怀疑态度,但他将允许提交人提出修改后的申诉。
搜索...