Meta Platforms 在其首席執行官馬克·扎克伯格的批准下,使用盜版版權書籍訓練其人工智能模型。
根據新披露的法庭文件,一組作者聲稱這家社交媒體巨頭知道他們正在使用盜版作品來訓練他們的人工智能系統。
作者在法庭文件中表示,Meta 在發現過程中生成的內部文件表明,該社交網絡公司瞭解盜版書籍。《衛報》報道,其首席執行官扎克伯格支持使用 LibGen 數據集,這是一個巨大的在線圖書檔案。儘管該公司的人工智能執行團隊內部警告稱,這是一個“我們知道是盜版的”數據集,但情況還是如此。
美國作家塔內西斯·科茨、喜劇演員莎拉·西爾弗曼和其他起訴該公司侵犯版權的作家在週三向加州聯邦法院公開的文件中提出了這些指控。
作者於 2023 年將 Meta 告上法庭,指控這家社交媒體公司濫用他們的書籍來訓練人工智能模型,特別是 Llama,這是爲其聊天機器人提供動力的大型語言模型。
Library Genesis 或 LibGen 數據集起源於俄羅斯,是一個“影子圖書館”,聲稱包含數百萬本小說、通知書以及科學雜誌文章。
2024 年,紐約聯邦法院要求 LibGen 的匿名運營商向一羣出版商支付3000 萬美元版權侵權賠償金
這是衆多其他指控之一,指控作者、藝術家和其他人的受版權保護的作品在未經所有者同意的情況下被用來訓練 ChatGPT 聊天機器人等生成人工智能工具。創意專業人士警告說,未經同意使用他們的作品會危及他們的商業模式。
據路透社報道,被告辯稱他們合理使用了受版權保護的材料。
據報道,在 Meta 案件中,作者週三請求法院允許提交更新的申訴。他們在論點中指出,新證據表明社交網絡公司使用了人工智能訓練數據集 LibGen,其中包括數百萬份盜版作品,並通過點對點種子進行分發。
據他們稱,扎克伯格“儘管 Meta 的人工智能執行團隊(以及 Meta 的其他人)擔心 LibGen 是‘我們知道是盜版的數據集’,但還是批准了 Meta 使用 LibGen 數據集。”
該文件還引用了一份提及扎克伯格名字縮寫的備忘錄,並指出“升級到 MZ 後”Meta 的人工智能團隊“已被批准使用 LibGen”。
去年,美國地區法官文斯·查布里亞 (Vince Chhabria) 駁回了有關 Meta 人工智能模型生成的文本侵犯作者版權以及 Meta 非法剝奪圖書版權管理信息的指控。這是指有關作品的信息,包括標題、作者姓名和版權所有者。
然而,原告被允許修改他們的主張。作者在本週的辯論中表示,證據支持了他們的侵權主張,並證明有理由重新提起版權管理信息案件,並增加了新的計算機欺詐指控。
在週四的聽證會上,法官表示,儘管他對欺詐指控的實質內容持懷疑態度,但他將允許提交人提出修改後的申訴。
搜索...