據路透社報道,Meta Platforms 被指控在使用未經許可的書籍訓練人工智能語言模型 Llama,該訴訟由著名作家聯合發起。本週一起,該案與另一起類似訴訟合併審理。上個月,加州一位法官駁回了部分訴訟,但表示將允許作者修改訴訟內容。新訴狀顯示,Meta 研究員在 Discord 上討論獲取數據集時,曾提到考慮過使用盜版書籍訓練 AI 模型的法律風險。Meta 律師稱,這些數據無法使用,如果使用了的話,模型也無法發佈。
今年,多家科技公司都面臨著內容創作者的類似指控,他們指責這些公司在構建生成式 AI 模型時侵犯了作品版權。
Meta 於今年2月推出了首版 Llama 大型語言模型,對用於訓練的數據集列表進行公開,其中包括「ThePile」數據集的「Books3」部分。該數據集包含196,640本書籍。該公司沒有公開 Llama 2 模型的訓練數據。該模型於今年夏天面向商業用戶開放。