AI热点 3月前 33 阅读 0 评论

Meta 被曝助推数字盗版:30% 训练 AI 书籍遭二次传播

作者头像

AI技术专栏作家 | 发布了 246 篇文章

IT之家 3 月 27 日消息,科技媒体 WinBuzzer 昨日(3 月 26 日)发布博文,报道称最新研究显示,Meta 在数字图书盗版链中的参与度远超预期。

消息称 Meta 公司使用 LibGen、Z-Library 等“影子图书馆”的盗版书籍训练 AI 模型外,还通过 BitTorrent 重新上传约 30% 的已下载书籍,客观上延长了盗版作品的传播周期。

专家指出,尽管 BitTorrent 默认会分片上传数据,但 Meta 的上传量异常偏高,涉嫌变相成为盗版网络节点。

IT之家曾于今年 2 月报道,Meta 在法庭文件中声称,尽管其从“影子图书馆”中下载了 82TB 的盗版版权资料用于训练其 LLaMA 人工智能模型,但公司员工已采取措施,确保在下载过程中未对任何文件进行“种子分享(seeding)”

不过最新研究指出的二次上传行为可能颠覆这一论点,澳大利亚前总理马尔科姆・特恩布尔发现著作被盗用,斥其“极度不安”,美国普利策奖得主迈克尔・夏邦等已提起诉讼,法国出版商指控 Meta 的行为是“对版权作品的大规模掠夺”。

欧盟委员会已关注此事,可能依据《欧盟 AI 法案》严惩。若法院最终认定 Meta 需为训练数据获取正式授权,将重塑 AI 行业数据获取规则。目前案件走向尚未明朗,但这场版权争议注定成为数字时代知识产权保护的标杆性事件。

相关阅读:

  • 《Meta 为使用盗版素材训练 AI 辩护:下载不分享即合法》

  • 《Meta 深陷盗版泥潭,邮件曝光 81.7 TB AI 训练数据黑幕》

  • 《Meta 遭遇版权诉讼,扎克伯格被指亲自批准 AI 团队用盗版书训练模型》

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!