news 2026/5/13 13:34:05

爱思唯尔把Meta告了:拿Sci-Hub盗版论文训练大模型

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
爱思唯尔把Meta告了:拿Sci-Hub盗版论文训练大模型
西风 发自 凹非寺
量子位 | 公众号 QbitAI

AI版权大战,再度升级了。

手握《柳叶刀》《细胞》等顶刊,掌控全球海量核心科研成果的学术出版巨头爱思唯尔(Elsevier)正式入局,加入集体诉讼团硬刚Meta——

控诉Meta非法爬取、复制受版权保护的科研论文,用于训练自家大模型Llama。

在此之前,站出来起诉AI侵权的多是作家、媒体机构。

此番是头一回,顶级学术出版商下场打响版权维权之战。美国出版商协会也在声明中给定调:

这是主流出版集团首次发起针对AI企业的诉讼,Meta明目张胆侵犯版权,出版商们将还原全部事实。

有意思的是,这场官司明面上矛头对准Meta,可证据一摊开,与爱思唯尔纠缠十多年的两大盗版学术库——LibGen、Sci-Hub,再度被摆上台面。

只能说Meta树大钱多,比追责盗版平台靠谱多了

多方原告组团上阵,指控Meta侵权

这场诉讼于5月5日在纽约南区法院正式提交,被告直指Meta及其CEO扎克伯格

而原告,不止爱思唯尔一家,还包括法国第一大出版集团阿歇特、源自英国的百年全球综合性出版集团麦克米伦,以及美国小说家、执业律师Scott Turow等。

出版商方核心指控非常明确:Meta为训练Llama大语言模型,未经任何授权,大量获取、复制、盗用受版权保护的学术论文与出版物内容。

具体来看,诉状里指出Meta训练Llama主要靠两大“不清白”的数据来源:

第一,Common Crawl通用爬虫数据集。

这份数据集通过全网抓取生成,囊括数十亿网页内容。原告方称,里面大概率混进了未经授权的版权内容,比如付费期刊的摘要和全文。

第二,两大知名盗版学术平台LibGen、Sci-Hub。

这两个网站常年免费传播海量付费论文、教材与学术著作,长期深陷全球版权诉讼。出版商指控,Meta通过磁力下载、文件共享等方式,从这些网站盗用学术资源。

值得一提的是,本案很多证据,还是从去年那桩“作家告Meta”(Kadrey v. Meta)案里流出来的内部员工邮件。

面对诉讼,Meta发言人表示:将全力积极应诉。

Meta这边抗辩逻辑也十分清晰,打出了一张王牌:合理使用(Fair Use)。

据了解,根据美国版权法,“合理使用”属于版权豁免情形,允许在特定条件下无需授权使用版权内容。

Meta发言人称:“AI正为个人与企业带来颠覆性创新、提升生产效率与创作活力,已有法院判例认定,使用版权内容训练AI可构成合理使用。”

不得不说,这几年AI圈的版权官司确实不少。像《纽约时报》、一堆知名作家都起诉过AI公司,有些案子已经和解了。

但整体而言,利用版权作品训练大语言模型是否合法,目前仍未形成明确司法判例

至于这次后续怎么发展……咱们先搬好小板凳,再蹲一波。

One More Thing

“合理使用”这张牌之前确实被成功使用过。

去年,美国法院裁决:允许Claude背后公司Anthropic在未经作者许可的情况下,使用合法购买的已出版书籍训练AI。

法院参考了美国版权法中的“合理使用”(Fair Use)原则,认为AI训练属于“转化性使用”(Transformative Use),即对原作品的新用途未取代原作市场,且有利于技术创新和公共利益。

这也是美国法院首次认可AI公司对书籍的使用权

就在最近,有网友称Anthropic正在大批量购入古籍,扫描收录内容后就直接销毁原书。这一说法也引发了不少网友关注。

参考链接:
[1]https://www.nature.com/articles/d41586-026-01481-0
[2]https://x.com/sivori/status/2052567312088047754

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

中国AIGC产业峰会最新嘉宾阵容来了

从AI最新架构到应用生态,从AI音乐、AI漫剧、AI浏览器再到世界模型、AI硬件... 这一次,我们希望聚齐AI赛道的实战派,百度、智谱、昆仑万维、模思智能、蚂蚁灵波都会来。🔍了解详情

5月20日,北京·金茂万丽酒店@所有人,马上AI起来!👉 报名参会

一键关注 👇 点亮星标

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/13 13:32:07

C# Chart控件进阶:从静态折线到动态数据监控面板的实现

1. 从静态图表到动态监控的蜕变 刚开始接触C# Chart控件时,我只会用静态数据画些基础折线图。直到有次接手工厂设备监控项目,才发现原来Chart控件能玩出这么多花样。想象一下这样的场景:车间主任站在大屏前,通过下拉框切换不同生…

作者头像 李华
网站建设 2026/5/13 13:29:50

VCS新手避坑指南:解决UVM编译和Verdi启动失败的几个常见问题

VCS新手避坑指南:解决UVM编译和Verdi启动失败的几个常见问题 刚接触Synopsys VCS和Verdi的IC验证工程师或学生,在搭建联合仿真环境时往往会遇到各种"坑"。本文将从实际案例出发,系统梳理UVM编译和Verdi启动过程中最常见的几类问题…

作者头像 李华
网站建设 2026/5/13 13:28:48

从零构建个人装备资产管理系统:设计、实现与部署指南

1. 项目概述:从“装备清单”到“个人资产管理”的进化如果你和我一样,是个对各种装备、工具、数码产品有收集癖,或者工作性质要求你频繁切换不同设备配置的人,那你一定经历过这样的痛苦:每次需要为特定任务&#xff08…

作者头像 李华
网站建设 2026/5/13 13:18:06

3步打造waifu2x-caffe便携版:深度学习图像放大工具免安装指南

3步打造waifu2x-caffe便携版:深度学习图像放大工具免安装指南 【免费下载链接】waifu2x-caffe waifu2xのCaffe版 项目地址: https://gitcode.com/gh_mirrors/wa/waifu2x-caffe 你是否曾遇到过需要快速处理图像但不想安装复杂软件的情况?waifu2x-c…

作者头像 李华