大英百科全书直接下狠手,把OpenAI告上法庭,指控对方“大规模侵犯版权”。这家公司同时拥有Merriam-Webster韦氏词典,声称自己旗下近10万篇在线文章,全被OpenAI未经授权爬取,用来训练大模型。诉状里写得明明白白:不光是训练阶段侵权,ChatGPT输出内容里还出现大段逐字逐句照搬,或者部分原文直接复刻。更狠的是,他们指OpenAI在RAG流程里继续调用这些文章来实时补充信息,这也算侵权。
RAG这套机制大家都知道,模型遇到最新问题时,会去网上或数据库捞资料再生成答案。 Britannica认为这等于把他们的内容当免费外挂用,白嫖流量。诉状里还点名OpenAI违反了兰哈姆法,也就是商标法。原因是ChatGPT经常胡编乱造,把幻觉内容硬塞给用户,还假装出自大英百科,严重误导公众。
最扎心的一句来了:“ChatGPT直接抢了像我们这样的出版商饭碗。”用户问个问题,ChatGPT几秒钟甩出答案,谁还愿意点进官网付费看原文?流量没了,广告收入自然跟着蒸发。 Britannica直言,这种行为让高质量、可信的在线信息面临生存危机。
这不是孤例。纽约时报早就带头开干,Ziff Davis旗下一堆科技媒体也加入战团,美国加拿大十几家报纸,包括芝加哥论坛报、丹佛邮报、多伦多星报、加拿大广播公司,全都把OpenAI告了。Britannica自己之前还告过Perplexity,那案子到现在还没结。
法律上目前没铁板钉钉的先例。训练数据用版权内容到底算不算侵权,法院吵得不可开交。Anthropic那案子算是个参考:联邦法官William Alsup认可训练行为本身有“变革性”,可以适用合理使用原则。但他同时认定Anthropic非法下载数百万本书没付费,这点违法,逼得对方掏了15亿美元和解金给作者们。
OpenAI这次被点名后,到TechCrunch发稿前都没吱声。行业里不少人私下议论:大模型公司吃相太难看,早晚得付出代价。出版商们现在集体反扑,摆明了要逼出个说法。
加密市场这边倒是热火朝天。BTC现报$73,957(24h +2.97%),ETH直接拉升$2,317(24h +9.78%),XRP冲到$1.52(24h +6.85%),连SOL都站上$94.11(24h +6.30%)。资金明显在风险资产里找刺激,AI版权大战这种新闻反而成了情绪催化剂之一。
出版商告AI公司这事儿,短期看是版权官司,长期看其实在打生态控制权。谁掌握高质量内容,谁就握住了未来信息分发的命脉。OpenAI现在靠规模和先发优势横冲直撞,可一旦输掉几场关键官司,训练数据成本暴涨,商业模式就得重写。
Britannica这回态度很硬。他们不光要赔偿,更想立规矩:用我的内容,得付钱;输出我的原文,得授权;幻觉冒充我,得道歉赔钱。诉状里每一句都在喊:免费午餐到此为止。
其他媒体估计也在磨刀霍霍。下一个原告名单里,很可能还有更多老牌内容巨头。OpenAI如果继续装死,后面只会更被动。毕竟,法律从来不讲情面,只认证据和判例。
这场仗才刚开打。