LMSYS Arena估值飙到17亿美元,背后金主就是被它排名的巨头

2026-03-19 06:30:16

LMSYS Arena这个名字,现在在AI圈子里几乎无人不晓。七个月时间,从加州大学伯克利分校几个博士生的研究项目,直接摇身一变成了估值17亿美元的独角兽。这速度,确实够猛。

平台最早叫LM Arena,后来改名Arena,主打的就是让大家直接盲测大模型,谁强谁弱全靠真人投票。跟传统静态基准测试不一样,Arena用的是实时对战模式:两个模型匿名答题,用户投完票才揭晓身份。这种机制直接把刷榜难度拉满。过去那些靠数据投毒、针对性刷分的套路,在这里基本玩不转。

联合创始人Anastasios Angelopoulos和Wei-Lin Chiang最近接受Equity节目专访,直言他们的核心卖点就是“结构性中立”。听起来很玄乎,其实拆开讲就是:投票数据不给模型公司直接看,排名算法也不公开细节,评委里还掺杂大量专业领域用户。结果就是,哪怕OpenAI、Google、Anthropic这些巨头都投了钱进来,Arena依然敢把Claude排在某些榜单第一。

他们特别提到,Claude目前在法律和医疗专家榜单上持续领跑。不是泛泛的聊天能力,而是真刀真枪的专业场景测试里,Claude的回答让从业者更信服。反观其他模型,偶尔冲高,但稳定性差一截。

Arena的野心不止于聊天。访谈里两人透露,正在把战场往agent、编程和真实世界任务上推。新推出的企业版产品,已经开始给公司提供定制化benchmark服务。简单说,就是你花钱,我们帮你测自家模型在具体业务场景下到底行不行。相比公开的聊天榜单,这个方向赚钱空间更大,也更贴近商业落地。

讽刺的是,这个号称“你没法作弊”的榜单,恰恰是被它排名的公司们集体供血。OpenAI、Google、Anthropic都成了金主。这种模式难免让人起疑:真中立吗?创始人回应得很直接——资金进来不代表控制排名,平台把数据和算法防火墙建得死死的。但外界还是忍不住问:如果哪天巨头们集体撤资,或者要求调整权重,Arena还能硬气多久?

七个月17亿估值,背后是AI军备竞赛的白热化。谁都不想掉队,谁都怕被对手甩开榜单几条街。Arena抓住了这个心理,硬生生把自己做成了行业风向标。连带影响了融资节奏、产品发布时间表,甚至公关话术。

加密市场今天一片血海,BTC跌到$71,063(24h -4.50%),ETH直接砸穿$2,193(24h -5.88%),主流币集体下挫5%左右。AI叙事却还在高位狂飙。Arena这种项目,估值已经跟不少中型公链差不多,可见资本对前沿大模型评测赛道的疯狂押注。

未来几个月,Arena大概率还会继续扩张。编程榜、agent榜、长上下文任务榜……每一个新维度,都是新故事、新融资的起点。但越往深处走,真正难搞的不是技术,而是怎么在巨头环伺下守住那点来之不易的公信力。

这碗饭,吃得香,也烫嘴。

« 1inch要让美国大学把DeFi写进正课... Kraken 8000万美元IPO计划喊停 熊市逼得交易所先... »

相关资讯