加密圈最近日子不好过,BTC现报$70,197(24h跌5.21%),ETH现报$2,167(24h跌6.67%),主流币集体挨刀,市场情绪低迷。反倒是AI赛道还在烧钱狂飙,算力短缺、供应链不稳成了新痛点。Lux Capital前几天直接发话:靠AI的公司赶紧把算力承诺写进合同,别指望口头协议。违约率已经飙到9.2%,历史高位,谁敢赌明天服务器还在?
Multiverse Computing这家西班牙公司抓住了这个窗口期。他们不卷大模型堆参数,而是反向操作——把OpenAI、Meta、DeepSeek、Mistral这些头部实验室的模型狠狠压小,塞进终端设备直接跑。最新动作是两件事同时落地:一款叫CompactifAI的聊天App,加上一个自助API门户。开发者、企业不用再绕AWS Marketplace,直接点进来就能调用他们的压缩模型。
先说App。里面嵌了个叫Gilda的小模型,据Multiverse自己宣称,它小到可以完全本地运行、离线回答问题。数据不离设备,隐私拉满,对标的就是苹果那套“端侧+云端”混合打法。实际用起来有个硬伤:手机RAM和存储不够就自动切云端,隐私瞬间归零。Sensor Tower数据摆在那,上个月下载量还不到5000,离爆款差得远。很明显,这App不是冲着C端用户去的,就是个展示窗口,证明“压缩模型真能本地跑”。
真正重头戏在API门户。Multiverse把压缩技术取名CompactifAI,内核是量子启发算法,号称能让模型体积缩小同时性能损失可控。最新成果HyperNova 60B 2602基于公开的gpt-oss-120b做压缩,他们放话:响应速度比原版更快,成本更低,尤其适合agentic coding这种多步自主编程场景。企业最关心的无非两点:省钱+可控。实时监控用量、透明计费,这些功能都直接给了。CEO Enrique Lizaso直言,这套API就是给生产环境准备的。
小模型这两年确实在追赶。Mistral前几天刚推Mistral Small 4,号称同时优化聊天、代码、agent任务和推理能力,还顺手放出Forge工具,让企业自己调参做定制模型。Multiverse的压缩路线本质上殊途同归,都是在“够用”和“便宜”之间找平衡。差距确实在缩小,但离彻底取代百亿参数大模型还早。
他们已经服务了100多家全球客户,包括加拿大央行、博世、伊维尔德罗拉这些硬核玩家。去年刚拿完2.15亿美元B轮,现在市场传闻又在新一轮融资,目标5亿欧元,估值冲破15亿欧元。放在当下熊市,这数字听着都觉得猛。
本地跑AI的最大价值其实不在手机聊天,而在那些云连不上的场景。无人机、卫星、偏远工业设备、关键基础设施,一旦断网大模型就哑火,压缩后的小模型反而成了救命稻草。隐私敏感的金融、医疗、军工领域也一样,数据不出本地等于少了一层泄露风险。
加密市场血流成河,AI公司却在赌另一条路:把算力需求从云端拉回终端。Multiverse这波操作算不上革命,但至少证明了一件事——效率正在变成新护城河。谁先把模型压到“够用又便宜”,谁就可能在下一轮洗牌里活下来。