OpenAI GPT-5.4 Pro在Mensa Norway测试中IQ分数直冲150打破自身纪录

2026-04-05 03:25:15

OpenAI最新发布的GPT-5.4 Pro模型在TrackingAI公共排行榜上Mensa Norway测试得分达到150,高于去年o3模型的136分,超过99.96%人类水平。根据TrackingAI数据,这个分数是滚动平均值,领先Claude、Gemini、Qwen和Grok等竞品。OpenAI官方公告显示,GPT-5.4 Pro针对专业工作优化,编码能力更强,工具使用和电脑操作提升明显,上下文窗口扩展到100万tokens。它还在GDPval基准上创下新纪录,在OSWorld-Verified测试中超过人类表现。BTC现报$67,394(24h +0.91%),市场本周聚焦伊朗地缘、能源价格和下周CPI数据,这个AI分数跳升正好撞上宏观噪音,提醒大家机器智能加速已超常规产品周期。

这个分数从136到150的跃升把复杂能力变化浓缩成单一信号,对企业决策影响直接。根据OpenAI发布材料,GPT-5.4 Pro在知识工作基准上全面领先,推动自动化预算和人员规划调整。企业买家看到更强的模式识别、长时序任务处理和浏览器导航,就能加速从实验转向部署,比如文档流程、代码生成和客服支持。Jack Dorsey发帖称Block正用AI取代管理层协调,转向个体贡献者模式。链上数据显示,AI相关基础设施需求正拉动云服务和芯片支出,OpenAI的资本循环已连通硬件扩张和融资链条。ETH现报$2,071(24h +1.08%),投资者无需深究IQ测试方法,就能get到这个14分提升背后的加速趋势,尤其在白领职能竞争加剧时。

公共IQ测试有局限,TrackingAI承认它只捕捉认知一角,忽略推理变异、创造力和真实问题解决,易受提示设计和训练污染影响。o3去年136分时已有类似质疑,现在150分仍需审视。但多基准齐升——编码、搜索、桌面导航——让这个信号更有分量。OpenAI借此强化前沿领导地位,简化开发者、企业和投资者的比较逻辑。下周FOMC会议纪要4月8日出、CPI4月10日、PPI4月14日,美股宏观焦虑在前,AI能力曲线却在后头冒尖。它正渗入劳动力成本重构,推动基础设施出支,即使名义增长放缓。SOL现报$81.04(24h +1.17%),市场开始把OpenAI视作平台公司,能力跳升像宏观变量,影响软件许可、电力需求和生产力预期。

常见问题

GPT-5.4 Pro在Mensa Norway测试得分多少?
根据TrackingAI公共排行榜,得分150,高于o3模型的136分。
这个分数超过多少人类?
超过99.96%人类,处于分布极值尾部。
GPT-5.4 Pro上下文窗口多大?
OpenAI公告显示达100万tokens,支持长文档和代码任务。
« Solana永续合约交易所Drift Protocol遭2.... 英国AI创业公司Greater Things负责人Olive... »

相关资讯