黄仁勋在Lex Fridman播客里把话说得直白,现代计算问题已经大到一台机器、一张GPU装不下,必须搞极端协同设计才能继续往前冲。
他直接点出,分布式计算把算法拆散后,所有东西都开始互相扯后腿。通信延迟、同步开销、负载均衡,每一步都变成计算机科学里的超级难题。想靠简单堆硬件实现加速?基本行不通,得从算法到系统全链路优化。黄仁勋强调,懂整个栈——从硬件到操作系统,再到应用软件——成了设计计算机的必备能力。以前单机时代还能闭门造车,现在必须跨团队、跨领域死磕细节。
摩尔定律明显慢下来了。黄仁勋说,主要原因是Dennard缩放停滞,功耗密度没法继续线性下降。过去靠制程进步就能轻松提性能,现在线性扩展或者靠摩尔定律的路都走得越来越吃力。这直接逼着整个行业找新出路,英伟达的AI转向就是活生生的例子。
英伟达从游戏GPU起家,转向AI工厂,不是一时头脑发热,而是看准了市场。黄仁勋坦言,做通用计算公司听起来很酷,但太宽泛会稀释专业能力。市场规模决定研发投入,研发投入又决定你在计算领域的实际影响力。游戏卡时代他们就把fp32塞进shader,让GPU从纯图形工具变成能跑通用计算的平台。这一步直接打开了软件兼容的大门。
更狠的是把CUDA直接推到GeForce消费级卡上。黄仁勋回忆,那几乎是存在性威胁级别的赌注。万一开发者不买账,英伟达可能就栽了。结果证明这是公司史上最 brilliant 的决定之一。消费级卡的庞大装机量成了最大护城河。黄仁勋反复强调,装机基数才是架构的命根子,其他东西都是次要的。开发者看到成千上万的用户,才会愿意为你的平台写代码。
他还替x86说了句公道话:没有哪个架构挨的骂比x86多,可它至今仍是定义性架构。批评声再大,实际生态和兼容性让它屹立不倒。这也侧面印证了平台成功的关键——不是技术最完美,而是最能被大规模采用。
英伟达的战略调整,核心是紧盯计算需求和市场动态。 specialization 和 generalization 的平衡永远在拉扯。太专会错过机会,太泛又失去杀手级优势。黄仁勋的经历显示,真正厉害的公司会在关键节点果断下注,同时把整个系统栈吃透。
现在AI训练动辄需要成千上万张卡协同,单靠一张GPU的时代早已过去。极端协同设计成了新常态。黄仁勋的观点很清楚:谁能把硬件、软件、算法、网络、冷却这些环节真正拧成一股绳,谁就能在下一轮计算革命里占到先机。
市场行情这边,BTC现报$70,549(涨3.86%),ETH现报$2,141(涨4.13%),资金情绪相对平稳,但整个行业对算力需求的讨论只会越来越热。英伟达的每一次战略转向,都在提醒从业者:技术迭代快,市场变化更快,只有死磕系统级协同,才能真正卡住位。
黄仁勋的这番谈话,把英伟达这些年的弯路和狠招都摊开了说。听完之后最直观的感受是,计算行业的天花板从来不是芯片制程,而是你敢不敢把整个生态重新设计一遍。英伟达赌CUDA、赌AI、赌全栈协同,现在成了全球最值钱的公司。下一波机会,还在那些愿意把问题拆得更细、协同得更狠的玩家手里。