英伟达宣布其Blackwell Ultra AI架构在能效与成本方面取得显著突破。根据官方信息,该架构在DeepSeek-R1模型的测试中,相比前代的Hopper GPU架构,其每兆瓦吞吐量实现了大幅提升。
每兆瓦吞吐量是衡量AI芯片能效比的核心指标,指每消耗一瓦特电力所能处理的文本单位数量。数值越高,代表能效越好,运营成本越低。英伟达指出,此次性能飞跃的关键在于技术架构的升级。Blackwell Ultra通过先进的互联技术,将多个GPU连接成统一的高带宽计算单元,远超上一代的设计。此外,全新的计算精度格式与协同设计结构,进一步巩固了其在吞吐性能上的优势。
在AI推理成本方面,新平台相比Hopper架构,实现了每百万Token成本的大幅削减。即便与上一代Blackwell架构相比,新架构在长上下文任务中的Token成本也进一步降低,注意力机制的处理速度得到提升,能更好地适配代码库维护等高负载应用场景。
行业报告指出,与软件编程相关的AI查询量在过去一段时间内显著增长。这类应用通常要求AI代理在多步工作流中保持实时响应,并具备处理长上下文的能力。为应对这一挑战,英伟达通过持续优化其软件栈,进一步提升了混合专家模型等先进模型的推理吞吐量。
英伟达还预告了其下一代计算平台,预计其每兆瓦吞吐量将比Blackwell架构实现进一步显著提升,旨在持续推动AI基础设施的演进。


