1月6日消息,在今日举行的CES 2026主题演讲活动上,英伟达首席执行官黄仁勋发表了主题演讲,对外介绍了新一代“Rubin”计算架构,并将该架构定位为当下AI硬件领域的“最先进技术”,目前这一架构已正式进入全面量产阶段。
以天文学家薇拉・鲁宾(Vera Rubin)命名的 Rubin 架构,由六款可协同运作的独立芯片构成。这一系统的核心为 Rubin GPU,此外还搭载了一款专门针对“智能体推理”(Agentic Reasoning)打造的全新 Vera CPU。
为了突破存储与连接瓶颈,英伟达针对Bluefield和NVLink系统实施了定向升级。英伟达AI基础设施解决方案高级总监迪翁・哈里斯(Dion Harris)表示,现代AI系统(特别是智能体AI与长期任务)对KV缓存(Key-Value Cache)的需求给内存造成了极大压力。在此背景下,Rubin推出了全新的外部连接存储层,可更高效地扩展存储池,进而优化工作流程。
在性能表现层面,IT之家引用相关博文内容指出,Rubin架构对比上一代产品取得了明显的提升。依据英伟达官方公布的测试数据,Rubin在AI模型训练任务中的运行速度为Blackwell架构的3.5倍;而在推理任务里,它的速度更是达到了前代的5倍,峰值运算能力更是高达50 Petaflops。
此外,新平台在能效方面的表现也十分出色,其每瓦推理算力较之前提升了8倍。这一性能上的巨大飞跃,将为那些日趋复杂的AI模型提供强有力的算力支持。
Rubin芯片现已明确将被几乎所有主流云服务提供商采用,其中包括与英伟达有着深度合作的Anthropic、OpenAI,以及亚马逊云科技(AWS)。除此之外,惠普企业(HPE)的Blue Lion超级计算机,还有劳伦斯伯克利国家实验室即将推出的Doudna超级计算机,也都将部署Rubin系统。
黄仁勋此前在财报电话会议中曾预测,未来五年,全球在人工智能基础设施领域的投入规模将达到3万亿到4万亿美元。