12月3日消息,亚马逊AWS对外宣布,其新一代自主研发的AI芯片Trainium3已正式推出市场。
作为亚马逊旗下首款运用3nm制程工艺打造的芯片,Trainium3在计算性能、能效表现以及内存带宽这几个关键维度上都取得了显著的提升。
和上一代产品相比,Trainium3的计算性能最多提升了4.4倍,能效提升4倍,内存带宽也差不多翻了两番。依托Trainium3打造的UltraServer系统具备互联扩展能力,单个系统能够容纳144枚芯片,还能为单个应用提供高达100万枚Trainium3芯片的算力支持,规模是上一代的10倍。
亚马逊指出,相较于运用图形处理单元(GPU)的系统,借助Trainium3来训练与运行AI模型,成本最高能够降低50%。
另外,亚马逊已启动下一代产品Trainium4的开发工作。根据披露的信息,Trainium4有望实现FP4计算性能提升6倍、FP8性能提升3倍,内存带宽和容量将分别提升至原来的4倍和2倍,同时支持借助NVLink Fusion和UALink技术进行纵向扩展。
关于与行业领军企业英伟达的关系,AWS负责Trainium项目的副总裁兼首席架构师Ron Diamant清晰地指出:“我觉得我们不会尝试去取代英伟达。”