亚马逊 AWS AI 训练芯片 Trainium2 实例全面可用,公布下代 3nm Trainium3

xxn 阅读:44522 2024-12-04 16:03:01 评论:0

IT之家报道,亚马逊 AWS今日宣布推出基于其自家研发AI训练芯片Trainium2的Trn2实例,并推出了Trn2 UltraServer大型AI训练系统,同时发布了下一代更先进的3nm制程Trainium3芯片。

▲ Trainium2芯片

Trn2实例包含16颗Trainium2芯片,各芯片间采用NeuronLink互联,提供20.8 petaflops的峰值算力,适合数B参数大小模型的训练和部署。

亚马逊表示,Trn2实例相较于当前一代基于GPU的EC2 P5e和P5en实例,性价比提高了30-40%。

▲ Trn2实例服务器机架

Trn2 UltraServer汇聚了4台Trn2服务器,总共64颗Trainium2芯片,算力峰值扩展至83.2 petaflops,可满足目前世界上最大规模模型的训练和部署需求。

▲ Trn2 UltraServer

亚马逊正与其投资的AI模型企业Anthropic共同构建一个名为Project Rainier的EC2 UltraCluster计算集群,该集群包含数十万颗Trainium2芯片。

据悉,该集群有望成为迄今为止公开的最大AI计算集群,整体算力达Anthropic目前用于训练最先进Claude模型所需量的5倍以上。

亚马逊AWS还公布了下一代Trainium3 AI训练芯片,这也是AWS首款采用3nm制程的芯片产品。亚马逊表示,基于Trainium3的UltraServer性能可达Trn2 UltraServer的4倍,首批基于Trainium3的实例预计将于2025年底推出。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容