超节点算力集群创新联合体成立：中国移动、浪潮、阿里云等参与，打造 GPU 卡间互联体系

xxn 阅读：9038 2024-12-26 12:03:28 评论：0

IT之家最新报道称，2024年中国人工智能大会（CCAI）以“创新驱动智启新程”为主题，在北京盛大开幕。开幕式上，超节点算力集群创新联合体正式揭牌。

北京市科委、中关村管委会、中国移动、浪潮集团、阿里云、清华大学、中国科学院等单位共同见证了“超节点算力集群创新联合体”的成立。

据中国移动介绍，随着人工智能大模型规模的快速增长，参数已达到万亿级别，模型性能和泛化能力日益提升，对高性能智算基础设施的需求也在增加。传统的单台智算服务器只能容纳8张GPU芯片，已被“超节点算力集群”所取代，以满足日益增长的算力需求。

“超节点算力集群创新联合体”的GPU卡间互联基于中国移动研发的OISA（全向智感互联）协议构建，旨在打造高效、智能、灵活、开放的GPU卡间互联体系，支持大模型训练、推理和高性能计算等数据密集型人工智能应用。

为实现目标，OISA采用全向连接设计，确保大规模GPU之间对等通信；采用智能感知设计，定义流量感知标签，结合流控和重传机制优化数据传输效率。
在协议层面，OISA采用精简的报文格式，支持内存和消息的多语义融合，多层次流控重传以及预设集合通信加速等关键技术，实现高带宽、低时延和高可靠GPU通信能力。
当前Gen1.1版本下，OISA支持超节点内任意GPU卡间的点对点读写互联带宽达896GB/s，每个OISA-Switch芯片支持128个端口、交换容量为51.2T。

据中国移动消息，未来中国移动将全力支持超节点算力集群创新联合体的发展，计划与产业界合作，在单层Switch条件下，基于OISA互联技术推出32/64卡超节点产品，并加速推广128卡超节点产品。

广告声明：本文提供的外部链接仅用于获取更多信息，节省查找时间，结果仅供参考。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。