英伟达新一代 Blackwell GPU 被曝存在过热问题,导致交付延迟

xxn 阅读:47457 2024-11-18 08:01:16 评论:0
感谢IT之家网友 HH_KK华南吴彦祖 的线索投递!

IT之家 11 月 18 日消息,当地时间周日,据《The Information》报道,英伟达新一代 Blackwell 处理器在高容量服务器机架中存在严重的过热问题。这些问题导致设计调整与项目延期,使谷歌、 Meta 和微软等主要客户对是否能按计划部署 Blackwell 服务器感到担忧。

知情人士透露,Blackwell GPU 专为 AI 和高性能计算(HPC)设计,但在配置 72 个处理器的服务器中出现过热问题,此类服务器每个机架功耗最高可达 120 千瓦。过热问题迫使英伟达多次修改机架设计,不仅限制了 GPU 性能,还可能损害硬件。客户因此担心,这些技术问题会延迟数据中心的处理器部署进程。

为解决这一难题,英伟达要求供应商调整机架设计,并与合作伙伴一起优化散热系统。尽管这种工程改进是大规模技术发布中的常规步骤,但也进一步推迟了产品交付时间。

英伟达发言人就此向路透社表示,公司正与云服务提供商密切合作,设计调整是正常研发流程的一部分。英伟达期望通过这种合作确保最终产品在性能和可靠性方面符合预期,并加快解决技术瓶颈。

IT之家获悉,修订后的 Blackwell GPU 于今年 10 月底才开始量产,预计最早明年 1 月底发货。谷歌、Meta、微软等科技巨头依赖英伟达 GPU 训练其最强大的 AI 模型,产品延期对这些客户的研发计划和产品发布造成的影响自然是不可避免的。

今年 3 月,英伟达展示了 Blackwell 芯片,并曾表示将在第二季度发货。

相关阅读:

广告声明:文内包含的外部链接仅用于提供更多信息,节省甄选时间,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容