OpenAI 阿尔特曼晒“星际之门”首期工厂:首期投入 1000 亿美金,建设 10 座数据中心

xxn 阅读:47366 2025-01-24 16:08:24 评论:0
感谢IT之家网友 Xr白糖西窗旧事朱丶工作室 的线索投递!

「星际之门」更多内幕被曝光了!据称,首期投入 1000 亿美金,将在得州阿比林建设 10 座数据中心,未来要在全美打造 20 个超算。与此同时,阿尔特曼秀出了首期工厂的全景,无比震撼。

一大早,阿尔特曼直播刚下线,就炫出了「星际之门」首期工厂。

而我们以上看到的,还仅仅是「星际之门」的 1 号基地。

据称,得州阿比林(Abilene)已经获批 875 英亩地(约 354 万㎡),面积堪比纽约中央公园,计划打造 10 个数据中心。未来,4 年耗资共 5000 亿美金,在全美建设共 20 座超算。

他最新的帖子,是对马斯克昨日嘲讽做出的有力回复。

阿尔特曼与马斯克正面开怼,手撕对方

难道马斯克所说的一切,真的只是噱头吗?

「星际之门」自周二官宣以来,备受各界关注,尤其是 5000 亿美金投资直接引爆了全科技圈的热议。据称,这一金额相当于达到了「曼哈顿计划 + 阿波罗计划」总额。

这一令人瞠目结舌的数字,不得不引发各界的猜想。正如马斯克昨日 battle 的所言,软银实际上获得的融资远不到 100 亿美金。

那么,真实情况到底是怎样的?

SemiAnalysis 独家透露,事实上,「星际之门」的第一阶段已经确定,并在得克萨斯州阿比林数据中心基地展开。

千亿美元集群已锁定

除了阿尔特曼放出的实景,SemiAnalysis 也制作了一张得州集群建设的宏观图。

确定的第一阶段,也仅仅是已承诺的 1000 亿美元投资中的一部分。至少可以说,这个数字最终数字(5000 亿美元)的计算方式着实令人玩味。

4 个月前,著名分析师便在「Multi-Datacenter Training」报告中,已经公开讨论了位于得州阿比林数据中心基地第一阶段规划。

「星际之门」背后真实数据

他们认为,这个项目是按总拥有成本(TCO, Total Cost of Ownership),而非资本支出来计量的。

换言之,1000 亿美元和 5000 亿美元指的是 TCO,其中包括数据中心、服务器、网络设施、电力供应的资本支出,以及债务融资在内的诸多运营成本。

此外,目前只有首期 1000 亿美元项目,已经确定了数据中心选址和电力供应。「星际之门」项目整体资金仍未完全到位。

还有一个容易产生误解的细节是,这个大型项目的第一个算力集群,其实就是去年宣布的 Oracle 和 OpenAI 合作项目。

该项目完全由 Lancium、Crusoe 和 Oracle 负责建设。据分析师了解,软银和 MGX 等其他方并未参与其中。

全美 20 座超算,10 个已开工

实际上,OpenAI 周二官宣博文中,已经明确了「星际之门」是一家新成立的合资企业公司。

在这个项目中,他们计划在未来 4 年内斥资 5000 亿美元,用于 AI 基础设施建设,其中 1000 亿美元将立即投入使用。

这是第二届特朗普政府宣布的首个重大 AI 计划,由于监管政策显著放宽,未来可能会推出更多类似计划。

星际之门计划的股权创始方包括软银、甲骨文、MGX 和 OpenAI,其中前三家公司负责前期注资。

软银和 OpenAI 是核心合作伙伴,软银负责财务管理,而 OpenAI 主导运营工作,包括几乎所有的算力集群管理软件。

如前所述,该项目计划共建设 20 个数据中心,其中 10 个已在得克萨斯州阿比林开工,每个占地面积约 46,500 平方米(50 万平方英尺)。

首期 1000 亿美元支出明细

最初的 Oracle / Crusoe 项目作为其中一个数据中心,将与其他超级园区互联,实现规模比现有任何训练运行,都大数个量级的分布式训练。

此前,阿尔特曼提到的「已经在建设中」的星际之门计划园区,即为 Oracle / Crusoe 阿比林园区。

该园区将容纳供 OpenAI 使用的 10 万台 GB200 算力集群。这个开发项目以及计划在第二季度和第三季度交付的 GB200 服务器,将部署在 Oracle / Crusoe 的数据中心内。

下面是 2024 年 12 月 29 日,拍摄的园区高清照片。

4 个约 11,150 平方米的「模块」组成了一栋 44,600 平方米的建筑,目前仅有两栋建筑在建,关键 IT 负载容量约为 180 兆瓦。

为了让大家理解这一规模,整个由 20 栋建筑组成的园区将包含 80 个这样的「模块」!

根据「加速器模型和数据中心模型」中,分析师为 OpenAI / 微软 / 甲骨文规划的建设计划,OpenAI 无需建设新园区就能部署全部 1000 亿美元的总拥有成本(TCO)。

因此,他们认为「星际之门」计划合资企业的首期 1000 亿美元将全部投入这个园区。

在 Lancium 的官网中,这个园区被称为「Abilene Clean Campus」,并声称将在 2025 年实现 1GW 供电能力。

然而,通过多个行业消息源和文件,该园区已额外获得 1GW 容量,总供电能力达到 2.2GW。

据此可以估算,该园区的关键 IT 负载容量为 1.8GW,能源使用效率(PUE)约为 1.25。

虽然他们可能通过优化使 PUE 接近 2GW IT 容量,但考虑到 GB300 特别是 VR200 的功率密度提升,这个目标将很难实现。

70 万块 GPU,老黄首期爆赚 375 亿刀

除了正在部署的 10 万台 GB200 算力集群外,分析师估计,他们还将在整个园区部署另外 20 万台 GB300 和约 40 万台 VR200(英伟达计划在 2026 年推出的超算,分别对应 Vera CPU 和 Rubin GPU)。

他们根据园区 1,000 亿美元总拥有成本(TCO)投资,以及人工智能 TCO 模型中的单位成本,计算出了 Vera Rubin 处理器的隐含数量。

约 70 万台 GPU 的总 IT 功率为 1.8GW,这与 Oracle / Crusoe 阿比林园区 1,800 兆瓦的容量相符。

简而言之,OpenAI 预计为首个 GB200 集群支付的成本,约为每 GPU 每小时 2.8 美元,全规模集群的 TCO 为每小时 2.38 美元。

这些数字会随着未来英伟达 GPU 的部署而相应调整。

OpenAI 的支出将超过 1,000 亿美元,但这并非前期资本投入。

分析师还估计英伟达从中获得的收入和 IT 设备资本支出相对较为适中,分别约为 375 亿美元和 490 亿美元。这将占用整个 1.8GW Crusoe Lancium 站点的容量。

随着向 GB300 和 VR200 演进,每一代 GPU 的数量都将翻倍,单个 GPU 的功率需求也在增长。

虽然 70 万块 GPU 对于 1,000 亿美元的投资而言规模似乎不大,但需要注意的是,这相当于数百万台 Hopper(英伟达高性能计算架构)GPU 的算力。

刷存在感的软银

甲骨文和软银是知名的股权提供方。

MGX 是一个新近成立的阿布扎比科技投资平台,由 Mubadala 和 G42 共同创立。该基金由 Sheikh Tahnoon bin Zayed al-Nahyan 担任主席,据报道他监管着超过 1.5 万亿美元的投资基金。

鉴于马斯克声称软银筹资不到 100 亿美元,需要特别指出的是,该合资企业还将通过项目融资筹集「债务资本」。

目前「股权融资」和「债务融资」的具体比例尚未确定,但甲骨文和 MGX 凭借其雄厚的资产负债表,可以为项目提供大量资金支持。

也就是说,即便软银没钱,还有甲骨文和 MGX。

据悉,OpenAI 和软银各自在账面上,承诺投入 190 亿美元。软银目前虽然没有这么多流动资金,但预计其可能会通过出售部分 ARM 股份来筹集所需的股权投资。

OpenAI 同样缺乏这笔资金,但他们可以在新产品 o3 发布后进行融资,而且不必直接全额筹集,可以通过向联合体其他成员发行「混合资本工具」来实现。

需要承认的是,马斯克的判断是正确的,他们目前确实还没有筹集到这笔资金。

关键问题在于项目融资风险能否与母机构分离。这种风险隔离十分重要,因为 OpenAI 需要筹集资金来支付相关费用。

对 OpenAI 而言,一个有利因素是这笔资金不需要立即到位。

OpenAI 现有资金足以支付今年 10 万台 GB200 集群的租金,但他们需要确保能够支付 2026 年及以后大幅上涨的租金。

虽然 OpenAI 可能无法直接筹集到所需资金,但高级分析师相信,他们的技术和产品发展将能够支撑这一规模的支出。

谁是最大赢家?

我们看到,在「星际之门」合资项目的公告中,出现了许多科技巨头的名字,比如英伟达、Arm、微软、甲骨文以及前面提到的投资方。

这些都是令人印象深刻的知名企业,但现实情况是,既有输家,又有赢家。

若说谁是最大的输家,恐怕

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容