AI 科学家吴恩达长文盛赞 DeepSeek：中国正在生成式 AI 领域追赶美国

xxn 阅读：64490 2025-02-01 18:01:11 评论：0

根据 IT之家 2 月 1 日的最新消息，斯坦福大学计算机科学系客座教授吴恩达（Andrew Yan-Tak Ng）于昨日在 X 平台上发表声明，表示支持 DeepSeek，并指出：“中国在生成式 AI 领域正逐渐迎头赶上美国。”

以下为吴恩达观点的概要：

本周围绕 DeepSeek 的讨论，进一步揭示了几个相关的发展趋势：

中国在生成式 AI 技术上已逐步缩短与美国的差距，这对全球 AI 供应链带来深远的影响。

开放权重模型的兴起正在将基础模型转化为更具商业价值的产品，进而增强了应用开发者的机遇。

增大规模并非推动 AI 进步的唯一途径。尽管处理能力受到极大关注，但算法的创新正在快速降低训练成本。

约在一周前，总部设在中国的 DeepSeek 发布了备受关注的 DeepSeek-R1 模型，该模型在一些基准测试中表现出色，已与 OpenAI 的 o1 不相上下。更重要的是，DeepSeek-R1 以开放权重模型的形式发布，并采用了灵活的 MIT 许可证。上周在达沃斯会议期间，许多非技术背景的商业领袖向我询问关于这款模型的信息。而就在周一，市场出现了“DeepSeek 事件”，英伟达及其他美国科技公司的股价普遍下滑。（截至撰写时，部分股价已有所恢复。）

DeepSeek 的进展让许多人意识到：

中国在生成式 AI 领域正逐步超越美国。自 2022 年 11 月 ChatGPT 发布以来，美国在这一领域的领先地位已受到挑战。过去两年中，中国在这一领域的快速发展已显著缩小了与美国的差距，尤其是在视频生成方面，中国已有时超越美国。

我对 DeepSeek-R1 作为开放权重模型发布的消息感到非常欣慰，同时其技术报告中也提供了丰富的细节。与此同时，一些美国企业却通过对人类灭绝等假设性 AI 危机的炒作，试图推动监管，限制开源发展。

如今，开放权重模型已成为 AI 供应链的重要组成部分，许多公司会利用这些模型。如果美国继续打压开源，未来中国可能在这一领域取得主导地位，许多企业可能会更倾向于使用符合中国价值观的模型。

开放权重模型正在加速基础模型层的商品化。正如我之前提到的，大语言模型的 token 成本正快速下降，开放权重模型更加剧了这一趋势，为开发者提供了更多选择。与 OpenAI 的 o1 每百万输出 token 收费 60 美元相比，DeepSeek-R1 的费用仅为 2.19 美元，这一近 30 倍的价格差异引发了广泛关注。

基础模型的训练与 API 销售非常具有挑战性。许多公司仍在努力寻找回收巨额训练成本的方法。红杉资本的文章《AI 的 6000 亿美元问题》准确揭示了这一挑战（需要指出的是，我认为基础模型公司在努力中做得非常出色，并期待它们能取得成功）。相较之下，在基础模型上构建应用程序为商业带来了更多的机遇。其他公司已投入数十亿美元来训练这些模型，而现在你只需以低成本即可使用它们，开发诸如客服机器人、邮件概括工具、AI 医生及法律文书助手等应用。

扩大规模并非推动 AI 进步的唯一方式。围绕规模扩展的讨论已成为推动 AI 进步的重要议题。诚然，我曾是倡导规模扩展的支持者。许多公司利用这一话题融资，并声称通过增加投资能够推动进步。因此，扩大规模成为焦点，忽略了其他潜在的进步途径。由于美国对 AI 芯片的禁运，DeepSeek 团队不得不在性能较低的 H800 GPU 上进行优化，以代替 H100 GPU，最终使得模型训练计算成本（不含研发费用）低于 600 万美元。

这一变革是否会减少计算需求仍需观察。降低每单位商品价格有时反而会导致消费者在总支出上增加。我相信，从长远来看，智能与计算力的需求几乎没有上限。因此，即使变得更加便宜，我依旧看好人类对智能的需求将持续增长。

我在 X 平台上看到对 DeepSeek 进展的各种解读，仿佛它反映出每个人的不同看法。我认为 DeepSeek-R1 涉及到的地缘政治挑战仍需解决，同时它为 AI 应用的开发者带来了巨大的机遇。我的团队正在构思一些新想法，这些想法仅能通过一个开放的先进推理模型实现。现在正是大展宏图的良好时机！

广告声明：本文中提及的对外跳转链接（包括但不限于超级链接、二维码、口令等形式），旨在传递更多信息，节省查找时间，结果仅供参考。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。