AI 科学家吴恩达长文盛赞 DeepSeek:中国正在生成式 AI 领域追赶美国

xxn 阅读:64490 2025-02-01 18:01:11 评论:0

根据 IT之家 2 月 1 日的最新消息,斯坦福大学计算机科学系客座教授吴恩达(Andrew Yan-Tak Ng)于昨日在 X 平台上发表声明,表示支持 DeepSeek,并指出:“中国在生成式 AI 领域正逐渐迎头赶上美国。”

以下为吴恩达观点的概要:

本周围绕 DeepSeek 的讨论,进一步揭示了几个相关的发展趋势:

  • 中国在生成式 AI 技术上已逐步缩短与美国的差距,这对全球 AI 供应链带来深远的影响。

  • 开放权重模型的兴起正在将基础模型转化为更具商业价值的产品,进而增强了应用开发者的机遇。

  • 增大规模并非推动 AI 进步的唯一途径。尽管处理能力受到极大关注,但算法的创新正在快速降低训练成本。

约在一周前,总部设在中国的 DeepSeek 发布了备受关注的 DeepSeek-R1 模型,该模型在一些基准测试中表现出色,已与 OpenAI 的 o1 不相上下。更重要的是,DeepSeek-R1 以开放权重模型的形式发布,并采用了灵活的 MIT 许可证。上周在达沃斯会议期间,许多非技术背景的商业领袖向我询问关于这款模型的信息。而就在周一,市场出现了“DeepSeek 事件”,英伟达及其他美国科技公司的股价普遍下滑。(截至撰写时,部分股价已有所恢复。)

DeepSeek 的进展让许多人意识到:

中国在生成式 AI 领域正逐步超越美国。自 2022 年 11 月 ChatGPT 发布以来,美国在这一领域的领先地位已受到挑战。过去两年中,中国在这一领域的快速发展已显著缩小了与美国的差距,尤其是在视频生成方面,中国已有时超越美国。

我对 DeepSeek-R1 作为开放权重模型发布的消息感到非常欣慰,同时其技术报告中也提供了丰富的细节。与此同时,一些美国企业却通过对人类灭绝等假设性 AI 危机的炒作,试图推动监管,限制开源发展。

如今,开放权重模型已成为 AI 供应链的重要组成部分,许多公司会利用这些模型。如果美国继续打压开源,未来中国可能在这一领域取得主导地位,许多企业可能会更倾向于使用符合中国价值观的模型。

开放权重模型正在加速基础模型层的商品化。正如我之前提到的,大语言模型的 token 成本正快速下降,开放权重模型更加剧了这一趋势,为开发者提供了更多选择。与 OpenAI 的 o1 每百万输出 token 收费 60 美元相比,DeepSeek-R1 的费用仅为 2.19 美元,这一近 30 倍的价格差异引发了广泛关注。

基础模型的训练与 API 销售非常具有挑战性。许多公司仍在努力寻找回收巨额训练成本的方法。红杉资本的文章《AI 的 6000 亿美元问题》准确揭示了这一挑战(需要指出的是,我认为基础模型公司在努力中做得非常出色,并期待它们能取得成功)。相较之下,在基础模型上构建应用程序为商业带来了更多的机遇。其他公司已投入数十亿美元来训练这些模型,而现在你只需以低成本即可使用它们,开发诸如客服机器人、邮件概括工具、AI 医生及法律文书助手等应用。

扩大规模并非推动 AI 进步的唯一方式。围绕规模扩展的讨论已成为推动 AI 进步的重要议题。诚然,我曾是倡导规模扩展的支持者。许多公司利用这一话题融资,并声称通过增加投资能够推动进步。因此,扩大规模成为焦点,忽略了其他潜在的进步途径。由于美国对 AI 芯片的禁运,DeepSeek 团队不得不在性能较低的 H800 GPU 上进行优化,以代替 H100 GPU,最终使得模型训练计算成本(不含研发费用)低于 600 万美元。

这一变革是否会减少计算需求仍需观察。降低每单位商品价格有时反而会导致消费者在总支出上增加。我相信,从长远来看,智能与计算力的需求几乎没有上限。因此,即使变得更加便宜,我依旧看好人类对智能的需求将持续增长。

我在 X 平台上看到对 DeepSeek 进展的各种解读,仿佛它反映出每个人的不同看法。我认为 DeepSeek-R1 涉及到的地缘政治挑战仍需解决,同时它为 AI 应用的开发者带来了巨大的机遇。我的团队正在构思一些新想法,这些想法仅能通过一个开放的先进推理模型实现。现在正是大展宏图的良好时机!

广告声明:本文中提及的对外跳转链接(包括但不限于超级链接、二维码、口令等形式),旨在传递更多信息,节省查找时间,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容