Anthropic 推出新一代混合推理模型 Claude 3.7 Sonnet：该公司“最智能”AI 模型

xxn 阅读：51300 2025-02-25 08:02:21 评论：0

根据IT之家于2月25日的报道，人工智能公司Anthropic今天正式发布了其全新的“混合推理模型”——Claude 3.7 Sonnet。这个模型具备处理更复杂问题的能力，在数学与编码等领域的表现超越了之前的版本。

据Anthropic 公司透露，该模型被誉为其历史上“最智能”的AI，结合了“推理模式”（允许模型更深入思考复杂问题）与传统的模式（即时生成答案）的多重功能，并且是市场上唯一的这种“混合”模型。

IT之家指出，除了全新的模型外，Anthropic还推出了其“自主性”编程工具Claude Code的“有限研究预览版”。虽然Anthropic已经支持像Cursor这样的AI编程工具，但新发布的Claude Code被视为一个“积极的协作伙伴”，能够搜索和分析代码、编辑文件、编写及执行测试，将代码上传至GitHub，并使用命令行工具。

自本周一开始，用户便可通过Claude应用程序访问Claude 3.7 Sonnet，开发者还可以通过Anthropic的API、亚马逊的Bedrock以及谷歌云的Vertex AI来获取该模型。其运行费用与前一代3.5 Sonnet相同，输入每百万个token收费3美元，输出每百万个token收费15美元。

目前，OpenAI等公司提供独立的推理模型，然而，Anthropic的产品研究主管Dianne Penn表示，该公司希望简化模型使用的过程。她指出：“我们始终认为推理是人工智能的一种特性，并非完全独立的功能。”她补充道，在回答简单问题如“现在几点”与处理更复杂的请求例如“策划一个为期两周的意大利之旅，考虑3月下旬的天气”时，Claude的回应速度没有明显差异。

Dianne Penn表示，Claude 3.7 Sonnet在“自主性编程”、金融及法律任务中的表现明显优于前代。尽管该模型仍不支持实时网络搜索，但其知识截止时间为2024年10月，更新幅度领先其他模型。此外，Anthropic还允许开发者通过“草稿纸”功能引导模型的反应，以便精确控制其响应时间。Anthropic的产品副总裁Michael Gerstenhaber指出：“有时开发者只需明确表示，对该问题的回答不应超过200毫秒。”他认为，这是产品决策过程中的关键部分。

在Anthropic公司内部，员工已经利用Claude 3.7 Sonnet完成了前端网站设计和互动游戏的开发等任务。Penn透露，该模型甚至可以支持长达45分钟的编码工作，通过反复创建和修改测试用例来实现。她还提到，公司的团队通过将模型的API映射到游戏控制器，用以测试其在经典《宝可梦》游戏中的表现。结果显示，旧版Claude 3.5 Sonnet无法突破游戏初期的帕雷特镇，而3.7版本成功击败了多个道馆馆主。

目前，得益于Claude 3.7 Sonnet的显著性能提升，Anthropic再次站在行业前沿。这一模型的发布表明，行业正在向着实现单一模型完成各种任务的未来发展，而不仅仅是提供独立的推理模型。

广告声明：文中提及的外部链接（包括但不限于超链接、二维码、口令等），旨在提供更多信息，节省甄选时间，结果仅供参考。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。