Anthropic 推出新一代混合推理模型 Claude 3.7 Sonnet:该公司“最智能”AI 模型
根据IT之家于2月25日的报道,人工智能公司Anthropic今天正式发布了其全新的“混合推理模型”——Claude 3.7 Sonnet。这个模型具备处理更复杂问题的能力,在数学与编码等领域的表现超越了之前的版本。
据Anthropic 公司透露,该模型被誉为其历史上“最智能”的AI,结合了“推理模式”(允许模型更深入思考复杂问题)与传统的模式(即时生成答案)的多重功能,并且是市场上唯一的这种“混合”模型。
IT之家指出,除了全新的模型外,Anthropic还推出了其“自主性”编程工具Claude Code的“有限研究预览版”。虽然Anthropic已经支持像Cursor这样的AI编程工具,但新发布的Claude Code被视为一个“积极的协作伙伴”,能够搜索和分析代码、编辑文件、编写及执行测试,将代码上传至GitHub,并使用命令行工具。
自本周一开始,用户便可通过Claude应用程序访问Claude 3.7 Sonnet,开发者还可以通过Anthropic的API、亚马逊的Bedrock以及谷歌云的Vertex AI来获取该模型。其运行费用与前一代3.5 Sonnet相同,输入每百万个token收费3美元,输出每百万个token收费15美元。
目前,OpenAI等公司提供独立的推理模型,然而,Anthropic的产品研究主管Dianne Penn表示,该公司希望简化模型使用的过程。她指出:“我们始终认为推理是人工智能的一种特性,并非完全独立的功能。”她补充道,在回答简单问题如“现在几点”与处理更复杂的请求例如“策划一个为期两周的意大利之旅,考虑3月下旬的天气”时,Claude的回应速度没有明显差异。
Dianne Penn表示,Claude 3.7 Sonnet在“自主性编程”、金融及法律任务中的表现明显优于前代。尽管该模型仍不支持实时网络搜索,但其知识截止时间为2024年10月,更新幅度领先其他模型。此外,Anthropic还允许开发者通过“草稿纸”功能引导模型的反应,以便精确控制其响应时间。Anthropic的产品副总裁Michael Gerstenhaber指出:“有时开发者只需明确表示,对该问题的回答不应超过200毫秒。”他认为,这是产品决策过程中的关键部分。
在Anthropic公司内部,员工已经利用Claude 3.7 Sonnet完成了前端网站设计和互动游戏的开发等任务。Penn透露,该模型甚至可以支持长达45分钟的编码工作,通过反复创建和修改测试用例来实现。她还提到,公司的团队通过将模型的API映射到游戏控制器,用以测试其在经典《宝可梦》游戏中的表现。结果显示,旧版Claude 3.5 Sonnet无法突破游戏初期的帕雷特镇,而3.7版本成功击败了多个道馆馆主。
目前,得益于Claude 3.7 Sonnet的显著性能提升,Anthropic再次站在行业前沿。这一模型的发布表明,行业正在向着实现单一模型完成各种任务的未来发展,而不仅仅是提供独立的推理模型。
广告声明:文中提及的外部链接(包括但不限于超链接、二维码、口令等),旨在提供更多信息,节省甄选时间,结果仅供参考。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。