百川智能发布深度思考模型 Baichuan-M1-preview,同时具备语言、视觉和搜索三大领域推理能力

xxn 阅读:61213 2025-01-24 14:00:58 评论:0

百川智能最新消息显示,百川智能今日推出全场景深度思考模型 Baichuan-M1-preview,整合了三个核心推理能力。此外,百川智能还发布了开源医疗增强大模型 Baichuan-M1-14B,业内首个。

据官方介绍,Baichuan-M1-preview 拥有语言、视觉和搜索三大领域推理能力,在数学、代码等多个权威评测中展现出色表现,可与 o1-preview 媲美。

有报道指出,该模型还推出了“医疗循证模式”,提供完整的端到端服务,可从证据检索到深度推理,快速、准确地回答医疗临床和科研问题。

而 Baichuan-M1-14B 则是 Baichuan-M1-preview 的小型版本,同时也是首个开源的医疗增强大模型。据介绍,该模型的医疗能力超越了更大参数的 Qwen2.5-72B,与 o1-mini 差不多。

  • Github:https:https//github.com/baichuan-inc/Baichuan-M1-14B

  • Huggingface(base):https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Base

  • Huggingface(Instruct):https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Instruct

  • NPU 版本支持 BF16 推理:https://modelers.cn/models/MindIE/Baichuan-M1-14B-Base

语言推理方面,其在 AIME 和 Math 等数学基准测试,以及 LiveCodeBench 代码任务上的成绩均超越了 o1-preview 等模型。

视觉推理能力方面,在 MMMU-val、MathVista 等权威评测中的成绩,超越了 GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview 等模型。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容