腾讯混元新一代快思考模型 Turbo S 发布,支持“秒回”

xxn 阅读:7702 2025-02-27 18:01:00 评论:0

IT之家报道称,腾讯最新推出了混元 Turbo S,这是一款新一代的快思考模型。

腾讯官方介绍说,与以往需要“想一下再回答”的慢思考模型不同,混元 Turbo S 能够实现“秒回”,响应速度更快,吐字速度提升一倍,首字时延降低 44%

在多个公开 Benchmark 上,混元 Turbo S 在知识、数学、推理等多个领域都展现出与 DeepSeek V3、GPT 4o、Claude 等同类模型相当甚至更强的效果表现。

从架构上看,混元 Turbo S 采用了 Hybrid-Mamba-Transformer 融合模式,降低了传统 Transformer 结构的计算复杂度,减少了 KV-Cache 缓存占用,从而实现了训练和推理成本的降低。

腾讯还指出,这种新的融合模式克服了传统纯 Transformer 结构大模型在长文训练和推理成本高方面的问题。在架构设计上,它既发挥了 Mamba 在高效处理长序列方面的优势,又继承了 Transformer 在捕捉复杂上下文方面的长处,最终形成了具有显存与计算效率的双重优势的混合架构。

有史以来首次,Mamba 架构成功地应用在超大型 MoE 模型上。这种模型架构的技术创新,大幅降低了混元 Turbo S 的部署成本。

作为旗舰模型,混元 Turbo S 将成为未来腾讯混元系列衍生模型的核心基础,为推理、长文、代码等衍生模型提供基础能力。

基于 Turbo S,混元还推出了具备深度思考的推理模型 T1,并引入了长思维链、检索增强和强化学习等技术。

根据腾讯的公告,开发者和企业用户现在可以在腾讯云上通过 API 免费试用混元 Turbo S,试用周期为一周

随着定价方面,Turbo S 输入价格为 0.8 元 / 百万 tokens,输出价格为 2 元 / 百万 tokens

腾讯元宝将逐步上线混元 Turbo S,用户可以在元宝内选择“Hunyuan”模型并关闭深度思考功能以体验使用。

广告声明:文中包含的外链仅供参考,结果仅供参考,点击请谨慎。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容