研究人员开源 Sky-T1 推理 AI 模型，训练成本不到 450 美元

xxn 阅读：84809 2025-01-12 18:01:05 评论：0

最新消息显示，加州大学伯克利分校Sky Computing实验室的NovaSky团队本周发布了名为Sky-T1-32B-Preview的推理模型。据称，该模型在多项关键基准测试中的表现可与OpenAI早期版本的o1模型媲美，备受瞩目。Sky-T1-32B-Preview似乎是首个真正意义上的开源推理模型，用户可从零开始复现该模型，其训练数据集和代码均已公开。

NovaSky团队透露，Sky-T1-32B-Preview的训练成本不到450美元（约合3306人民币），远低于以往同类模型的数百万美元。该突破得益于广泛应用合成训练数据，合成数据由其他模型生成，大幅降低训练成本。举例来说，AI公司Writer最近发布的Palmyra X 004模型几乎完全依赖合成数据训练，开发成本仅为70万美元。

与多数AI模型不同，推理模型拥有自我事实核查能力，可有效避免常见错误。虽然推理模型解决问题所需时间通常较长，但在物理、科学、数学等领域具有更高的可靠性。

NovaSky团队称，Sky-T1的训练数据由阿里巴巴的QwQ-32B-Preview推理模型生成，随后经过精心筛选，利用OpenAI的GPT-4o-mini对数据重构，使其更易处理。该模型仅耗时约19小时进行320亿参数的训练，使用了8台Nvidia H100 GPU。（参数数量大致对应模型解决问题的能力。）

在性能方面，Sky-T1在MATH500（一组“竞赛级”数学挑战）上的表现优于o1的早期预览版本，也在LiveCodeBench的编程评估中展现出色。尽管如此，在包含物理学、生物学、化学领域研究生水平问题的GPQA-Diamond测试中，Sky-T1略逊于o1预览版。

值得一提的是，OpenAI已发布的o1正式版比预览版更强大，未来几周预计推出性能更优的推理模型o3。尽管如此，NovaSky团队强调，Sky-T1只是他们开发开源推理模型的起点。

团队在博客中表示：“未来，我们将着手研发更为高效的模型，保持强大的推理性能，探索先进技术以进一步提升模型测试时的效率和准确性。请持续关注我们在这些激动人心项目上的进展。”

广告声明：文中含有对外跳转链接（包括但不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。