研究人员开源 Sky-T1 推理 AI 模型,训练成本不到 450 美元
最新消息显示,加州大学伯克利分校Sky Computing实验室的NovaSky团队本周发布了名为Sky-T1-32B-Preview的推理模型。据称,该模型在多项关键基准测试中的表现可与OpenAI早期版本的o1模型媲美,备受瞩目。Sky-T1-32B-Preview似乎是首个真正意义上的开源推理模型,用户可从零开始复现该模型,其训练数据集和代码均已公开。
NovaSky团队透露,Sky-T1-32B-Preview的训练成本不到450美元(约合3306人民币),远低于以往同类模型的数百万美元。该突破得益于广泛应用合成训练数据,合成数据由其他模型生成,大幅降低训练成本。举例来说,AI公司Writer最近发布的Palmyra X 004模型几乎完全依赖合成数据训练,开发成本仅为70万美元。
与多数AI模型不同,推理模型拥有自我事实核查能力,可有效避免常见错误。虽然推理模型解决问题所需时间通常较长,但在物理、科学、数学等领域具有更高的可靠性。
NovaSky团队称,Sky-T1的训练数据由阿里巴巴的QwQ-32B-Preview推理模型生成,随后经过精心筛选,利用OpenAI的GPT-4o-mini对数据重构,使其更易处理。该模型仅耗时约19小时进行320亿参数的训练,使用了8台Nvidia H100 GPU。(参数数量大致对应模型解决问题的能力。)
在性能方面,Sky-T1在MATH500(一组“竞赛级”数学挑战)上的表现优于o1的早期预览版本,也在LiveCodeBench的编程评估中展现出色。尽管如此,在包含物理学、生物学、化学领域研究生水平问题的GPQA-Diamond测试中,Sky-T1略逊于o1预览版。
值得一提的是,OpenAI已发布的o1正式版比预览版更强大,未来几周预计推出性能更优的推理模型o3。尽管如此,NovaSky团队强调,Sky-T1只是他们开发开源推理模型的起点。
团队在博客中表示:“未来,我们将着手研发更为高效的模型,保持强大的推理性能,探索先进技术以进一步提升模型测试时的效率和准确性。请持续关注我们在这些激动人心项目上的进展。”
广告声明:文中含有对外跳转链接(包括但不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。