AMD 推出完全开源的 3B 参数语言模型 Instella,媲美 Llama-3.2-3B 和 Qwen2.5-3B
xxn
阅读:20212
2025-03-06 16:04:30
评论:0
近日,AMD宣布针对Radeon RX 9070系列推出了开源的Linux驱动程序,并推出开源项目Instella——一款完全开源的3B参数语言模型。
AMD Instella代表“完全开源的尖端30亿参数语言模型(LMs)”。这些模型是在AMD Instinct MI300X GPU上进行训练的,据AMD发布的数据显示,其性能与Llama 3.2 3B、Gemma-2 2B和Qwen 2.5 3B等媲美。
AMD Instella模型是基于Instinct MI300X硬件从零开始训练的,该项目自称为完全开源:
完全开源和可访问:模型权重、训练超参数、数据集和代码均以完全开源方式发布,有助于推动人工智能社区内的创新与合作。
此外,IT之家提供了Instella开源地址:
https://github.com/AMD-AIG-AIMA/Instella
广告声明:文内包含外部链接,仅供参考,旨在传达更多信息并节省甄选时间(包括超链接、二维码和口令等形式)。
声明
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。