国产 GPU 助力,摩尔线程实现对 DeepSeek 蒸馏模型推理服务部署

xxn 阅读:90874 2025-02-04 12:00:20 评论:0
感谢IT之家网友 菜鸟N号 的线索投递!

IT之家 2 月 4 日消息,DeepSeek 开源模型(如 V3、R1 系列)在多语言理解与复杂推理任务中展现了卓越性能。摩尔线程智能科技(北京)有限责任公司今日发文宣布,摩尔线程实现了对 DeepSeek 蒸馏模型推理服务部署

IT之家从摩尔线程官方获悉,通过 DeepSeek 提供的蒸馏模型,能够将大规模模型的能力迁移至更小更高效的版本,在国产 GPU 上实现高性能推理。

  • 开源框架适配:基于 Ollama 开源框架,摩尔线程完成 DeepSeek-R1-Distill-Qwen-7B 蒸馏模型的部署,并在多种中文任务中展现了优异的性能,验证摩尔线程自研全功能 GPU 的通用性与 CUDA 兼容性。

  • 自研引擎加速:通过摩尔线程自主研发的高性能推理引擎,结合软硬件协同优化技术,通过定制化的算子加速和内存管理,显著提升了模型的计算效率和资源利用率。这一引擎不仅支持 DeepSeek 蒸馏模型的高效运行,还为未来更多大规模模型的部署提供了技术保障。

另外,用户也可以基于 MTT S80 和 MTT S4000 进行 DeepSeek-R1 蒸馏模型的推理部署,此前已有用户在 MTT S80 上手动完成实践。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容