阶跃星辰联合吉利首次开源 Step 系列多模态大模型,包含视频、语音两款模型
IT之家 2 月 18 日报道,阶跃星辰和吉利汽车集团宣布将阶跃两款 Step 系列多模态大模型开源给全球开发者。其中,包括了全球参数量最大、性能最佳的开源视频生成模型阶跃 Step-Video-T2V,以及业内首个产品级开源语音交互大模型阶跃 Step-Audio。
据IT之家报道,阶跃 Step-Video-T2V 模型参数量高达 300 亿,可生成 204 帧、540P 分辨率的高质量视频。阶跃星辰表示,根据其获得的评估结果,该模型是目前全球参数量最大、性能最佳的开源视频生成大模型。
阶跃 Step-Audio 是业内首个产品级的开源语音交互模型,可根据不同需求生成情绪、方言、语种、歌声和个性化风格的表达,与用户进行高质量自然对话。生成的语音具有超自然、高情商等特点,同时实现高质量音色还原。用户可立即在跃问 App 中体验新功能。
阶跃星辰是吉利汽车集团的科技生态战略合作伙伴,双方在两款大模型的研发中展开深度合作,优势互补,大大提升了多模态大模型的性能。阶跃星辰表示,实现 AGI 需全球开发者共同努力,开源初衷是希望分享最新的多模态大模型技术成果,为全球开源社区贡献中国力量。
阶跃星辰(上海阶跃星辰智能科技有限公司)成立于 2023 年,是一家致力于人工智能大模型研发和应用的公司,总部位于上海。该公司由前微软全球副总裁姜大昕创立,于 2024 年 3 月发布 Step 系列大模型,同时推出两款AI应用产品:跃问、冒泡鸭。
广告声明:文中包含外部链接,仅供参考。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。