字节跳动 OmniHuman 多模态视频生成模型即将上线，图片 + 音频便可生成视频

xxn 阅读：43189 2025-02-07 18:01:29 评论：0

根据IT之家在2月7日的报道，字节跳动旗下的AI创作平台梦AI即将推出其多模态视频生成模型OmniHuman。此模型仅需一张图片和一段音频即可生成一段AI视频，且该模型为字节跳动自主研发的闭源技术。

梦AI的管理团队透露，该模型将在未来进行小规模内测，官方还将对这一新功能设立严格的安全审核流程，同时会对生成的视频添加水印以提醒用户。

IT之家注意到，字节跳动的研究团队最近展示了一款AI模型，此模型能够利用一张图片与一段音频创作出半身及全身视频。字节跳动指出，与一些只能生成面部或上半身动画的深度伪造技术相比，OmniHuman-1能够生成更加真实的全身动画，并能够精准同步手势与面部表情于语音或音乐之中。

广告声明：文中包含的外部链接（如超链接、二维码、口令等），旨在为读者提供更多信息，以便节省信息筛选时间，结果仅供参考。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。