字节跳动 OmniHuman 多模态视频生成模型即将上线,图片 + 音频便可生成视频
xxn
阅读:43189
2025-02-07 18:01:29
评论:0
根据IT之家在2月7日的报道,字节跳动旗下的AI创作平台梦AI即将推出其多模态视频生成模型OmniHuman。此模型仅需一张图片和一段音频即可生成一段AI视频,且该模型为字节跳动自主研发的闭源技术。
梦AI的管理团队透露,该模型将在未来进行小规模内测,官方还将对这一新功能设立严格的安全审核流程,同时会对生成的视频添加水印以提醒用户。
IT之家注意到,字节跳动的研究团队最近展示了一款AI模型,此模型能够利用一张图片与一段音频创作出半身及全身视频。字节跳动指出,与一些只能生成面部或上半身动画的深度伪造技术相比,OmniHuman-1能够生成更加真实的全身动画,并能够精准同步手势与面部表情于语音或音乐之中。
广告声明:文中包含的外部链接(如超链接、二维码、口令等),旨在为读者提供更多信息,以便节省信息筛选时间,结果仅供参考。
声明
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。