当前位置：首页 > 科技

支持文本图像视频输入

先上代码再发论文，腾讯新开源文生视频工具火了。

名为MuseV，主打基于视觉条件并行去噪的无限长度和高保真虚拟人视频生成。

老规矩，先看效果。

静态的金克丝秒秒钟就能动起来朝你抛媚眼：

腾讯开源视频生成新工具，论文还没发先上代码的那种

画中诗圣也“活”了过来：

腾讯开源视频生成新工具，论文还没发先上代码的那种

各种风格都能驾驭，风景图也不在话下：

腾讯开源视频生成新工具，论文还没发先上代码的那种

更有搞笑风《微笑的骑士》：

腾讯开源视频生成新工具，论文还没发先上代码的那种

再上难度，复杂些的弹唱也处理得比较自然：

腾讯开源视频生成新工具，论文还没发先上代码的那种

此外，加入“骨架”控制动作、姿势也可以：

腾讯开源视频生成新工具，论文还没发先上代码的那种

腾讯这次论文还没发直接放出训练好的模型和部署运行的代码的操作让网友眼前一亮。主页显示训练代码也即将推出。

不少人已趁热码住，GitHub获星500+。

腾讯开源视频生成新工具，论文还没发先上代码的那种

还有网友已经玩上了：

腾讯开源视频生成新工具，论文还没发先上代码的那种

围观网友直呼距离成为视频达人只差一个AI。

腾讯开源视频生成新工具，论文还没发先上代码的那种

嘴唇也能同步

除了直接放出模型代码，目前MuseV还有demo可体验。

腾讯开源视频生成新工具，论文还没发先上代码的那种

demo界面有两种玩法。

一种可以上传一张图然后加上Prompt在这张图的基础上进行视频生成；另一种是上传一个参考视频和一张图，使图片中的内容按照视频中的动作运动起来。

腾讯开源视频生成新工具，论文还没发先上代码的那种

紧接着下方还有一些参数可以调整。可以自定义视频的时长以及视频的尺寸。

腾讯开源视频生成新工具，论文还没发先上代码的那种

此外值得一提的是，文本、图像到视频的生成结果的所有帧直接由MuseV生成，没有时序超分辨、空间超分辨等任何后处理。

而输入视频控制姿态的生成模式下，开发团队表示需要参考视频的首帧条件和参考图像的首帧条件对齐，不然会破坏首帧的信息，效果会更差。所以一般生成流程是：

确定参考视频；
用参考视频的首帧走图生图、controlnet流程，可以使用MJ等各种平台；
拿第二步中的生成图、参考视频用MuseV生成视频。

腾讯开源视频生成新工具，论文还没发先上代码的那种

除MuseV，开发团队还表示即将发布一个实时高质量的唇同步模型——MuseTalk，可与MuseV一起搭配使用。

MuseV里面长啥样？

技术方面，据了解MuseV是在去年7月左右基于扩散模型实现的技术进展，受到Sora启发，开发团队决定开源MuseV，之后将转向扩散+Transformer方案。

也就是说，MuseV是基于扩散模型的虚拟人视频生成框架。

模型架构如下图所示：

腾讯开源视频生成新工具，论文还没发先上代码的那种

总的来说，MuseV具有以下特点：

首先是支持使用新颖的视觉条件并行去噪方案进行无限长度生成，不会再有误差累计的问题，尤其适用于固定相机位的场景。

并行去噪算法示意图如下：

腾讯开源视频生成新工具，论文还没发先上代码的那种

其次，MuseV提供了基于人物类型数据集训练的虚拟人视频生成预训练模型。

而且支持图像到视频、文本到图像到视频、视频到视频的生成；兼容Stable Diffusion文图生成生态系统，包括base_model、lora、controlnet等。

还支持多参考图像技术，包括IPAdapter、ReferenceOnly、ReferenceNet、IPAdapterFaceID。

参考链接：
[1]http://github.com/TMElyralab/MuseV
[2]http://twitter.com/Gorden_Sun/status/1774825159939256678

本文链接：http://www.mocany.com/showinfo-1-36891-0.html腾讯开源视频生成新工具，论文还没发先上代码的那种

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com。天上从来不会掉馅饼，请大家时刻谨防诈骗

猜你喜欢

小米：SU7 Ultra原型车基于SU7打造核心技术同源

小米：SU7 Ultra原型车基于SU7打造核心技术同源

8月7日消息，前不久雷军年度演讲正式发布了小米SU7 Ultra原型车，一经发布就引起巨大关注。SU7 Ultra原型车堪称“全球速四门车”，搭载V8s+V8s+V6s三电机，含

搬上云，WPS AI落地海外的捷径原创

搬上云，WPS AI落地海外的捷径原创

生成式AI正在改变办公软件的使用方式，通过整合生成式AI，WPS也能为用户提供文档内容润色、错别字检查等功能，这就是WPS AI。现在，通过部署到亚马逊云科

IBM通过出售QRadar，帮助合作伙伴对接Palo Alto Networks

IBM通过出售QRadar，帮助合作伙伴对接Palo Alto Networks

IBM渠道主管Kate Woolley在采访中表示，“一旦收购完成，我们的合作伙伴将有机会加入Palo Alto Networks的合作伙伴计划（如果此前尚未参与），从而获得销售P

vivo：连续三年国产手机份额第一！你买台支持没

vivo：连续三年国产手机份额第一！你买台支持没

5月14日消息，在昨晚的发布会上，vivo晒出的数据显示，连续三年拿下国产手机份额第一。从图片上看，vivo从2021年、2022年和2023年，连续3年拿下了国产手机份额

这次55岁谢广坤“底裤被扒光”，前前妻孙小雨的话，终于有人信了

这次55岁谢广坤“底裤被扒光”，前前妻孙小雨的话，终于有人信了

一张筒子脸，两撇八字胡，颅顶几根头发被他煞有介事地梳向一边，见人就挤出那副酸溜溜的笑容，但眼睛却像机关枪似

女将军娶个乞丐当王妃短剧讲的什么？完整版剧情介绍

女将军娶个乞丐当王妃短剧讲的什么？完整版剧情介绍

《女将军与乞丐王妃》是一部引人入胜的短剧，以其精湛的表演和扣人心弦的剧情赢得了观众的喜爱。故事围绕着一名来自21世纪的女博士展开，她意外穿越至古代，摇身

鬼宅心慌慌泰剧什么时候播，《鬼宅心慌慌》剧情介绍

鬼宅心慌慌泰剧什么时候播，《鬼宅心慌慌》剧情介绍

《鬼宅心慌慌》是一部由GMMTV打造的泰国影视作品，它还有其他别称，如《鬼宅心慌》、《鬼屋出售》。这部剧融合了恐怖、喜剧和奇幻等多种元素，围绕的中心是一座

半年盘点 2018年最热门的10家云计算初创公司（2018年最热门的10家云计算初创公司）

半年盘点 2018年最热门的10家云计算初创公司（2018年最热门的10家云计算初创公司）

走向云端在不断壮大的云初创公司群体中，能够脱颖而出的往往是那些为超大规模计算能力增加价值的公司。这些初创公司正在帮助企业采用灵活的混合IT环境，来运行现有的以及

外网推主：《黑神话：悟空》是2024年游戏界三大巨头之一

外网推主：《黑神话：悟空》是2024年游戏界三大巨头之一

《黑神话：悟空》现已正式发售，从游戏的Steam在线人数即可看出，《黑神话：悟空》受到了广大玩家们的喜爱。推主chosenundeadone在

真要合作了？Lady Gaga身穿火星哥头像T恤弹钢琴

真要合作了？Lady Gaga身穿火星哥头像T恤弹钢琴

之前火星哥扒着记者说想与Lady Gaga一起演出，“或者至少让我在她的演出里合唱一曲吧！”的样子还记得吧？据 Hi

《七日世界》公测装备套装评析

《七日世界》公测装备套装评析

第1页：突袭套装《七日世界》已经开启了公测，相比内测版本，一些装备都进行了一些调整，那么在公测

谷歌将从服务器端加载广告绕过拦截器侦测机制

谷歌将从服务器端加载广告绕过拦截器侦测机制

YouTube 和广告拦截器之间的“猫鼠游戏”似乎从未停止，目前谷歌方面被曝正在测试一项更严格的措施 —— 尝试从服务器端加入广告，这意味着广告被直接添加到视频

广州海珠区举行创客智能及创客智力实践竞赛

广州海珠区举行创客智能及创客智力实践竞赛

日前，2024海珠区“小海豚杯”创客智能及创客智力实践竞赛活动。本次竞赛共有60余所学校，3000多人次报名参加。比赛通过线上初赛选拔，遴选出1500多人参加

2023女生适合学什么专业轻松吃香的专业

2023女生适合学什么专业轻松吃香的专业

12023女生适合学什么专业？ 2随着社会的不断发展，女性在职场上的地位越来越受到重视。因此，选择一门适合自己的专业非常重要。那么，2023年女生适合学什么专业呢？下面就为大家推

教资面试下半年考试时间教师资格证面试注意事项有哪些

教资面试下半年考试时间教师资格证面试注意事项有哪些

1教资面试下半年考试时间 2教资面试下半年考试时间一般在每年的10月份左右，具体时间以当地招聘部门公布为准。考试内容主要包括教育教学知识、教育法律法规、心理学等方面

重阳节登高的由来（简单概括重阳节的来历和习俗）

重阳节登高的由来（简单概括重阳节的来历和习俗）

农历九月初九（2021年10月14日）是我国民间传统节日：重阳节，这是一个感恩敬老的传统佳节。在《易经》中，奇数为阳，偶数为阴，九月初九的月数和日数均为“九”，曰“重九”，遂称“重阳