blog details

2024年6月27日

38

240

旷视发布开源AI人像视频生成框架MegActor:自然逼真的表情和动作

日前,旷视科推出了一项新的开源AI人像视频生成框架——MegActor。基于该框架,用户只需输入一张静态的肖像图片和一段视频(例如演讲、表情包或rap),即可生成一段表情丰富、动作一致的AI人像视频。MegActor生成的视频长度取决于给定驱动视频的长度。这一技术创新对于AI解决方案和AI定制开发领域,都具有重要的推动作用。

与阿里的EMO和微软的VASA等最新涌现的AI视频模型不同,MegActor采用开源方式,提供给开发者社区使用。MegActor能够呈现出极其自然的面部细节和卓越的画质。为了进一步展示其泛化性,MegActor甚至可以将VASA中人物肖像与其视频组合生成生动的表情效果。这种创新对大型语言模型开发和企业AI开发提供了新的应用场景。

与其他AI视频模型的区别

MegActor主要由两个阶段构成:1.ReferenceNet特征提取:使用ReferenceNet对参考图像进行特征提取,负责捕捉参考图像的外观和背景等信息。这一阶段对AI系统开发和AI模型训练具有重要意义。2.PoseGuider运动和表情信息提取:对输入的视频进行运动和表情信息提取,并将这些信息迁移到参考图像上。该阶段的创新为AI定制化开发提供了新的技术支持。

日前,旷视科发布了一项新的开源 AI 人像视频生成框架 ——MegActor。

“新智元”

主要技术特点

MegActor的创新在多个行业中具有广泛应用潜力。例如,在教培行业AI应用中,这一技术可以用于虚拟教师或演示视频的制作;在税务AI咨询和教育行业AI解决方案中,MegActor可以提升自动化客户服务的表现。此外,对于杭州AI定制开发和浙江AI解决方案市场,MegActor提供了高效的工具,进一步提升了杭州AI企业服务的技术水平。

使用MegActor框架,企业不仅可以提升效率,还能大幅度改善用户体验。例如,如何利用AI提升企业效率和ChatGPT在企业中的应用,都可以借助于MegActor来实现更加生动和互动的内容。如同在使用Langchain框架的AI案例和AI如何优化售前咨询流程中的应用那样,MegActor为杭州最好的AI定制开发公司提供了强有力的技术支持。总的来说,旷视科发布的MegActor开源框架为AI应用定制服务和零门槛AI开发平台带来了新的可能性。在图像和视频生成方面,这一突破性的技术将继续引领行业的发展方向,并为AIGC软件服务注入新的活力。

如有侵权,请联系删除。

Related Articles