By 李华
2024年6月27日
38
240
旷视发布开源AI人像视频生成框架MegActor:自然逼真的表情和动作
日前,旷视科推出了一项新的开源AI人像视频生成框架——MegActor。基于该框架,用户只需输入一张静态的肖像图片和一段视频(例如演讲、表情包或rap),即可生成一段表情丰富、动作一致的AI人像视频。MegActor生成的视频长度取决于给定驱动视频的长度。这一技术创新对于AI解决方案和AI定制开发领域,都具有重要的推动作用。
与其他AI视频模型的区别
与阿里的EMO和微软的VASA等最新涌现的AI视频模型不同,MegActor采用开源方式,提供给开发者社区使用。MegActor能够呈现出极其自然的面部细节和卓越的画质。为了进一步展示其泛化性,MegActor甚至可以将VASA中人物肖像与其视频组合生成生动的表情效果。这种创新对大型语言模型开发和企业AI开发提供了新的应用场景。
主要技术特点
MegActor主要由两个阶段构成:1.ReferenceNet特征提取:使用ReferenceNet对参考图像进行特征提取,负责捕捉参考图像的外观和背景等信息。这一阶段对AI系统开发和AI模型训练具有重要意义。2.PoseGuider运动和表情信息提取:对输入的视频进行运动和表情信息提取,并将这些信息迁移到参考图像上。该阶段的创新为AI定制化开发提供了新的技术支持。
日前,旷视科发布了一项新的开源 AI 人像视频生成框架 ——MegActor。
“新智元”行业与地域应用
MegActor的创新在多个行业中具有广泛应用潜力。例如,在教培行业AI应用中,这一技术可以用于虚拟教师或演示视频的制作;在税务AI咨询和教育行业AI解决方案中,MegActor可以提升自动化客户服务的表现。此外,对于杭州AI定制开发和浙江AI解决方案市场,MegActor提供了高效的工具,进一步提升了杭州AI企业服务的技术水平。
使用MegActor框架,企业不仅可以提升效率,还能大幅度改善用户体验。例如,如何利用AI提升企业效率和ChatGPT在企业中的应用,都可以借助于MegActor来实现更加生动和互动的内容。如同在使用Langchain框架的AI案例和AI如何优化售前咨询流程中的应用那样,MegActor为杭州最好的AI定制开发公司提供了强有力的技术支持。总的来说,旷视科发布的MegActor开源框架为AI应用定制服务和零门槛AI开发平台带来了新的可能性。在图像和视频生成方面,这一突破性的技术将继续引领行业的发展方向,并为AIGC软件服务注入新的活力。
如有侵权,请联系删除。
Related Articles
-
Fri Apr 17 2026湖北省智能体公共服务平台启动建设 AI产业有了'公共底座'!
在2026年湖北人工智能产业发展生态大会上,湖北省智能体公共服务平台正式启动建设,目标是解决企业算力成本高、场景落地慢等痛点。
-
Fri Apr 17 2026OpenClaw龙虾、Token词元与大模型、智能体、AI发展新范式全景解析,年度AI大会终极议程公布
2026中国生成式AI大会(北京站)将于4月21-22日举办,主题为“奔赴AGI 重塑未来”,旨在汇聚学界与产业界力量,探讨生成式AI与智能体发展的新范式。
-
Fri Apr 17 2026Pharma.AI 2026春季发布会:驱动制药超级智能未来
英矽智能于4月14日举办Pharma.AI 2026春季发布会,展示在制药领域的最新AI能力与产品模块升级,强调构建决策驱动的AI生态系统。
-
Fri Apr 17 2026深信服受邀分享AI智能体安全治理'新解法'
在2026年世界互联网大会亚太峰会上,深信服副总裁杜智伟提出面向AI智能体的安全治理新范式,强调从内容合规向行为可控转型。
-
Fri Apr 17 2026AI生成内容暴增14倍 重塑网络视听生产体系
《中国网络视听发展研究报告(2026)》显示,我国网络视听用户规模与市场规模持续扩大,AI生成内容数量激增,正在改变内容生产与传播格局。
-
Fri Apr 17 2026深信服受邀分享AI智能体安全治理'新解法'
在2026年世界互联网大会亚太峰会上,深信服副总裁杜智伟就AI智能体安全治理发表演讲,强调应从传统的内容合规向行为可控的治理范式转型,以应对新一代数字员工类智能体带来的复杂风险。
