
MimicMotion是由腾讯与上海交通大学联合研发的可控式高质量视频生成框架,支持生成任意时长、动作精准可控的视频内容,可高效产出细节丰富、逼真度高的人类动作视频,同时实现对动作、姿态、视频风格的精细化调控。该框架对标阿里通义舞王,在效果上实现显著超越,不仅可用于舞蹈视频生成,还支持面部特征还原、唇形精准同步,可直接落地数字人驱动等多元场景。

MimicMotion核心技术亮点:
1、置信感知姿势指导:
通过引入置信度机制优化姿势引导流程,结合大规模训练数据增强模型对动作时序连贯性的学习能力,保障生成视频的动作流畅度,避免帧间断裂或卡顿问题。
2、姿态置信度驱动的区域损失放大:
基于姿态置信度动态调整图像不同区域的损失权重,针对性优化动作关键区域的生成精度,有效减轻图像扭曲、变形等失真问题,提升视频细节表现力。
3、渐进式潜在融合策略:
创新提出渐进式潜空间融合方法,在保证计算资源消耗可控的前提下,突破视频生成时长限制,实现任意长度视频的流畅生成。
MimicMotion相关网址:
1、MimicMotion代码:https://github.com/Tencent/MimicMotion
2、MimicMotion ComfyUI版本:https://github.com/aiFSH/ComfyUI-MimicMotion
Ardot官网使用入口,腾讯推出的支持文生UI、图转设计等功能
HY Motion模型使用入口,腾讯推出的开源文本到3D动作AI模型
DeepGen 1.0模型使用入口,浙江大学等联合推出的轻量级统一多模态模型,仅50亿参数
CL-bench:腾讯混元与复旦大学联合推出的Context学习能力评测基准
标签: AI开源项目, 上海交通大学, 图文转视频, 腾讯AI
上面是“MimicMotion:腾讯与上交大联合研发的可控式高质量视频生成框架”的全面内容,想了解更多关于 AI项目和框架 内容,请继续关注web建站教程。
当前网址:https://m.ipkd.cn/webs_28418.html
声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!

网站内链优化有什么作用
Xiaomi MiMo-V2-TTS语音合成大模型,覆盖东北话、四川话、河南话、粤语、台湾腔等
javascript实现复制div文本内容(实测有效)
阿里云盘小白羊版:一款基于阿里云盘网页版开发的PC客户端,支持win7-11,macOS,linux
歌歌AI写歌APP最新版