
Solaris是全球首个多人视频世界生成模型,专注于在Minecraft场景中,同步生成两位玩家一致的第一人称视角视频。模型彻底突破现有模型仅支持单玩家的技术局限,核心实现跨玩家视角的空间一致性——当一位玩家执行建造、移动等动作时,另一玩家的视角会实时同步反映场景变化。

Solaris核心功能:
1、多人视角同步生成:
核心能力的是同时为两位玩家生成视角一致的第一人称视频,严格保障跨玩家的空间一致性,一位玩家的任何动作(建造、移动、挖掘等),都会在另一玩家视角中实时同步呈现,还原真实多人游戏交互场景。
2、长时序稳定生成:
依托Checkpointed Self Forcing核心技术,可生成长达224帧(11.2秒)的稳定视频序列,有效规避长序列生成中误差累积导致的视觉退化、场景错乱等问题,确保视频连贯性与真实性。
3、动作条件精准控制:
全面支持完整的Minecraft动作输入,包括移动、相机调整、挖掘、放置方块等,生成的视频严格遵循给定的动作序列,实现动作与视觉呈现的精准匹配,可控性极强。
4、复杂动态场景模拟:
可精准模拟Minecraft中的各类复杂动态,涵盖背包状态同步、天气变化、物理建造与破坏、PvP战斗等,高度还原多人游戏中的真实交互场景,满足多样化模拟需求。
Solaris技术原理:
1、多人DiT架构:
基于MatrixGame 2.0单玩家扩散Transformer架构升级,通过扩展动作空间适配完整Minecraft动作输入;引入跨玩家自注意力层,实现两位玩家视角信息的实时交换;添加玩家ID嵌入模块,精准区分不同玩家视角,其余交叉注意力、FFN等模块保留单玩家架构优势,兼顾性能与效率。
2、四阶段渐进训练:
以单玩家预训练权重为基础,第一阶段在VPT数据集上微调,适配Minecraft动作空间;第二阶段切换至多人数据,训练双向模型作为教师模型;第三阶段将双向模型因果化为滑动窗口生成器;第四阶段通过Checkpointed Self Forcing技术,实现长序列稳定生成,完成全流程训练。
3、Checkpointed Self Forcing 技术:
针对滑动窗口自回归生成的内存瓶颈,创新采用“先无梯度生成并缓存干净帧与噪声状态,再通过自定义注意力掩码单次并行重计算”的方式,严格复现滑动窗口依赖关系,将内存复杂度从 O(Lt⋅Ls) 降至 O(Lt),同时支持KV缓存梯度回传,大幅提升生成视频的质量与稳定性。
4、SolarisEngine 数据系统:
针对现有框架缺乏多人场景支持的痛点,构建基于 Mineflayer 的控制器与官方Minecraft客户端的相机分离架构;通过服务器插件实现多玩家状态实时同步,采用Docker容器化技术,实现数据采集的并行扩展与故障自动恢复,最终完成1260万帧动作标注的多人游戏数据采集,为模型训练提供高质量数据支撑。
Solaris应用场景:
1、具身智能训练与评估:
作为高性能多智能体世界模拟器,为机器人、游戏AI提供高质量合成训练数据,支持策略学习、推理时规划及安全评估,有效规避真实环境中试错的高昂成本,加速具身智能落地。
2、多智能体协作研究:
可精准模拟多人协同任务,如共同建造、团队战斗等场景,用于训练AI代理的协作能力与通信能力,助力研究多智能体的emergent行为(涌现行为)与社会智能。
3、视觉-语言-动作(VLA)模型开发:
能够生成大规模、高质量的多视角视频-动作-语言对齐数据,为VLA模型的预训练与微调提供充足数据支撑,有效弥补真实人类多人交互数据稀缺的行业痛点。
4、3D场景理解与空间推理基准:
作为可控性极强的测试平台,可精准评估模型在视角一致性、物体持久性、空间记忆等核心3D理解能力上的表现,为3D视觉模型的研发与优化提供标准测试场景。
Seedance 3.0模型官网使用入口,字节跳动AI视频生成器
Seedance 2.0 Pro官网使用入口,字节跳动自研、基于即梦AI模型的AI视频生成平台
Seedance 2:字节跳动多模态AI视频生成模型,电影级创意落地工具
Seedance 2.0:模型支持首尾帧、视频片段、音频多维度综合参考
HunyuanCustom:支持文本、图像、音频、视频多模态输入的多模态定制视频生成框架
标签: AI视频生成模型
上面是“Solaris多人视频模型官网入口,累计收集1260万帧多人游戏标注数据”的全面内容,想了解更多关于 AI项目和框架 内容,请继续关注web建站教程。
当前网址:https://m.ipkd.cn/webs_31692.html
声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!

帝国cms前台会员投稿编辑器上传图片自动加上水
物种多样性数据平台:生物多样性数据的在线资源
小米众筹平台:用户可以通过小米智能家庭App或小米官网参与众筹活动
推荐一款「国产版」AI绘画工具——触手AI绘画
讯飞写作APP最新版
Chrono下载管理器:用户的所有下载管理工作都在浏览器中完成