Ctrl-World是清华大学陈建宇团队与斯坦福大学Chelsea Finn团队联合研发的具身世界模型,模型创新性融合动作条件化架构与物理引擎约束,将机械臂动作参数显式注入生成流程,实现厘米级轨迹精度、0.986策略评估一致性及0.93深度准确性。
TTT-Discover是斯坦福大学、英伟达等顶尖机构联合研发的AI科学发现核心方法,打破传统模型测试阶段仅冻结权重做搜索的模式,创新性在测试阶段对模型开展强化学习训练,通过熵目标函数优化最大奖励,结合PUCT启发的状态重用机制,让模型从具体问题的尝试与探索中实现实时动态学习。