TTT-Discover是斯坦福大学、英伟达等顶尖机构联合研发的AI科学发现核心方法,打破传统模型测试阶段仅冻结权重做搜索的模式,创新性在测试阶段对模型开展强化学习训练,通过熵目标函数优化最大奖励,结合PUCT启发的状态重用机制,让模型从具体问题的尝试与探索中实现实时动态学习。
HELM是斯坦福大学推出的大模型评测体系。其核心评测框架包含场景、适配、指标三大核心模块,每次评测需明确指定一个应用场景、一套模型适配提示,以及一项或多项评估指标。
OctoTools 通过其创新的工具卡系统、多级规划和执行机制,显著提升了复杂任务的推理效率和准确率。它无需额外训练,易于扩展,适用于多种领域,是解决复杂推理任务的强大工具。