TTT-Discover:斯坦福&英伟达联合推出,赋能AI科学发现的全新范式

TTT-Discover是斯坦福大学、英伟达等顶尖机构联合研发的AI科学发现核心方法,打破传统模型测试阶段仅冻结权重做搜索的模式,创新性在测试阶段对模型开展强化学习训练,通过熵目标函数优化最大奖励,结合PUCT启发的状态重用机制,让模型从具体问题的尝试与探索中实现实时动态学习。

AI科学模型斯坦福大学英伟达
HELM官网:斯坦福大学推出的语言模型整体评估体系

HELM是斯坦福大学推出的大模型评测体系。其核心评测框架包含场景、适配、指标三大核心模块,每次评测需明确指定一个应用场景、一套模型适配提示,以及一项或多项评估指标。

AI模型评测大模型评测体系斯坦福大学
OctoTools:斯坦福大学研发的无需训练的高效工具框架,助力复杂任务推理与执行

OctoTools 通过其创新的工具卡系统、多级规划和执行机制,显著提升了复杂任务的推理效率和准确率。它无需额外训练,易于扩展,适用于多种领域,是解决复杂推理任务的强大工具。

AI推理架构AI框架斯坦福大学