NemoClaw是英伟达开源的企业级AI Agent框架,内置Nemotron开源模型支持本地推理,并可通过隐私路由调用云端大模型,深度兼容GeForce RTX、RTX PRO工作站及DGX系列硬件,帮助企业在安全合规前提下,全面拥抱GaaS(Agent即服务)时代。
Nemotron 3 Super是英伟达推出的1200亿参数开源AI模型,采用Mamba‑MoE混合架构,专为企业级多智能体系统优化。原生支持100万token超长上下文,推理速度提升3倍、吞吐量提升5倍,在OpenClaw任务成功率达85.6%,性能接近Claude Opus 4.6。
TTT-Discover是斯坦福大学、英伟达等顶尖机构联合研发的AI科学发现核心方法,打破传统模型测试阶段仅冻结权重做搜索的模式,创新性在测试阶段对模型开展强化学习训练,通过熵目标函数优化最大奖励,结合PUCT启发的状态重用机制,让模型从具体问题的尝试与探索中实现实时动态学习。
NVIDIA Earth-2是英伟达推出的全球首套完全开源AI气象预测模型家族,依托Atlas、StormScope、HealDA三大核心架构,分别实现15天全球中期预报、0-6小时公里级临近预报、秒级初始条件生成。
NVIDIA PersonaPlex是英伟达推出的全双工对话AI模型,核心优势在于具备“同时听和说”的实时交互能力,可自然处理对话中的打断、停顿与即时回应。
Alpamayo-R1是英伟达研发的视觉-语言-动作模型,模型核心创新涵盖三大维度:构建因果链(CoC)高质量推理轨迹数据集、采用具备物理常识与具身推理能力的Cosmos-Reason作为VLM骨干网络、设计“监督微调+强化学习”多阶段训练策略。
LONGLIVE是英伟达等顶尖机构联合推出的实时交互式长视频生成框架,针对长视频生成的效率与质量双重瓶颈,创新融合帧级自回归模型、KV-recache机制、流式长视频微调技术及短窗口注意力+帧汇入策略,构建起高性能的长视频生成链路。
Nemotron Speech ASR是英伟达推出的开源实时流式语音识别模型,专为低延迟语音交互场景打造。依托创新的缓存感知架构,模型可缓存已处理语音特征,仅对新音频帧执行增量计算,实现单句转录锁定仅需24毫秒,彻底解决传统流式模型在长语音识别中的累积延迟难题。
Rubin是英伟达推出的新一代全栈协同AI芯片平台,包含六种芯片:Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9网卡、BlueField-4 DPU和Spectrum-6以太网交换机。