Alpamayo-R1是英伟达研发的视觉-语言-动作模型,模型核心创新涵盖三大维度:构建因果链(CoC)高质量推理轨迹数据集、采用具备物理常识与具身推理能力的Cosmos-Reason作为VLM骨干网络、设计“监督微调+强化学习”多阶段训练策略。
LONGLIVE是英伟达等顶尖机构联合推出的实时交互式长视频生成框架,针对长视频生成的效率与质量双重瓶颈,创新融合帧级自回归模型、KV-recache机制、流式长视频微调技术及短窗口注意力+帧汇入策略,构建起高性能的长视频生成链路。
Nemotron Speech ASR是英伟达推出的开源实时流式语音识别模型,专为低延迟语音交互场景打造。依托创新的缓存感知架构,模型可缓存已处理语音特征,仅对新音频帧执行增量计算,实现单句转录锁定仅需24毫秒,彻底解决传统流式模型在长语音识别中的累积延迟难题。
Rubin是英伟达推出的新一代全栈协同AI芯片平台,包含六种芯片:Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9网卡、BlueField-4 DPU和Spectrum-6以太网交换机。