小米大模型团队在音频推理领域取得重大突破,受DeepSeek-R1算法启发,率先将强化学习应用于多模态音频理解任务,并在国际权威的MMAU(Massive Multi-Task Audio Understanding and Reasoning)音频理解评测中以64.5%的准确率登顶。