小米大模型登顶音频推理MMAU榜,强化学习助力多模态音频理解

小米大模型团队在音频推理领域取得重大突破,受DeepSeek-R1算法启发,率先将强化学习应用于多模态音频理解任务,并在国际权威的MMAU(Massive Multi-Task Audio Understanding and Reasoning)音频理解评测中以64.5%的准确率登顶。

AI大模型小米AI音频处理软件