Xiaomi MiMo-V2-Omni模型使用入口,小米推出的全模态Agent基座大模型

Xiaomi MiMo-V2-Omni是小米推出的全模态Agent基座大模型,从底层融合文本、视觉、语音三大模态,原生具备感知、推理、执行一体化能力,支持工具调用、GUI操作与复杂任务自主规划,音频理解、图像推理等能力比肩Gemini 3 Pro与Claude Opus 4.6。

Agent基座模型AI全模态模型小米AI
MiniCPM-o 4.5模型:具备视觉理解、超拟人语音生成及声音克隆能力

MiniCPM-o 4.5是面壁智能开源的9B参数全模态旗舰模型,该模型具备领先的视觉理解、超拟人语音生成及声音克隆能力,支持主动交互与实时流媒体处理,可在端侧设备运行,已适配昇腾、海光等多种国产芯片,通过llama.cpp、vLLM等框架实现高效部署。

AI全模态模型AI声音克隆智能交互平台面壁智能