MiniCPM-o 4.5模型:具备视觉理解、超拟人语音生成及声音克隆能力

MiniCPM-o 4.5是面壁智能开源的9B参数全模态旗舰模型,该模型具备领先的视觉理解、超拟人语音生成及声音克隆能力,支持主动交互与实时流媒体处理,可在端侧设备运行,已适配昇腾、海光等多种国产芯片,通过llama.cpp、vLLM等框架实现高效部署。

AI全模态模型AI声音克隆智能交互平台面壁智能
AgentCPM-Report:清华大学等联合研发的本地化深度调研智能体

AgentCPM-Report是由清华大学自然语言处理实验室、中国人民大学、面壁智能与OpenBMB开源社区联合研发的本地化深度调研智能体,基于8B参数的MiniCPM4.1模型打造。

OpenBMB人民大学写作智能体清华大学面壁智能
VoxCPM:0.5B轻量语音生成模型,重塑高保真实时语音合成体验

VoxCPM支持零样本声音克隆,仅需一段参考音频,即可精准复刻说话者的音色、口音、情感语调等细微特征,生成高度逼真的个性化语音。其推理效率同样表现卓越,在NVIDIA RTX 4090 GPU上实时因子(RTF)低至0.17,完美满足实时交互场景需求。

GitHub仓库清华大学语音生成模型面壁智能
AgentCPM-Explore:清华等联合研发的轻量级开源智能体模型

AgentCPM-Explore是由清华、人大、面壁智能与OpenBMB开源社区联合研发的轻量级开源智能体模型。该模型仅依托4B参数规模,却在多项长程任务评测基准中超越同尺寸乃至更大参数量的模型,展现出极高的能力密度;同时支持超100轮稳定交互,具备强大的深度探索能力。

GitHub仓库OpenBMB中国人民大学智能体模型清华大学面壁智能