DeepEyesV2:小红书团队研发推出的多模态智能体模型

DeepEyesV2模型训练分为两个核心阶段:第一阶段通过监督微调,帮助模型建立工具使用的基础认知;第二阶段借助强化学习,大幅提升工具调用效率与场景泛化能力。

小红书开源智能体模型
通义DeepResearch:阿里开源深度研究智能体,赋能长周期复杂任务高效突破

通义DeepResearch无需人工干预即可生成高质量训练数据集,突破传统智能体的数据瓶颈;构建“智能体持续预训练(Agentic CPT)—监督微调(SFT)—强化学习(RL)”的端到端完整训练链路,确保模型能力的系统性迭代。

智能体模型通义实验室阿里开源
WebResearcher:隶属通义DeepResearch家族,阿里通义迭代式深度研究智能体

WebResearcher作为阿里巴巴通义实验室重磅推出的迭代式深度研究智能体,精准模拟人类专家的认知工作流程。它具备自主拆解复杂问题、智能协调工具调用、整合碎片化信息输出有理有据报告的核心能力,与传统研究智能体相比,通过分阶段处理研究全流程。

Agent框架智能体模型阿里通义
ArenaRL:通义联合高德开源,面向开放域智能体的对比式强化学习方案

ArenaRL是由通义DeepResearch团队联合高德共同开源的对比式强化学习方法,专为开放域智能体的训练优化设计。目前,ArenaRL不仅在学术基准测试中表现优异,更已在高德地图真实业务场景中完成落地验证,显著提升了智能体在复杂任务中的规划与执行能力。

智能体模型通义实验室高德地图
AgentCPM-Explore:清华等联合研发的轻量级开源智能体模型

AgentCPM-Explore是由清华、人大、面壁智能与OpenBMB开源社区联合研发的轻量级开源智能体模型。该模型仅依托4B参数规模,却在多项长程任务评测基准中超越同尺寸乃至更大参数量的模型,展现出极高的能力密度;同时支持超100轮稳定交互,具备强大的深度探索能力。

GitHub仓库OpenBMB中国人民大学智能体模型清华大学面壁智能