Step 3.5 Flash:阶跃星辰开源Agent场景专用稀疏MoE基座模型

63 ℃
Trae:新一代免费的AI编程工具

Step 3.5 Flash阶跃星辰全新开源的基座模型,专为Agent智能体场景打造,采用稀疏MoE架构,实现性能与效率的双重兼顾:模型总参数达1960亿,推理时每token仅激活110亿参数,推理速度峰值高达350 TPS,同时支持256K超长上下文窗口,在数学推理、代码生成(SWE-bench Verified通过率74.4%)及各类Agent复杂任务中,性能媲美行业顶级闭源模型。目前该模型已全面开源,兼容vLLM、SGLang、llama.cpp等主流框架,可在Mac Studio M4 Max、NVIDIA DGX Spark等消费级硬件完成本地部署,实现数据隐私保护与高性能推理的兼得。

Step 3.5 Flash:阶跃星辰开源Agent场景专用稀疏MoE基座模型

Step 3.5 Flash核心功能:

1、高速推理响应

基于MTP-3技术实现350 TPS峰值生成速度,可快速响应复杂多步推理需求,典型场景生成速度达100-300 tok/s,大幅降低解码延迟;

2、强适配Agent任务

专为智能体场景设计,长链条复杂任务处理能力突出,SWE-bench Verified通过率达74.4%;

3、高效长文本处理

支持256K超大上下文窗口,搭载混合注意力机制,在长文本场景下有效降低计算开销,兼顾处理效率与内容理解深度;

4、全端本地部署

针对消费级硬件做深度优化,可在Mac Studio M4 Max、NVIDIA DGX Spark等设备流畅运行,适配私有化部署需求;

5、专业代码生成

具备强大的编程与工具调用能力,支持代码自动生成、调试及结构化推理输出,可高效处理各类软件工程任务。

Step 3.5 Flash核心技术原理:

1、稀疏MoE架构:平衡大模型能力与推理成本

模型基于45层Transformer骨干网络搭建,每层配置288个细粒度路由专家+1个共享专家,推理阶段仅激活Top-8专家,使每token实际计算参数仅110亿,在保留1960亿大模型核心能力的同时,大幅降低推理成本,实现大模型规模与小模型推理效率的最优平衡。

2、MTP-3多Token预测:突破推理速度瓶颈

由滑动窗口注意力机制+密集前馈网络组成专用预测头,支持单次前向传播并行生成4个token,将典型场景生成速度提升至100-300 tok/s,峰值可达350 tok/s,显著缩短解码耗时,满足实时交互类场景的低延迟需求。

3、混合注意力机制:高效支撑256K长上下文

采用3:1滑动窗口注意力与全局注意力层交替的架构设计:滑动窗口层聚焦局部上下文信息,全局注意力层精准捕捉长距离语义依赖,在256K超长文本处理场景下,有效控制计算复杂度,兼顾长文本理解能力与推理效率。

4、多维度推理优化策略:适配规模化部署

支持专家并行(EP8)与张量并行(TP8)组合部署,搭配FP8量化技术大幅降低显存带宽压力;通过投机解码与MTP-3技术协同优化,可在Hopper GPU上实现高效服务化部署;同时针对消费级硬件做专项适配,为本地私有化部署提供技术支撑。

Step 3.5 Flash核心应用场景:

1、智能编程开发

可作为Claude Code、Codex等工具的底层模型,提供代码生成、自动调试、软件工程全流程任务处理能力,SWE-bench Verified 74.4%的高通过率保障专业编程需求;

2、自主智能体执行

适配深度学术研究、全网网页信息检索、跨平台多源数据对比等长链条推理Agent场景,可高效处理多步骤、高复杂度的智能体任务;

3、实时对话交互

依托100-350 TPS的高速生成能力,为低延迟聊天机器人、在线教育实时辅导、企业智能客服等需要即时响应的交互类应用提供核心支撑;

4、长文本分析处理

可高效完成学术论文深度研读、法律合同全本审查、大型代码库整体理解等任务,精准提取并整合海量长文本中的关键信息,提升长文本处理效率;

5、端侧隐私计算

支持Mac Studio M4 Max、NVIDIA DGX Spark等本地设备部署,无需上传数据至云端,完美满足金融风控、医疗数据处理、企业核心文档分析等敏感数据私有化处理需求,实现数据安全与高性能计算的双重保障。

HuggingFace模型库:https://huggingface.co/stepfun-ai/Step-3.5-Flash

进入Step 3.5 Flash官网入口

Thinker:优必选开源具身智能视觉语言大模型 专为机器人场景打造

GLM-OCR:智谱AI开源轻量级多模态OCR模型0.9B参数登顶OmniDocBench SOTA

BaseHub Forums:开发者专属开源代码问答论坛,AI代理解析源码

GitHub Store:一个面向GitHub Releases的跨平台应用商店

阶跃AI APP最新版

标签: AI基座模型, GitHub仓库, HuggingFace模型库, 阶跃星辰

上面是“Step 3.5 Flash:阶跃星辰开源Agent场景专用稀疏MoE基座模型”的全面内容,想了解更多关于 AI项目和框架 内容,请继续关注web建站教程。

当前网址:https://m.ipkd.cn/webs_29857.html

声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!

生活小工具

收录了万年历、老黄历、八字智能排盘等100+款小工具!生活小工具

猜你喜欢