MiniCPM-SALA是9B端侧大模型,核心突破为消费级显卡支持百万级上下文推理,兼具低显存、快推理的优势;技术核心是SALA混合注意力、HyPE混合位置编码,兼顾长文本效率与短文本性能;核心适配个人智能助手、端侧知识库、车载系统、科研文献分析等本地化长文本场景。