返回
DeepSpeed
DeepSpeed-MII:DeepSpeed开源的大模型高性能推理专属Python库
DeepSpeed-MII是微软DeepSpeed团队开源的轻量级Python库,专注于大型语言模型高效推理加速,凭借阻塞KV缓存、连续批处理、动态SplitFuse等创新技术。
AI推理模型
DeepSpeed
Python库
微软开源模型