DeepSeek-OCR 2是DeepSeek团队推出的第二代高性能光学字符识别模型,模型搭载因果流查询与双流注意力核心机制,可动态重排视觉Token,精准还原复杂文档的自然阅读逻辑。
Model1是DeepSeek在FlashMLA代码库中披露的神秘模型,该模型在技术架构上实现多重突破:回归512维标准架构、深度适配NVIDIA Blackwell架构,创新引入Token级稀疏MLA、VVPA等核心机制,在性能优化、长文本处理能力与硬件适配性上实现质的跃升。
DeepSeek-Math-V2是DeepSeek团队推出的开源数学推理模型,模型聚焦答案正确性与推理过程严谨性,通过训练定理证明验证器与生成器,创新引入元验证机制,让模型能够像人类数学家一样审查证明逻辑、实现自我纠错。
DeepSeek-OCR是DeepSeek团队研发的一款视觉语言模型,主打基于视觉压缩技术的长文本高效处理能力。该模型采用DeepEncoder编码器+DeepSeek3B-MoE解码器的架构,可在保留高分辨率输入信息的前提下,大幅降低激活内存占用与视觉标记数量。