一款轻量级多模态文档处理模型,高效解锁文档数字化新体验——SmolDocling

SmolDocling是一款由 IBM 研究院开发的开源轻量级多模态文档处理模型,专为高效文档光学字符识别(OCR)和转换而设计。它仅用 256M 参数量,即可将图像文档快速、准确地转换为结构化文本,同时保留文档的原始布局和复杂元素(如代码块、数学公式、图表、表格等)。

AI文档转换AI模型集成