Paperless-ngx是一款开源的智能文档管理系统,旨在将纸质文档转换为可搜索的电子档案,帮助用户实现高效的文档管理与检索。它基于Django框架开发,支持多平台部署,提供OCR识别、智能分类、全文搜索等核心功能,适用于个人用户、企业团队及教育机构等场景。
Paperless-ngx官网首页入口:
1、Paperless-ngx项目GitHub地址:https://github.com/paperless-ngx/paperless-ngx
2、Paperless-ngx官方文档:https://docs.paperless-ngx.com
3、Paperless-ngx中文文档:https://crowdin.com/project/paperless-ngx/zh-CN
Paperless-ngx功能特点:
1、文档扫描与OCR识别:
支持扫描仪和多种扫描工具的集成,能够自动对上传的扫描文档执行OCR处理,将图像中的文字转换为可搜索和可编辑的文本格式。
内置光学字符识别,支持多种语言,可将图片格式的文档转换为可选中、可搜索的文本。
2、文档组织与索引:
系统允许用户通过标签、收件人、类型等对文档进行分类和索引,方便管理和查找。
支持通过标签、联系人、文档类型等自定义字段分类文档。
3、全文搜索与智能标签:
内置强大的搜索功能,支持全文检索、自动完成、结果排序等功能,并利用机器学习技术自动添加标签和文档类型。
支持文档内容的全文搜索,自动完成、相关性排序、高亮显示匹配查询的部分。
4、多格式支持:
系统支持多种文档格式,包括PDF、图片、纯文本文件以及Office文档(如Word、Excel、PowerPoint和LibreOffice)。
支持PDF、PNG、JPG、TIFF等格式。
5、本地存储与安全性:
文档数据存储在本地服务器上,不进行任何形式的传输或共享,确保数据安全。
支持使用GPG加密文档。
6、权限管理与协作功能:
提供多用户权限管理,支持不同用户对文档的访问和编辑权限设置。
内置健壮的多用户权限系统。
7、自动化工作流:
自动导入:监控指定文件夹,自动处理新文档。
OCR处理:内置光学字符识别,支持多种语言。
文件转换:将文档转换为可搜索的PDF/A格式。
元数据提取:自动提取日期、标签等信息。
8、现代化交互界面:
提供定制仪表盘、过滤器、批量编辑、拖放上传、自定义视图、共享链接等功能。
支持表格、小卡片、大卡片三种视图,适配不同浏览需求。
9、集成与扩展:
提供完整的API接口供开发者使用。
支持对接扫描仪、NAS、云存储等设备。
猫抓(Cat-Catch)官网:一款开源的浏览器资源嗅探扩展工具
My User Script扩展插件:实现如自动翻译、去除广告、美化界面等功能
通义万相2.2:开源Wan2.2-T2V-A14B、Wan2.2-I2V-A14B和Wan2.2-IT2V-5B三款模型
标签: AI智能分类, github项目, OCR识别, 文档管理
上面是“Paperless文档管理系统:GitHub项目,支持100+语言的OCR”的全面内容,想了解更多关于 IT知识 内容,请继续关注web建站教程。
当前网址:https://m.ipkd.cn/webs_22259.html
声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!