Paperless文档管理系统:GitHub项目,支持100+语言的OCR

66 ℃

Paperless-ngx是一款开源的智能文档管理系统,旨在将纸质文档转换为可搜索的电子档案,帮助用户实现高效的文档管理与检索。它基于Django框架开发,支持多平台部署,提供OCR识别、智能分类、全文搜索等核心功能,适用于个人用户、企业团队及教育机构等场景。

Paperless文档管理系统:GitHub项目,支持100+语言的OCR

Paperless-ngx官网首页入口:

1、Paperless-ngx项目GitHub地址:https://github.com/paperless-ngx/paperless-ngx

2、Paperless-ngx官方文档:https://docs.paperless-ngx.com

3、Paperless-ngx中文文档:https://crowdin.com/project/paperless-ngx/zh-CN

Paperless-ngx功能特点:

1、文档扫描与OCR识别

支持扫描仪和多种扫描工具的集成,能够自动对上传的扫描文档执行OCR处理,将图像中的文字转换为可搜索和可编辑的文本格式。

内置光学字符识别,支持多种语言,可将图片格式的文档转换为可选中、可搜索的文本。

2、文档组织与索引

系统允许用户通过标签、收件人、类型等对文档进行分类和索引,方便管理和查找。

支持通过标签、联系人、文档类型等自定义字段分类文档。

3、全文搜索与智能标签

内置强大的搜索功能,支持全文检索、自动完成、结果排序等功能,并利用机器学习技术自动添加标签和文档类型。

支持文档内容的全文搜索,自动完成、相关性排序、高亮显示匹配查询的部分。

4、多格式支持

系统支持多种文档格式,包括PDF、图片、纯文本文件以及Office文档(如Word、Excel、PowerPoint和LibreOffice)。

支持PDF、PNG、JPG、TIFF等格式。

5、本地存储与安全性

文档数据存储在本地服务器上,不进行任何形式的传输或共享,确保数据安全。

支持使用GPG加密文档。

6、权限管理与协作功能

提供多用户权限管理,支持不同用户对文档的访问和编辑权限设置。

内置健壮的多用户权限系统。

7、自动化工作流

自动导入:监控指定文件夹,自动处理新文档。

OCR处理:内置光学字符识别,支持多种语言。

文件转换:将文档转换为可搜索的PDF/A格式。

元数据提取:自动提取日期、标签等信息。

8、现代化交互界面

提供定制仪表盘、过滤器、批量编辑、拖放上传、自定义视图、共享链接等功能。

支持表格、小卡片、大卡片三种视图,适配不同浏览需求。

9、集成与扩展

提供完整的API接口供开发者使用。

支持对接扫描仪、NAS、云存储等设备。

进入Paperless文档管理系统官网入口

Github中国全球用户排名查询、仓库Star排名

中国区Github开发者排行榜网页版首页入口

猫抓(Cat-Catch)官网:一款开源的浏览器资源嗅探扩展工具

My User Script扩展插件:实现如自动翻译、去除广告、美化界面等功能

通义万相2.2:开源Wan2.2-T2V-A14B、Wan2.2-I2V-A14B和Wan2.2-IT2V-5B三款模型

标签: AI智能分类, github项目, OCR识别, 文档管理

上面是“Paperless文档管理系统:GitHub项目,支持100+语言的OCR”的全面内容,想了解更多关于 IT知识 内容,请继续关注web建站教程。

当前网址:https://m.ipkd.cn/webs_22259.html

声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!

生活小工具

收录了万年历、老黄历、八字智能排盘等100+款小工具!生活小工具

猜你喜欢