Awesome

这里是存放开源软件 Umi-OCR 的插件的仓库。

Umi-OCR (v2 以上) 支持以插件的形式导入 OCR 引擎等组件，只需将插件文件放置于软件指定目录即可。

如何开发插件？

如何安装插件

在 Releases 中下载插件压缩包。 不要直接下载仓库的源代码！
在 Releases 中下载插件压缩包。 不要直接下载仓库的源代码！！
在 Releases 中下载插件压缩包。 不要直接下载仓库的源代码！！！

（重要的事情说三遍）

将下载的文件解压，放置于：UmiOCR-data/plugins

OCR 文字识别插件

win7_x64_PaddleOCR-json / linux_x64_PaddleOCR-json

Umi-OCR_Paddle 版自带此插件
目前唯一支持 Windows、Linux 双平台的插件

性能和准确率优秀的开源离线 OCR 组件。支持 mkldnn 数学库加速，能充分榨干 CPU 的潜力。适合高配置电脑使用。

源仓库	PaddleOCR-json
下载	Releases
计算方式	本地，CPU
平台兼容	Windows 7 x64 / Linux x64
硬件兼容	CPU 须带 AVX 指令集（不支持凌动 Atom，安腾 Itanium，赛扬 Celeron，奔腾 Pentium）
附带语言库	`简, 繁, 英, 日, 韩, 俄`

win7_x64_RapidOCR-json

Umi-OCR_Rapid 版自带此插件

相当于PaddleOCR的“轻量版”。CPU兼容性好、内存占用低。速度相对慢一点。适合低配置老电脑使用。

源仓库	RapidOCR-json
下载	Releases
计算方式	本地，CPU
平台兼容	win7 以上，64 位
硬件兼容	无特殊要求
附带语言库	`简, 繁, 英, 日, 韩, 俄`

win7_x64_Pix2Text

支持中英文/数学公式/混合排版。插件体积大，加载速度较慢，识别速度快。

源仓库	Pix2Text
下载	Releases
计算方式	本地，CPU
平台兼容	win7 以上，64 位
硬件兼容	无特殊要求
附带语言库	`中文/英文/数学公式`

TesseractOCR_umi_plugin

老牌开源模型，支持多国语言。速度较快，英文准确率优秀，中文准确率稍差。支持导入多个小语种识别库。
自带排版识别模型，能整理复杂的文档排版，比Umi自带的排版解析器准确率更好。如果使用此插件，请在Umi的标签页设置中将“排版解析方案”设为“不做处理”。

源仓库	TesseractOCR
下载	Releases
计算方式	本地，CPU
平台兼容	win7 以上，64 位
硬件兼容	无特殊要求
附带语言库	`简, 繁, 英, 日，数学公式` （另支持自行下载其他语言模型

chineseocr_umi_plugin

支持中英文识别，ChineseOCR 的轻量级模型，仍在接入适配中。

源仓库	ChineseOCR
下载	Releases
计算方式	本地，CPU
平台兼容	win7 以上，64 位
硬件兼容	无特殊要求
附带语言库	中英文

WechatOCR_umi_plugin

离线调用微信OCR进行ocr识别文字

源仓库	WechatOCR_umi_plugin
下载	Releases
计算方式	本地，CPU
平台兼容	win7 以上，64 位
硬件兼容	无特殊要求
附带语言库	中英日文

插件开发

请见插件开发文档及 demo。

Umi-OCR 项目结构

各仓库：

工程结构：

** 后缀表示本仓库(插件库)包含的内容。

Umi-OCR
└─ UmiOCR-data
   ├─ main.py
   ├─ version.py
   ├─ qt_res
   │  └─ 项目qt资源，包括图标和qml源码
   ├─ py_src
   │  └─ 项目python源码
   ├─ plugins **
   │  └─ 插件
   └─ i18n
      └─ 翻译文件

Awesome

如何安装插件

OCR 文字识别 插件

win7_x64_PaddleOCR-json / linux_x64_PaddleOCR-json

win7_x64_RapidOCR-json

win7_x64_Pix2Text

TesseractOCR_umi_plugin

chineseocr_umi_plugin

WechatOCR_umi_plugin

插件开发

Umi-OCR 项目结构

各仓库：

工程结构：

OCR 文字识别插件