Home

Awesome

<p align="left"> <span> <b>中文</b> </span> <span> • </span> <a href="README_en.md"> English </a> <span> • </span> <a href="README_ja.md"> 日本語 </a> </p> <p align="center"> <a href="https://github.com/hiroi-sora/Umi-OCR"> <img width="200" height="128" src="https://tupian.li/images/2022/10/27/icon---256.png" alt="Umi-OCR"> </a> </p> <h1 align="center">Umi-OCR 文字识别工具</h1> <p align="center"> <a href="https://github.com/hiroi-sora/Umi-OCR/releases/latest"> <img src="https://img.shields.io/github/v/release/hiroi-sora/Umi-OCR?style=flat-square" alt="Umi-OCR"> </a> <a href="https://github.com/hiroi-sora/Umi-OCR/blob/main/LICENSE"> <img src="https://img.shields.io/github/license/hiroi-sora/Umi-OCR?style=flat-square" alt="LICENSE"> </a> <a href="#下载发行版"> <img src="https://img.shields.io/github/downloads/hiroi-sora/Umi-OCR/total?style=flat-square" alt="forks"> </a> <a href="https://star-history.com/#hiroi-sora/Umi-OCR"> <img src="https://img.shields.io/github/stars/hiroi-sora/Umi-OCR?style=flat-square" alt="stars"> </a> <a href="https://github.com/hiroi-sora/Umi-OCR/forks"> <img src="https://img.shields.io/github/forks/hiroi-sora/Umi-OCR?style=flat-square" alt="forks"> </a> <a href="https://hosted.weblate.org/engage/umi-ocr/"> <img src="https://hosted.weblate.org/widget/umi-ocr/svg-badge.svg" alt="翻译状态"> </a> </p> <div align="center"> <h3> <a href="#目录"> 使用说明 </a> <span> • </span> <a href="#下载发行版"> 下载地址 </a> <span> • </span> <a href="CHANGE_LOG.md"> 更新日志 </a> <span> • </span> <a href="https://github.com/hiroi-sora/Umi-OCR/issues"> 提交Bug </a> </h3> </div> <br> <div align="center"> <strong>免费,开源,可批量的离线OCR软件</strong><br> <sub>适用于 Windows7 x64 、Linux x64 </div><br> <p align="center"><img src="https://tupian.li/images/2023/11/19/65599097ab5f4.png" alt="1-标题-1.png" style="width: 80%;"></p>

1-标题-2.png

目录

使用源码

开发者请务必阅读 构建项目

下载发行版

以下发布链接均长期维护,提供稳定版本的下载。

<details> <summary><b>•&nbsp;&nbsp;Scoop Installer</b>(点击展开)</summary>

Scoop 是一款Windows下的命令行安装程序,可方便地管理多个应用。您可以先安装 Scoop ,再使用以下指令安装 Umi-OCR

scoop bucket add extras
scoop install extras/umi-ocr
scoop install extras/umi-ocr-paddle
</details> </br>

开始使用

软件发布包下载为 .7z 压缩包或 .7z.exe 自解压包。自解压包可在没有安装压缩软件的电脑上,解压文件。

本软件无需安装。解压后,点击 Umi-OCR.exe 即可启动程序。

遇到任何问题,请提 Issue ,我会尽可能帮助你。

界面语言

Umi-OCR 支持的界面多国语言。在第一次打开软件时,将会按照你的电脑的系统设置,自动切换语言。

如果需要手动切换语言,请参考下图,全局设置语言/Language

<p align="center"><img src="https://tupian.li/images/2023/11/19/65599c3f9e600.png" alt="1-标题-1.png" style="width: 80%;"></p>

标签页

Umi-OCR v2 由一系列灵活好用的标签页组成。您可按照自己的喜好,打开需要的标签页。

标签栏左上角可以切换窗口置顶。右上角能够锁定标签页,以防止日常使用中误触关闭标签页。

截图OCR

<p align="center"><img src="https://tupian.li/images/2023/11/19/65599097aba8e.png" alt="2-截图-1.png" style="width: 80%;"></p>

截图OCR:打开这一页后,就可以用快捷键唤起截图,识别图中的文字。

文本后处理

<p align="center"><img src="https://tupian.li/images/2023/11/19/6559909f3e378.png" alt="2-截图-2.png" style="width: 80%;"></p>

关于 OCR文本后处理 - 排版解析方案: 可以整理OCR结果的排版和顺序,使文本更适合阅读和使用。预设方案:

上述方案,均能自动处理横排和竖排(从右到左)的排版。(竖排文字还需要OCR引擎本身支持)


批量OCR

<p align="center"><img src="https://tupian.li/images/2023/11/19/655990a2511e0.png" alt="3-批量-1.png" style="width: 80%;"></p>

批量OCR:这一页用于批量导入本地图片进行识别。

忽略区域

<p align="center"><img src="https://tupian.li/images/2023/11/19/6559911d28be7.png" alt="3-批量-2.png" style="width: 80%;"></p>

关于 OCR文本后处理 - 忽略区域: 批量OCR中的一种特殊功能,适用于排除图片中的不想要的文字。

<p align="center"><img src="https://tupian.li/images/2024/05/30/66587bf03ae15.png" alt="忽略区域范围示例.png" style="width: 80%;"></p>

文档识别

<p align="center"><img src="https://github.com/hiroi-sora/Umi-OCR/assets/56373419/fc2266ee-b9b7-4079-8b10-6610e6da6cf5" alt="" style="width: 80%;"></p>

文档识别


二维码

<p align="center"><img src="https://tupian.li/images/2023/11/19/655991268d6b1.png" alt="4-二维码-1.png" style="width: 80%;"></p>

扫码

Aztec,Codabar,Code128,Code39,Code93,DataBar,DataBarExpanded,DataMatrix,EAN13,EAN8,ITF,LinearCodes,MatrixCodes,MaxiCode,MicroQRCode,PDF417,QRCode,UPCA,UPCE

<p align="center"><img src="https://tupian.li/images/2023/11/19/6559911cda737.png" alt="4-二维码-2.png" style="width: 80%;"></p>

生成码


全局设置

<p align="center"><img src="https://tupian.li/images/2023/11/19/655991252e780.png" alt="5-全局设置-1.png" style="width: 80%;"></p>

全局设置:在这里可以调整软件的全局参数。常用功能如下:

调用接口:


软件本地化翻译:

感谢以下译者,为 Umi-OCR 贡献了本地化翻译工作:(排名不分先后)

译者贡献语言
bobEnglish, 繁體中文, 日本語
Qingzheng GaoEnglish, 繁體中文
Weng, Chia-LingEnglish, 繁體中文
linzowEnglish, 繁體中文
Eric GuoEnglish
steven0081English
Marcos iEnglish
plum7x繁體中文
hugoalh繁體中文
ドコモ光日本語
杨鹏Português

如果有信息错误或人员缺漏,请在 这个讨论 中回复。

本项目使用在线平台 Weblate: Umi-OCR 进行本地化翻译协作。我们欢迎任何用户参与翻译工作,您可校对、补充现有语言,或添加新语言。


关于项目结构

各仓库:

工程结构:

** 后缀表示本仓库(主仓库)包含的内容。

Umi-OCR
├─ Umi-OCR.exe
├─ umi-ocr.sh
└─ UmiOCR-data
   ├─ main.py **
   ├─ version.py **
   ├─ qt_res **
   │  └─ 项目qt资源,包括图标和qml源码
   ├─ py_src **
   │  └─ 项目python源码
   ├─ plugins
   │  └─ 插件
   └─ i18n **
      └─ 翻译文件

支持的离线OCR引擎:

运行环境框架:

构建项目

第零步:(可选)fork本项目

第一步:下载代码

请参考 更新日志 开头的说明。

后续步骤:

请跳转下述仓库,完成对应平台的开发/运行环境部署。


赞助

Umi-OCR 项目主要由作者 hiroi-sora 用业余时间在开发和维护。如果您喜欢这款软件,欢迎赞助。

Star History

Star History Chart

更新日志

开发计划

<details> <summary>已完成的工作</summary> </details> <!-- ##### 正在进行的工作 -->
远期计划
<details> <summary>展开</summary>

这些是预想中的功能,在开发初期已预留好接口,将在远期慢慢实现。

但开发途中受限于实际情况,可能更改功能设计、新增及取消功能。

</details>