Home

Awesome

PaddleOCR2Pytorch

简体中文 | English

简介

”白嫖“PaddleOCR

本项目旨在:

注意

PytorchOCRPaddleOCRv2.0+动态图版本移植。

近期更新

特性

高质量推理模型,准确的识别效果

<a name="模型下载"></a>

模型列表(更新中)

PyTorch模型下载链接:https://pan.baidu.com/s/1r1DELT8BlgxeOP2RqREJEg 提取码:6clx

PaddleOCR模型百度网盘链接:https://pan.baidu.com/s/1getAprT2l_JqwhjwML0g9g 提取码:lmv7

更多模型下载(包括多语言),可以参考PT-OCR v2.0 系列模型下载

文档教程

TODO

<a name="Pipline"></a>

PP-OCRv2 Pipline

<div align="center"> <img src="./doc/ppocrv2_framework.jpg" width="800"> </div>

[1] PP-OCR是一个实用的超轻量OCR系统。主要由DB文本检测、检测框矫正和CRNN文本识别三部分组成。该系统从骨干网络选择和调整、预测头部的设计、数据增强、学习率变换策略、正则化参数选择、预训练模型使用以及模型自动裁剪量化8个方面,采用19个有效策略,对各个模块的模型进行效果调优和瘦身(如绿框所示),最终得到整体大小为3.5M的超轻量中英文OCR和2.8M的英文数字OCR。更多细节请参考PP-OCR技术方案 https://arxiv.org/abs/2009.09941

[2] PP-OCRv2在PP-OCR的基础上,进一步在5个方面重点优化,检测模型采用CML协同互学习知识蒸馏策略和CopyPaste数据增广策略;识别模型采用LCNet轻量级骨干网络、UDML 改进知识蒸馏策略和Enhanced CTC loss损失函数改进(如上图红框所示),进一步在推理速度和预测效果上取得明显提升。更多细节请参考PP-OCRv2技术报告

<a name="效果展示"></a>

效果展示

<div align="center"> <img src="./doc/imgs_results/ch_ptocr_mobile_v2.0/11.jpg" width="800"> <img src="./doc/imgs_results/ch_ptocr_mobile_v2.0/00015504.jpg" width="800"> <img src="./doc/imgs_results/ch_ptocr_mobile_v2.0/00056221.jpg" width="800"> <img src="./doc/imgs_results/ch_ptocr_mobile_v2.0/1.jpg" width="800"> </div> <div align="center"> <img src="./doc/imgs_results/ch_ptocr_mobile_v2.0/img_12.jpg" width="800"> </div> <div align="center"> <img src="./doc/imgs_results/french_0.jpg" width="800"> <img src="./doc/imgs_results/korean.jpg" width="800"> </div> <a name="参考"></a>

参考