Home

Awesome

运用unet实现对文档表格的自动检测,表格重建

实现功能

编译对GPU的支持

git clone https://github.com/pjreddie/darknet.git ../darknet cp Makefile ../darknet cd ../darknet && make

下载text.weights模型文件

模型文件地址: http://gofile.me/4Nlqh/fNHlWzVWo 拷贝table.weights文件到models目录

训练(tensorflow2.0版本训练)

https://github.com/chineseocr/table-detect.git

测试

python3 table.py -jpgPath test/dd.jpg 

识别结果展示

<img width="500" height="300" src="https://github.com/chineseocr/table-ocr/blob/master/test/dd.jpg"/> ### 横线竖线检测 <img width="500" height="300" src="https://github.com/chineseocr/table-ocr/blob/master/test/dd_seg.png"/> ### 单元格输出 <img width="500" height="300" src="https://github.com/chineseocr/table-ocr/blob/master/test/dd_box.jpg"/>

参考

  1. darket https://github.com/pjreddie/darknet.git
  2. darknet-ocr https://github.com/chineseocr/darknet-ocr.git
  3. chineseocr https://github.com/chineseocr/chineseocr.git