Home

Awesome

README

书之溯源 SourceBook

把低分辨率的扫描书恢复为高分辨率,是我多年夙愿。在了解到有超分辨率这一技术的时候,我就寄期望于能够用超分技术达成目的。

时间一天天过去,最后还是自己不完美地做了实现。

书之溯源即恢复书本身的模样,亦是书之夙愿的谐音;SourceBook中的Source是追溯的意思,也指代数据集中的一部分图片使用思源字体(Source Han)。

logo

关于数据集

训练使用的数据集包含多个部分的内容:

类型文件前缀来源备注链接
纯文本sourcehan2使用思源宋体合成纯文本图片,包含常见中英文字符及假名v1黑白,v2灰阶https://github.com/adobe-fonts/source-han-serif
纯文本sourcehan使用思源宋体合成纯文本图片,包含千字文及假名灰阶https://github.com/adobe-fonts/source-han-serif
纯文本sourcehan1使用思源黑体合成纯文本图片,包含千字文及假名灰阶https://github.com/adobe-fonts/source-han-sans
纯文本sourcehan_b使用思源黑体合成纯文本图片,包含千字文及假名,缩小字号并使用jpeg 60%压缩彩色https://github.com/adobe-fonts/source-han-sans
纯文本wenkai使用蒹葭文楷合成纯文本图片,包含千字文及假名灰阶https://github.com/lxgw/LxgwWenKai
纯文本genyomin使用源樣明朝体合成纯文本图片,较其他样本加大字号,包含千字文及常见繁体字灰阶https://github.com/ButTaiwan/genyo-font
纯文本crimson使用Crimson Text合成纯文本图片,包含英文衬线体普通、粗体、斜体,降采样后无处理灰阶https://fonts.google.com/specimen/Crimson+Text
书籍realbook图书《圈圈教你玩USB》节选扫描,作者: 刘荣灰阶相关法律
彩图color为避免色彩推理错误,添加彩图数据。含colored manga 漫画数据集及其他一些ACG彩色图片,缩小1/2使用彩色https://www.kaggle.com/datasets/ultraamvking/colored-manga

担心污染暂未使用的数据,备选

类型文件前缀来源备注链接
钢琴谱piano钢琴谱电子档,非出版物
漫画mangaOpenMantra 漫画机器翻译评估数据集https://github.com/mantra-inc/open-mantra-dataset

关于模型

我已经使用Real-ESRGAN和此数据集训练基于官方x2plus预训练模型的2x微调模型。

扫描书修复效果-输入输出对比图: 样本
扫描书修复效果-与官方模型对比: 样本1 样本1

模型SourceBook-X2X4plusX4plus-AnimeAnimevideov3-X4
缩放倍率2444
速度Baseline0.29x0.94x7.14x

下载

ncnn模型及Windows、Linux推理程序见本仓库release页面: https://github.com/tumuyan/SourceBook-Dataset/releases

pth模型下载(训练log也在huggingface仓库中): https://huggingface.co/tumuyan/SourceBook/tree/pth/models

colab推理(使用pth模型): https://colab.research.google.com/drive/1E2IEo1zUapxMuOb2Px3VYy_zhDsu9OTR?usp=sharing

目录结构

├─beforecrop            // 分辨率>480*480未切片的图片,备用
└─test                  // 测试评估数据,未切分
└─sourcebook            // Real-ESRGAN 训练数据集
    ├─meta_info         // 图像文件清单
    ├─sourcebook_hr     // 高分辨率图像
    └─sourcebook_lr     // 低分辨率图像

相关法律

中华人民共和国著作权法

第二十四条 在下列情况下使用作品,可以不经著作权人许可,不向其支付报酬,但应当指明作者姓名或者名称、作品名称,并且不得影响该作品的正常使用,也不得不合理地损害:

(一)为个人学习、研究或者欣赏,使用他人已经发表的作品;

...

(六)为学校课堂教学或者科学研究,翻译、改编、汇编、播放或者少量复制已经发表的作品,供教学或者科研人员使用,但不得出版发行;