Home

Awesome

girlCrawler

一个针对网站 http://www.girl13.com 上图片的爬取工具,具有以下功能和特性:

girlCrawler 主要是建立在以下依赖库之上的:

安装和启动

1. 安装 Node.js.

2. 将整个工程 clone 到本地.


$ git clone https://github.com/xuelangcxy/girlCrawler.git

3. 安装依赖文件

4. 在工程的根目录下启动主文件

尚存在的问题

  1. 运行该工程时存在中途中断下载的情况,可以直接按 Ctrl+c 以终止运行并尝试再次启动工程.
  2. 下载完成后可能存在某些图片不能查看,图片大小为0,可以将此类图片文件删除并尝试再次运行工程.
  3. 再次运行工程不会重复下载已存在的文件.

温馨提示:

由于图片数量较大,经测试大小大概在350-400MB,请下载前酌情考虑