Home

Awesome

聚合吉他谱API

接口文档

http://gt-spider.huzerui.com

主要依赖

项目目录说明

.
|-- assets                           // 静态资源目录
|-- docs                             // docsify文档目录
|   |-- index.html                   // docsify入口
|   |-- README.md                    // 文档markdown
|-- servers                          // Koa服务端目录
|-- spiders                          // 爬虫脚本开发目录
|   |-- data                         // 本地数据文件
|       |-- proxy.json               // 爬虫代理ip地址json数据
|   |-- dist                         // 爬虫脚本输出目录
|       |-- main.js                  // 爬虫脚本入口输出
|   |-- src                          // 爬虫脚本逻辑
|       |-- main.js                  // 入口
|       |-- spider_17jita.js         // 17吉他网站爬虫
|       |-- spider_ccjita            // 虫虫吉他网站爬虫
|       |-- spider_jitashe.js        // 吉他社网站爬虫
|       |-- spider_proxy.js          // 代理IP爬虫
|       |-- test.js                  // 测试函数
|       |-- userAgent.js             // userAgent生成
|-- .gitignore                       // Git提交忽略文件规则
|-- README.md                        // 项目说明
|-- package.json                     // 配置项目相关信息
.

开发指南

安装

git clone https://github.com/alex1504/node-guita-spider.git
cd node-guita-spider
npm i
npm i docsify -g

开发

查看package.json有如下命令:

// 爬虫脚本开发
"crawler:dev": "rollup ./spiders/src/main.js --o ./spiders/dist/main.js --f cjs --w",
// 爬虫脚本打包(爬虫开发命令会自动监听并打包,此命令可忽略)
"crawler:build": "rollup ./spiders/src/main.js --o ./spiders/dist/main.js --f cjs",
// 开启Koa服务器,端口3000
"server:start": "node ./server/bin/www",
// Koa服务端开发,使用nodemon自动监听并重启
"server:dev": "./node_modules/.bin/nodemon ./server/bin/www",
// 开启docsify服务器,端口4000
"docs": "docsify serve docs --port 4000"

指南: