Awesome
抖音推荐/搜索页视频列表视频爬虫方案
最近测试可用时间:
2024.06.20
adb暂未实现进入搜索页的操作,请根据自身技术栈实现相关点击操作及键入关键词等
老版本请切换到
old
分支查看,old
分支使用anyproxy抓取,更适合大多数人使用
基于APP爬取
技术栈:golang
adb
特点
- 可设置仅抓取大于xx赞的视频
- 可自定义设置是否下载远程文件到本地
使用
-
安装
mitm-proxy.crt
证书到相关设备,虚拟机或真机
-
复制
config.example.toml
为config.toml
,并根据自己需求修改参数 -
运行本项目程序
go run main.go
或 编辑运行 -
若开启下载会生成一个
database.db
的sqlite3数据库文件,字符详见model/videos.go
文件,静态文件(用户头像,视频封面图,视频文件)将放在download/[avatar,cover,video]
目录下 -
最后根据个人需要上传处理即可
待优化的地方
-
一直滑动请求推荐列表,APP会异常退出,所以暂时的方法是每爬取一段时间(配置文件里可自定义)后,强制关闭APP,重新打开继续爬取
-
目前个人在用的
雷电模拟器
,长时间运行会卡死,暂不清楚是系统原因还是模拟器原因,有测试能稳定运行环境的朋友,方便的话请告诉我,谢谢
最后说明
- 个人能力一般,有很多编码不规范的地方请包涵
- 有能力的朋友可以根据个人需求修改,如果可以请提交pr
- 如果使用有问题,请提交
issues
或加我同名微信号,请备注github过来的,谢谢
Stargazers over time
Thanks
gorm.io/gorm
github.com/ouqiang/goproxy
github.com/spf13/viper
Development Tool (IDE) For Jetbrains
Thanks for Jetbrains Open Source Licenses.
声明
本项目只做个人学习研究之用,不得用于商业用途!