GitHub 上有哪些优秀的 Python 爬虫项目( 二 )

GitHub 上有哪些优秀的 Python 爬虫项目

写的时间有点久了,我自己都可能看不懂自己写的代码是啥玩意了。and最近没有重构计划。有需要的可以自己看看改改。
4.其他因为爬虫项目维护起来比较麻烦,所以我一般懒得传到Github上,有兴趣的小伙伴可以关注一下我的微信公众号"Charles的皮卡丘",里面会不定期分享一些爬虫项目(因为现在不太喜欢写爬虫了,后面比较偏向于发自己的主业CV,或者说AI相关的内容)。然后在底部菜单栏的历史文章里可以看到我发过的所有爬虫代码,需要的自取就ok了。
对了,这里面好像也有几个零星的爬虫相关的项目:
https://github.com/CharlesPikachu/Tools
GitHub 上有哪些优秀的 Python 爬虫项目



■网友
有一些给你推荐一下,参考
龙鹏-言有三:【杂谈】GitHub上有哪些好用的爬虫(从Google百度,腾讯视频抖音,豆瓣到不可描述)1、awesome-spider地址:https://github.com/facert/awesome-spider这是ID为facert的一个工程师开源的,star6000+,内容如下:
GitHub 上有哪些优秀的 Python 爬虫项目

这一款爬虫,里面搜集了几乎所有可以爬取的中文网址,从豆瓣到知网,抖音微博到QQ,还有很多的不可描述的网站,你懂的。
2、Nyspider地址:https://github.com/Nyloner/Nyspider这是ID为Nyloner的一个今日头条的工程师弄的,star1000+,风格与上面的项目大有不同。
GitHub 上有哪些优秀的 Python 爬虫项目

可以看出,都是各类网址。这很头条,跟这位小哥哥的工作内容估计有关系。
3、awesome-python-login-model地址:https://github.com/CriseLYJ/awesome-python-login-model这是ID为CriseLYJ(职业不详)的用户,这个项目用于模拟各种网址登陆,也包含一些简单的爬虫,star6000+。
GitHub 上有哪些优秀的 Python 爬虫项目

先从这个项目开始分析各大网站的登录方式,非常有用,可谓摸清对手再动手。
4、python-spider地址:https://github.com/Jack-Cherish/python-spider这是ID为Jack-Cherish的东北大学的一个学生整理的学习python爬虫的资料,star6000+,包含不少的实战项目,非常适合想学习的朋友。
GitHub 上有哪些优秀的 Python 爬虫项目

其他还有一些项目,不再一一介绍。
https://github.com/jhao104/proxy_poolhttps://github.com/Ehco1996/Python-crawler--------------------------------------此处是分割线--------------------------------------
如果你是做图像的,我再推荐两个功能强大,简单好用的图片和视频爬虫。工具亲测长期有效,省去了很多找爬虫工具的时间,早用早好。
1、Google,Baidu,Bing三大搜素引擎图片爬虫地址:https://github.com/sczhengyabin/Image-Downloader


推荐阅读