python模拟各大网站登录方式,以及一些爬虫程序
-
仅供练习使用,代码注释很详细python
-
走过路过的大佬们,记得给个star支持一下,嘻嘻嘻😝git
-
收集了一些各大网站登录方式, 和一些网站的爬虫程序,有的是经过selenium登陆,有的是经过抓包直接模拟登陆,有的是利用scrapy,但愿对小白有所帮助,本项目用于研究和分享各大网站的模拟登录方式,和爬虫程序,会持续更新。。。github
-
昨天加了个班,对一些老代码进行了重构和测试,大部分均可以用。web
-
欢迎star微信
模拟登陆一些常见的网站
- 若是你有什么比较难登录的网站,好比发现用了selenium+webdriver都还登录不了的网站,欢迎给我提issue
- requests
- selenium
- rsa
- phantomjs
项目地址
Githubcookie
关于
模拟登录基本采用的是直接登陆或者使用selenium+webdriver的方式,有的网站直接登陆难度很大,好比qq空间,B站,若是采用selenium就相对轻松一些。scrapy
虽然在登陆的时候采用的是selenium,为了效率,咱们能够在登陆事后获得的cookie维护起来,而后调用requests或者scrapy等进行数据采集,这样数据采集的速度能够获得保证。测试
已完成
tips of pull request
问题
- 有的验证码须要手动,以后我会尽可能改正
- 代码失效:因为网站策略或者样式改变,致使代码失效,请给我提issue,若是你已经解决,能够提PR,谢谢!
另外
- 若是你有什么比较难登录的网站,好比发现用了selenium+webdriver都还登录不了的网站,欢迎给我提issue
- 若是该repo对你们有帮助,给个star鼓励鼓励吧
欢迎大家
- 项目写了一段时间后,发现代码的风格和程序的易用性,可扩展性,代码的可读性,都存在必定的问题,因此接下来最重要的是重构代码,让你们能够更容易的作出一些本身的小功能。
- 若是你以为某个网站的登陆颇有表明性,欢迎在 issue 中提出
测试
Bilibili自动登陆测试正常,成功率98%
web微信
图虫爬虫
项目地址
Github网站
具体
最后