看到Twitter上有好多定时更新笑话集锦的账号,以为本身也能够试试,就申请了 @xiaolintemple 这个号,利用爬虫定时更新笑话python
目前主要笑话来源于 百思不得姐 以及 糗事百科,后期还能够继续扩展git
Mongodb : Nosql数据库github
requests : 一个封装了HTTP服务的python库sql
pyquery : 相似Jquery,使用很是方便mongodb
schedule : job scheduling Python库数据库
pymongo : Mongodb的python库网站
twython : 封装的twitter库spa
这里会用到适配器,通配各类网站的爬虫代码,方便扩展更多网站rem
主要目的有两个:get
我的总结。之前码完代码以后,也不会总结,也许过段时间再回过头来再看代码,总会以为遗漏掉了一些什么,当初怎么想,为何这么写之类的,也想利用这个机会好好总结一下。
此次写的比较细,若是能给刚开始写爬虫的朋友一些借鉴的话,那也算是快事一件。也欢迎你们pull request,一块儿交流
Github地址: https://github.com/bonfy/xiaolinBot
欢迎你们一块儿交流