爬虫篇-博客园搜索爬取

爬取用户提交关键字在博客园搜索出来的文章,一页十篇,共50页,获取标题,内容,发表时间,推荐量,评论量,浏览量 写入sql server数据库,代码如下; import requests from lxml import etree import pymssql import time # 连接sql server数据库 conn = pymssql.connect(host='127.0.0.
相关文章
相关标签/搜索