学习的爬虫一点小感悟附上爬取淘宝信息的教程

       学习了一个月的爬虫,对爬虫的概念和思路有了一个基本了解,爬虫的基本思路是:首先获取网页源码,使用urllib,request库等;而后对网页源码进行筛选出须要的信息,使用正则表达式,BeautifulSoup库等,最经常使用的仍是正则表达式;其次就是存储信息,能够将信息存储到excel表格,txt文件中,也能够存储到Mysql等数据库中。在学习爬虫的阶段也是对python语言的一种更
相关文章
相关标签/搜索