学习的爬虫一点小感悟附上爬取淘宝信息的教程

时间 2020-02-11

原文原文链接

学习了一个月的爬虫，对爬虫的概念和思路有了一个基本了解，爬虫的基本思路是：首先获取网页源码，使用urllib,request库等；而后对网页源码进行筛选出须要的信息，使用正则表达式，BeautifulSoup库等，最经常使用的仍是正则表达式；其次就是存储信息，能够将信息存储到excel表格，txt文件中，也能够存储到Mysql等数据库中。在学习爬虫的阶段也是对python语言的一种更

>>阅读原文<<