Python网络爬虫——学习心得

网络爬虫,即Web Spider,是一个很形象的名字。 把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是经过网页的连接地址来寻找网页的。 从网站某一个页面(一般是首页)开始,读取网页的内容,找到在网页中的其它连接地址,而后经过这些连接地址寻找下一个网页,这样一直循环下去,直到把这个网站全部的网页都抓取完为止。 若是把整个互联网当成一个网站,那么网络蜘蛛就能够用这个原理
相关文章
相关标签/搜索