爬虫工程师的入门简介

    互联网是由一个一个的超连接组成的,从一个网页的连接能够跳到另外一个网页,在新的网页里,又有不少连接。理论上讲,从任何一个网页开始,不断点开连接、连接的网页的连接,就能够走遍整个互联网!这个过程是否是像蜘蛛沿着网同样爬?这也是“爬虫”名字的由来。html     做为爬虫工程师,就是要写出一些可以沿着网爬的”蜘蛛“程序,保存下来得到的信息。通常来讲,须要爬出来的信息都是结构化的,若是不是结构
相关文章
相关标签/搜索