Java 爬虫系列丨(一)爬虫介绍

1. 简介 1.1 背景 随着互联网的迅速发展,网络资源越来越丰富,信息需求者如何从网络中抽取信息变得至关重要。目前,有效的获取网络数据资源的重要方式,便是网络爬虫技术。简单的理解,比如您对百度贴吧的一个帖子内容特别感兴趣,而帖子的回复却有1000多页,这时采用逐条复制的方法便不可行。而采用网络爬虫便可以很轻松地采集到该帖子下的所有内容。 网络爬虫技术最广泛的应用是在搜索引擎中,如百度、Googl
相关文章
相关标签/搜索