Java--实现网络爬虫抓取RSS新闻(1)网络爬虫详解

网络爬虫定义 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更常常的称为网页追逐者),是一种按照必定的规则,自动的抓取万维网信息的程序或者脚本。算法 能够更形象的理解:网络至关于一个巨大的蜘蛛网,每一个蜘蛛丝的交叉点就是一个资源(URI),爬虫这张巨大的网上爬取须要的资源后,经过必定的机制和容器进行存储。网络 网络爬虫原理 网络爬虫的基本原理能够用一张经典的图归纳: 多线程下载器功能
相关文章
相关标签/搜索