Java--实现网络爬虫抓取RSS新闻（1）网络爬虫详解

时间 2020-05-11

标签 java 实现网络爬虫抓取 rss 详解栏目 Java 繁體版

原文原文链接

网络爬虫定义网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更常常的称为网页追逐者），是一种按照必定的规则，自动的抓取万维网信息的程序或者脚本。算法能够更形象的理解：网络至关于一个巨大的蜘蛛网，每一个蜘蛛丝的交叉点就是一个资源（URI），爬虫这张巨大的网上爬取须要的资源后，经过必定的机制和容器进行存储。网络网络爬虫原理网络爬虫的基本原理能够用一张经典的图归纳：多线程下载器功能

>>阅读原文<<