数据挖掘的前提---信息抓取:通用爬虫和聚焦爬虫

一. 互联网信息抓取web 二. 爬虫概述算法 三. 通用爬虫和聚焦爬虫数据库 四. Nutch搜索引擎服务器 五. 爬虫实例分析:舆情信息汇聚网络 一. 互联网信息抓取 随着网络的迅速发展,Internet (万维网)成为当今世界最大的信息载体,天天又有不可计数的新数据涌入Internet 中。现在, 人们面临的一个巨大的挑战就是如何从海量数据中提取有效信息并加以利用。“ 要处理数据,就要先获得
相关文章
相关标签/搜索