数据挖掘的前提---信息抓取:通用爬虫和聚焦爬虫

一. 互联网信息抓取 二. 爬虫概述 三. 通用爬虫和聚焦爬虫 四. Nutch搜索引擎 五. 爬虫实例分析:舆情信息汇聚 一. 互联网信息抓取 随着网络的迅速发展,Internet (万维网)成为当今世界最大的信息载体,每天又有不可计数的新数据涌入Internet 中。如今, 人们面临的一个巨大的挑战就是如何从海量数据中提取有效信息并加以利用。“ 要处理数据,就要先得到数据”,从Internet
相关文章
相关标签/搜索