数据挖掘2,如何从Internet获取内容进行数据挖掘

  目录 技巧1:爬行者 技术2:刮刀 技术3:浏览器自动化 技术4:第三方API 一般准则 处理非常非常多的来源......     在本系列博文的第一部分中,我讨论了如何识别数据挖掘需求的来源。完成后,您需要获取它并将其下载到您自己的计算机上,以便进行处理。我将在博客系列的第二部分介绍此步骤。  建议:下载原始内容并保存文件。 在您了解有关内容的更多信息时,可以反复重新处理保存的文件以提取更多
相关文章
相关标签/搜索