集体智慧学习编程——自我改编应用

学习目标: 1、利用博客资源自我创建数据集; 2、利用皮尔逊相关度描述单个数据之间的紧密度; 3、对从新浪博客爬取的博客进行分类; 4、绘制树状图。 一、利用博客资源创建数据集: 我这里选取的是新浪博客,例如http://roll.finance.sina.com.cn/blog/blogarticle/cj-bkks/inde_1.shtml, 其中url中数字1是页码。基于这个规律,可以抓取很
相关文章
相关标签/搜索