关于大数据各个级别选择(Pandas、Hadoop)

开发者博客:www.developsearch.comnode     Hadoop里,全部计算都必须按照一个map、一个group by、一个aggregate或者这种计算序列来写。这和穿上紧身衣同样,多憋得慌啊。许多计算用其余模型其实更适合。忍受紧身衣的惟一缘由就是,能够扩展到极大极大的数据集。可你的数据集实际上极可能根本远远够不上那个数量级。 但是呢,由于Hadoop和大数据是热词,世界有一
相关文章
相关标签/搜索