克服大数据集群的挑战

数据存储曾经是大数据的最大挑战。由于云计算基础设施的进步,存储数据不再是关键问题。如今,数据科学家所面临的最大问题是数据收集。 集群化使得大数据分析更容易。然而,集群也给数据工程师带来了必须解决的问题。 什么是数据集群? 数据集群的概念可追溯到至少20年前。美国俄亥俄州立大学计算机科学和工程系教授Anil Kumar Jain博士在他的白皮书之一中对这一术语进行了很好的描述: “集群是模式(观察,
相关文章
相关标签/搜索