用于假人的HDFS

每当新手想要开始学习Hadoop时,Hadoop堆栈中的元素数量就令人难以置信,有时甚至难以理解。 我试图解密整个堆栈,并以自己的方式帮助解释基本内容。 在开始讨论Hadoop堆栈之前,让我们退后一步,尝试了解导致Hadoop起源的原因。 问题 –随着互联网的普及,存储的数据量不断增长。 让我们以一个搜索引擎(例如Google)为例,该引擎需要索引正在生成的大量数据。 搜索引擎对数据进行爬网并建立
相关文章
相关标签/搜索