Hadoop读书笔记----(四)序列化

 Hadoop 分布式计算,序列化是Hadoop通过RPC调用,使得每个节点之间有效沟通的方法。 于是序列化就成为了分布式计算的一个重要课题。 序列化之后,对于分布式计算还需要排序。因此排序也相当重要: Hadoop要求对象在序列化之后的字节也能够支持排序,以提高计算速度,还不必产生很多无谓的数据。   下面两张图记录了JAVA原生类型转化成序列化以后所占的字节数         Hadoop里关
相关文章
相关标签/搜索