hadoop之BinaryComparable与BytesWritable

  对于二进制的序列化,hadoop的封装类型为 BytesWritable, BytesWritable 是对二进制数据数组的封装,它的序列化格式为 1 个用于指定后面数据字节数的整数域( 4 字节),后跟字节自己,例如长度为 2 的字节数组

l      数组包含了数值35,序列化形式为14字节的整数(00000002)和该数组中的两个字节(03)和(05数组

BytesWritable的实现依赖于其抽象了的BinaryComparable,而并非直接的去实现序列化接口WritableComparable这个接口,而是由抽象类BinaryComparable(实现了Comparable口)的抽象类的子类实来实现,即在中间抽离出一个抽象类,由抽象类的子类去实现hadoop二进制的序列化。oop

BinaryComparable抽象类重载了两个compareTo方法,而且借助WritableComparator的静态方法实现比较,该抽象类用于二进制数据的比较,默认重载了两个compareTo方法,其类图关系为:spa




值得注意的是getBytes()方法返回的字节数组长度可能没法体现BytesWritable所存储的容量,由于能够经过setCapacity()设置容量大小,因此能够经过getLength()方法来肯定BytesWritable的大小。接口

相关文章
相关标签/搜索