Java的String不能处理中文utf-8编码

Sequence File 文件格式支持文件分割,因此适合map-reduce做业。最近有一个项目,把kafka的protobuf数据写到hdfs,方便下游的离线做业作数据分析。java 在kafka中,protobuf序列化成了byte数组(message就是byte数组)。这个时候在linkedin的camus(linkedin开源的一个把kafka数据写到hdfs 的工具)中配置做业把kaf
相关文章
相关标签/搜索