构建大数据ETL通道--Json数据的流式转换--Avro转Parquet(二)

    若是咱们生成的日志是Avro格式的文件,那么能够直接采用 kite-dataset将Avro数据流式转换成Parquet数据进行存储,并在Hive进行查询。如下是具体步骤: 1 建立dataset ./kite-dataset create dataset:hdfs://test/user/litao/test/parquet/litao/ --schema litao.avsc --fo
相关文章
相关标签/搜索