咱们能够集成crate 到streamsets 中能够实现强大的数据导入,数据分析能力。
演示的是进行csv 文件的解析并输出到cratedbhtml
环境使用docker && docker-composegit
version: "3" services: sets: image: streamsets/datacollector volumes: - "./ms/data:/data" - "./ms/logs:/logs" - "./ms/tmp:/tmp" ports: - "8000:8000" - "18630:18630" crate: image: crate ports: - "4200:4200" - "4300:4300" - "5432:5432"
docker-compose up -d
我已经放到github 项目的data 目录github
参考地址: https://bintray.com/crate/crate/crate-jdbc/view/files/io/crate/crate-jdbc-standalone
我已经放到github 项目 的data 目录docker
https://www.streamsets.com/documentation/datacollector/sample_data/tutorial/nyc_taxi_data.csv
使用ui 的external library 加载ide
CREATE TABLE taxi ( hack_license STRING, medallion STRING, total_amount FLOAT, tip_amount FLOAT );
问题比较多,主要是用户帐户以及健康检查,链接池相关的,通过测试我使用了用户认证,使用默认的crate,参考下面的图便可
crate 官方的文档参考会有问题测试
密码随意,用户为crate
ui
在jdbc 配置中问题比较多,记得经过校验,逐步排除便可。3d
https://crate.io/docs/crate/guide/en/latest/tools/streamsets.html
https://github.com/rongfengliang/streamsets-demos/tree/master/cratedbcode