DataWorks入门

阿里云有不少成熟的云产品(萌新认知),我本身只用过腾讯云的对象存储,对这类云产品不是特别了解。html

有幸参与到大数据相关的项目,跟着学了点工具的使用方法,很是简单,也了解了一些使用大数据分析问题的流程。sql

参考资料

  官方文档->点击跳转数据库

  在使用以前确定须要有帐号巴拉巴拉什么的,根据官方文档来就行了。oracle

临时查询

  临时查询能够写点相似sql的语句查查东西,建建表啥的。ide


  使用过程:临时查询->右键新建-新建节点-ODPS SQL->写语句->运行语句函数

       这里的SQL不是正经的SQL,他们本身有一个规范,具体参考官方文档->点击跳转工具

CREATE TABLE test111 (
    ID int COMMENT 'id'
    ,NAME STRING COMMENT '姓名'
) COMMENT '测试表111'
简单建表
SELECT name
    ,age
    ,tel
FROM test_jey
WHERE age = 20
简单查询
DROP TABLE 表名  --删表
TRUNCATE TABLE 表名  --清空表
其余

 

  这里使用的是按需版,select花钱,按数据的量算钱,最低一分,执行以前会告诉费用,能够不运行。包月的就随便查。测试

  在下方能够看到日志和查询结果,在左边的运行历史也能够看到语句、日志和结果。大数据

建表

  很是简单,能够写语句(选择DDL模式里面写语句),也能够在页面上点点点来建表(我的比较喜欢)。阿里云

  数据开发->带+号的图标->表(或者 表管理->带+号的图标)->表名->表结构信息->提交到生产环境

 

业务流程

  如下为萌新理解:

    对大数据的分析确定很复杂,不是连几个表查询查询就能解决的事情。在这里能够把你想实现的运算按步骤一个节点一个节点写出来,有个可视化的节点,有利于整理思路,不至于写着写着就懵了(好比我这种小可爱

  左边有不少能够拖拽的东西。第一个数据集成的数据同步,数据同步的功能就是将数据从这里(DataWorks里,多是在这里配置了阿里的ODPS,那岂不是又买了odps又买了dataworks)导出到别的数据源(各类数据库、本身的、阿里的,不少种,oracle好像比较费劲),或者将其余数据源的数据导入这里。下面绿色的就是能够用各类语言来算点东西,想用哪一个用哪一个。

  同时,这里的每一步工做均可以定时来作(右侧-调度配置)。由于大数据项目基本都不是死数据,都是逐渐增长的,因此分析也要常常更新。能够设置每一年/月/日/小时/分钟运行。

 

函数列表

  给了一些能够用的函数(在sql语句中使用),很是方便,也能够自定义函数。

相关文章
相关标签/搜索