MaxCompute问答整理之7月

本文是基于本人对MaxCompute产品的学习进度,再结合开发者社区里面的一些问题,进而整理成文。但愿对你们有所帮助。html

问题1、DataWorks V2.0简单模式和标准模式的区别?
公司数仓的数据上云后,在使用MaxCompute计算引擎时,须要一个稳定、可靠的调度系统,将自身数据生产任务(代码)按照所需依赖关系、运行时间来调度运行,那么DataWorks就派上了用场。DataWorks提供简单模式和标准模式两种工做空间模式。
简单模式指一个DataWorks工做空间对应一个MaxCompute项目,没法设置开发环境和生产环境,只能进行简单的数据开发。标准模式指一个DataWorks工做空间对应两个MaxCompute项目,能够设置开发和生产环境,提高代码开发规范。两个模式还存在项目、用户和权限的不一样。你们能够经过学习官方文档或者是实操来增强认知。
https://help.aliyun.com/document_detail/85772.htmlsql

问题2、用数据集成新增数据源时,测试连通性失败,是什么缘由?
当须要新增数据源时,首先要确认本身的数据源类型、网络类型、是否支持测试连通性。当新增数据源没法支持测试连通性时,能够尝试用独享资源组来解决数据集成问题。网络

具体数据源的区别能够参考文档查看:https://help.aliyun.com/knowledge_detail/72964.html
舒适提示:配置数据源时记得检查帐号密码。函数

问题3、数据源配置中数据过滤条件如何填写?
数据过滤是同步数据的删选条件,能够经过SQL语法填写where过滤语句,通常都是经过日期字段来删选数据。DataWorks的参数配置功能能够知足业务场景的需求,目前参数分为系统参数和自定义参数(推荐)两大类。关于数据源和参数配置能够参考如下文档来详细学习:
数据源配置:https://help.aliyun.com/knowledge_list/72788.html
参数配置:https://help.aliyun.com/document_detail/74450.html工具

问题4、UDF如何加入项目函数列表?
用户能够经过自定义函数来知足不一样的计算需求,MaxCompute的UDF支持跨项目分享。UDF的发布能够经过DataWorks界面来完成。能够参考产品文档来操做:https://help.aliyun.com/document_detail/107615.html学习

问题5、若是我买30个CU时(预付费形式)是否是只能用30个Core来运行任务,当公有云里面资源空闲时,系统会不会像扫描按量付费那样,自动调用30Core之外的空闲资源,来加速个人任务运行?
预付费的资源池是独享的,按购买CU(1CU=1核CPU+4G内存)量固定分配资源,计算任务只能占用独享的资源。可是当在同个区域,已经开通一个预付费规格的状况下,能够经过升级和降配资源方式开通其余规格。若是任务量较大,能够考虑对于消耗资源少的任务采起预付费,资源较大的任务采起按I/O后付费,这样能够保证任务运行时一直有CU资源。测试

问题6、想写Spark处理MaxCompute上的表数据,可是彷佛并不能像写Sql同样在DataWorks上去写Spark程序,应该在哪里写Spark程序,MaxCompute Studio能够吗?
目前MaxCompute Spark支持三种运行方式:Local模式、Cluster模式和DataWorks中执行模式。三种模式须要进行不一样的配置,请参考以下文档:
https://help.aliyun.com/document_detail/102430.htmlurl

问题7、MaxCompute是否支持MD5函数?
支持,MxCompute能够经过内建函数和UDF来实现业务计算需求,常见的日期函数、数学函数、字符串函数等,MaxCompute都是支持的,能够参考以下文档: 
https://help.aliyun.com/document_detail/96342.html日志

问题8、日志记录的各项信息表明什么如何查看?
我理解日志记录其实就是MaxCompute产品里的Logview,Logview是MaxCompute Job提交后查看和Debug任务的工具。能够经过Logview能够看到一个Job的运行状态、运行结果和具体细节以及每一个步骤的进度。
具体功能组件含义请参考以下文档:https://help.aliyun.com/document_detail/27987.htmlhtm

问题9、MaxCompute 2.0里的数据类型使用须要set设置,是否能够在DataWorks里面运行?
使用数据类型系统时,须要进行设置:set odps.sql.type.system.odps2=true;或setproject odps.sql.type.system.odps2=true; ,语句是能够在DataWorks新建表的DDL模式下执行操做。
舒适提示:记得关注数据类型转换。

问题10、decimal数据类型精度溢出如何解决?问题实例以下图。

能够进行set设置:set odps.sql.decimal.odps2=true;


原文连接 本文为云栖社区原创内容,未经容许不得转载。

相关文章
相关标签/搜索