使用split_size优化的ODPS SQL的场景

时间 2021-07-10

原文原文链接

使用split_size优化的ODPS SQL的场景首先有两个大背景需要说明如下：说明1：split_size，设定一个map的最大数据输入量，单位M，默认256M。用户可以通过控制这个变量，从而达到对map端输入的控制。设置语句：set odps.sql.mapper.split.size=256。一般在调整这个设置时，往往是发现一个map instance处理的数据行数太多。说明2：小文