『Power AI by AI』 PAI-AutoML2.0重磅发布

PAI-AutoML调参服务是经过算法的方式解放用户调节算法参数的工做。自2018年8月发布PAI-AutoML1.0版本以来,该功能已经帮助众多PAI的中小企业用户提高了模型的准确性,获得了不错的反馈。html

PAI-AutoML1.0版本介绍文章:https://help.aliyun.com/document_detail/87393.html,为了进一步提高该服务的能力,PAI在今日发布AutoML调参服务2.0版本,目前该功能已经在PAI各区域服务全量上线。算法

在AutoML2.0版本中将包含如下Feature:数组

  • 新增目前业内热门的高斯调参方法以及针对大规模数据改良后的高斯采样算法
  • 增长了提早中止条件(EarlyStop)机制,帮助用户能更高效的利用资源

典型用户场景

某公司主营业务是广告DSP平台,对于广告DSP公司来说,CTR预估准确性是营收的生命线。而CTR预估算法在机器学习领域属于二分类算法,目的是经过用户画像判断投放给用户的广告是否会被点击。数据结构

二分类算法若是在PAI平台选用GBDT或者RF这些算法须要有大量的参数调节,并且每一个参数都具备很广的定义域,光靠人工手动调节很难锁定最优的参数组合。以下图,仅树的数目这一个参数就有[1,10000]这1万种参数可能性。dom

经过PAI-AutoML工具,只须要设置每一个参数的大体范围,就能够经过调参算法自动找到最优参数组合:机器学习

从收益来说,假设用户每日投放广告量为1000万次,使用AutoML以前的CTR预估准确率为0.7%,也就是投放1000万次会得到点击7万次。若是经过AutoML调参功能将CTR预估准确性提高到0.8%,能够帮助平台天天新增点击1万次。假设每次广告点击平台的收益是1元,那么平台日新增收入将增长1万元,年直接经济收益超过百万。工具

开箱即用

目前PAI-AutoML功能已经全面上线,只须要进入PAI-STUDIO页面,地址:https://pai.data.aliyun.com/console学习

新建项目并在首页模板中找到”基于对象特征的推荐“模板:优化

点击控制面板中的AutoML功能便可开始试用:url

详细说明

在2.0版本中调参算法种类从4个增长到7个,各个算法详细说明以下:

算法名称 说明
Gause(高斯算法) 高斯过程,是一种非参数贝叶斯模型。做为经典算法,高斯过程已经普遍地被应用于超参优化领域。它经过不断观测超参配置表现来拟合代理模型,再经过模型的预测能力来强化决策,从而能在有限的尝试次数中更有目的地选出合适的超参结果。
Sample(采样算法) 该算法是PAI团队与达摩院合做自研的算法。对于数据量巨大的实验,其实仅须要一部分数据,就能够对一组超参所能获得的最终结果做一个预估。采样算法利用这一特性,结合PBT算法的思想,在增长超参选取数量的同时,逐步提升采样比例,不只能进行更广的探索也能得到更快的加速
EvolutionaryOptimizer(进化式调参方法) 该算法是PAI团队基于PBT理论自研的算法,EvolutionaryOptimizer算法将调参问题当作一个多轮迭代按部就班探索最优解的问题。其中”探索样本数“表示每轮迭代的样本,”探索次数“表示迭代轮数,”收敛系数“控制每次迭代的步长。在迭代过程当中EvolutionaryOptimizer会在每轮结束后抛弃效果不理想的探索样本,并在效果更优的探索样本集合中向外拓展更多探索样本,造成下一轮的计算探索样本集合。以此方式迭代,直到完成迭代轮数。
PBT(Population-based training) PBT是一类基于种群概念的演化算法。它把超参配置看为一个种群,将搜索过程做为一个动态环境,在不断的迭代中对超参配置们进行优胜劣汰的筛选,最终获得表现更好的结果。这类算法概念简洁,能够适应不一样的数据结构,在深度学习模型训练中取得过较好效果。
Grid Search 网格搜索调参法,将每一个参与调参的参数按照比例等分切割,而且将切割后的参数随机组合生成参数数候选集进行计算和对比。
Random Search 随机搜索调参法,在每一个参数空间中随机采样而且组合造成参数候选集,并对候选集进行计算和对比
User-define 用户自定义参数组合

 

本文做者:傲海

原文连接

本文为云栖社区原创内容,未经容许不得转载。 

相关文章
相关标签/搜索