咱们在用AI来编写量化策略过程当中,主要用到了机器学习,先来从一张图直观理解什么是机器学习:人类对新问题作出有效决策依靠的是过去积累的许多经验,并对经验进行利用,而对机器来讲,“经验”以“数据”方式存在,机器从过去众多“数据”中产生模型,并对新数据进行预测,这个过程就可理解为“机器学习”。app
那么机器学习到底要经历哪几个步骤,咱们如何用机器学习来构建一个完整的量化策略,下面,咱们经过一个生活中的样例,来类比AI量化策略的工做流程,来帮助你们快速理解AI量化策略:机器学习
咱们接到了隔壁老王求助:要咱们帮他去瓜田判断一堆西瓜的好坏,而且须要在保证正确率的状况下独自完成。若是咱们对此毫无经验,那咱们应该如何应对呢?你们能够先思考一下再与下面步骤进行对比。学习
第一步:明确目标,获取资源。
首先咱们应明确目标,就是判断出这堆西瓜的好坏,为了达到这个目标,咱们应该先去另找来一堆西瓜用来学习,来积累判断西瓜好坏的经验。测试
第二步:资源划分
接下来咱们要把找来的这些瓜分红两堆,其中第一堆瓜用来练手总结规律,为了确保咱们总结的规律是真实可靠的,咱们用第二堆瓜来验证咱们总结的规律。人工智能
第三步:观察学习spa
第四步:预测
此时咱们需来验证咱们上面总结的经验是否知足要求,咱们拿第二堆瓜来验证,根据第二堆瓜的颜色、大小、产地等特征来预测第二堆瓜的好坏。orm
第五步:检验
最后,在预测环节中咱们得出了每一个西瓜的预测结果,为了检验咱们预测结果是否准确,咱们须要切瓜来验证咱们的预测值是否与真实状况相符。cdn
这一过程咱们能够表示为流程图:blog
类比上述挑瓜过程,咱们能够对AI量化策略流程进行分解:排序
AI量化策略的目标(Label):人为定义的模型预测目标,例如将来N日收益率、将来N日波动率、将来N日的收益率排序等统计量,平台AI量化策略默认使用股票收益率做为目标。
训练集: 第一部分的数据用来训练模型,类比第一堆瓜;
验证集: 第二部分的数据用来验证模型效果,类比第二堆瓜;
AI量化策略的特征(features): 反映事物在某方面的表现或性质的事项,在AI量化策略中,特征能够是换手率、市盈率、KDJ技术指标等等
AI量化策略的标注: 咱们计算训练集数据所在时间阶段的每日目标值,好比按每日的将来N日收益率高低来定义股票的走势好坏等级,计算出每只股票将来N日收益率的好坏等级并标记在每只股票上。
第四步:模型训练
咱们经过“好坏等级”对股票进行标注贴上标签,连同其所对应的特征值一块儿来构建训练模型,类比于上述咱们获取了第一堆瓜的大小、颜色等特征数据以及对应切瓜验证其’“好坏”标签,总结出瓜的分类经验;
第五步:预测
用验证集数据来检验训练前面构建好的模型,即检验模型根据验证集的特征数据预测出的目标值(股票走势好坏等级)是否准确。这步类比于鉴瓜任务中根据第一堆瓜总结的鉴瓜经验用第二堆西瓜的大小、颜色等特征数据来判断预测瓜的好坏。
第六步:回测
将验证集的预测结果放入历史真实数据中检测,类比于鉴瓜过程当中根据第二堆瓜预测出瓜的好坏最后进行切瓜验证。
所以,AI量化策略的构建过程也能够用流程图的方式表达以下:
认识了机器学习流程和AI量化策略流程,就可以理解BigQuant平台的BigStudio实验工做流。BigStudio实验工做流是AI量化策略在BigStudio上的可视化展现。一个典型的AI可视化量化策略流程图以下:
简单划分:
具体而言:
策略流程图的左支是训练集特征数据(features)的抽取和训练集目标(label)的标注,标注结果和训练集特征数据经过合并和数据缺失值清洗处理,而后传给机器学习模型进行模型训练。
策略流程图的右支是测试集特征数据的抽取,经过缺失值清洗处理,而后传给机器学习模型进行预测,这里机器学习模型采用StockRanker模型,是一个排序模型,预测的结果是每日的股票排名。
这个排名列表即预测结果最后传给回测模块按必定的规则进行买卖模拟交易,进行检测。
以上就是一个AI量化策略构建大致流程,初学者可先尝试修改特征值来寻找有效因子,每每好的因子组合是策略成功的关键。
快来新建一我的工智能量化策略检测一下你的学习成果吧,在新建策略过程当中,回想一下每一步操做对应咱们上述的第几步,掌握后,你已经能够超越60%的传统交易员啦,快快行动起来!