2. 金融股票数据的另外一个形态,怎样在业务内部流动,同时怎样避免错误spa
前一篇讲解了股票的原始状态,那麽在业务过程当中,数据会变成怎样的形态,来完成众多奇奇怪怪的业务呢,如下将会解答。blog
首先,任何股票都有机会停市,退市。或者退市了再二次上市。腾讯
例子,阿里爸爸(9988.HK)在港交所二次上市。方法
再例如,富力地产(2777.HK),12供2股的方法向市场增发当天,停牌一天。im
这种状况下,某些股票的数据就会断断续续,不连贯。数据
那麽唯一叁考的标准,就只有大盘指数的数据,才是最信得过的依靠。img
所以把数据拿了回来,应该用大市指数的交易日,做为整个Dataframe的index,而后注入其余股票数据在这Dataframe,才能最完整地保证不出错。注入
以上数据全是乱编,不用细看。co
假设邵匡概念基金,在1月9日~1月10日之间停牌分成,那麽该2天就不会有收市价。错误
可其余股票0700腾讯,1299友邦是正常交易日。
因此这就避免了不少业务问题,如:
a. 邵匡概念基金和友邦的过往5天股价对比图,由於邵匡概念基金是停牌,因此那2天不能画到股价线。这避免了拿错了1月2日,1月3日,1月7日,1月8日,1月11日,这样5个交易日的数据。
b. 计算含多只股票的板块的贝塔值,波动率等,由於邵匡概念基金和该2天停牌,那麽计算均值应该是(370+82)/2,(腾讯+友邦)/2。而不是(370+82+0)/3,(腾讯+友邦+邵匡概念)/3,这样计算确定寻死。