在写论文的时候,选择了写与大数据统计分析有关的方向,可是在讨论的时候,发现其实本身并不知道什么,大数据的统计分析和上课学的统计学有什么不一样。在网上翻看了一些介绍大数据的文章,什么大数据的4个V,什么的,更模糊了,因而回过头来,看这本经典的书,对于技术出身的我,也戏称这本书为一本故事书。程序员
根据一些读书法则,首先提纲挈领。算法
大数据是全量分析,统计分析是一种样本分析学习
大数据的核心是预测
根据相关关系进行预测大数据
大数据分析的原理有的比较早,不过是由于计算和统计比较困难,因此才在这个基础上发展出了样本统计,以及如今统计学中所学习的各类分布。随着计算机技术的发展,计算和存储的成本愈来愈低,分析全量数据的可能性更高了。blog
大数据不等于数据量很是大,大数据的意思是全量数据。数据分析
大数据分析的是事物的相关关系,是一种“是什么”的分析,而不是为何的分析,为何?这个留给专家学者去解释吧。
因此谷歌的程序员能够根据人们的搜索记录来预报流感的范围。对机票的统计和分析能够预测机票的价格。
当看到能够预测机票的价格时,我留心了,我想是否能够根据某些数据的相关关系和预计股票的上涨和下跌的趋势,正确率只要大概50%就能够盈利,后来发现已经有很多这样推测的论文了,粗看论文的样子,貌似不很成功,由于若是成功了,他们的论文就不会发表了,有钱本身赚呀,发表出来你们都用统一的算法,会增长算法的变数。
因而,我结合本身的工做,试着想分析一下旅游项目中的酒店价格。ast
大数据发展的核心动力来源于人类的测量、记录和分析世界的渴望。信息技术-IT,目前重点已经能够从T转向I
其实一切均可以进行数据化(不是数据化)。数据就像一座矿山,你能够从里面提炼黄金,我可从里面开采钻石。经过不一样的角度能够获得不一样的结果,因此至关于一座取之不竭的矿山。电商
在未来,大数据能够从几种角度来产生商机。监控
有大数据思惟的公司和我的。基础
对于大数据应用其实如今尚未合适的立法。人们都生活在监控下,各类购物习惯都在电商哪里,他们知道你的偏好,选择,能够说比你本身更了解你本身。
这样想一下,其实他们想诱导你作什么,你就会去作什么。就像二级市场上的散户,被机构作出来的k线所诱导。
如何去保护我的的隐私也是一项未来必不可少的话题。