大数据分析,鲁班为祖师

1.《全栈数据之门》现货上架

通过一段时间的等待,目前已经能够在各大电商平台『现货』购买本书。
本文后面也有京东、当当、天猫的购买连接!html

本书适用

本书以数据分析领域最热的Python语言为主要线索,介绍数据分析库Numpy、Pandas与机器学习库Scikit-Learn,使用了可视化环境Orange3来理解算法的一些细节。算法

对于机器学习,既有经常使用算法KNN与Kmeans的应用,决策树与随机森林的实战,还涉及经常使用特征工程与深度学习中的自动编程器。
在大数据Hadoop与Hive环境的基础之上,使用Spark的ML/MLLib库来集成了前面的各部份内容,让分布式机器学习更容易。大量的工具与技能实战,从而将各部分融合成为一个全栈的数据科学内容。编程


2. 大数据分析,鲁班为祖师

该节选自《全栈数据之门》第四章『数据分析,见微知著』的引言部分!机器学习

若是你要问大数据分析最先起源于哪里,答案天然是有着5千年悠久历史的中国了。若君不信,且看下面的说明。分布式

大数据工具

有一颗树,很是很是大,一我的搬不动,因而鲁班发明了锯子,将树锯成不少小节,而后找不少人来帮忙搬,这样不只速度快,并且效率高。此所谓“大树锯”是也。这样一传十,十传百,传到其它国家,你们讹传讹,就变成了“大数据”。oop

分布式存储学习

为了保证高可用性,鲁班教了你们一个好方法。将一样的木料,分3份保存,本身家放一份,邻居家放一份,邻村里面再放一份。若是本身家被烧了,还可使用邻居家的那份。若是整个村子被水湮(或者像如今电视剧里演的同样,在古代可能会一不当心被灭村),还有邻居村子的那份可使用。大数据

数据分析网站

将树锯断后,分红一小节一小节的,统计每节的长度,面积等等。分析木料是否有被虫咬过,以及如何防止其它树也被相似的虫咬。分析树每一年的增加幅度,以及天天须要投入多少水资源来促进树的快速增加。

数据挖掘

鲁班经过分析树干上面的纹理,发现了树的年轮规律,这样能够快速了解树生长了多少年。这个方法被鲁班创建成了一个模型,用于预测其它树每一年的生长速度。另外,还将树根“挖掘”出来,分析为何这个地方能产生这么大的树,和土地是否有关系,土壤的成分是什么,可否将这种土壤移植到其它地方等等。总之,是真正的进行了数据的“挖掘”。

所以,大数据分析技术不只起源于中国,并且其祖师正是木工艺人的祖师--鲁班。

一本正经的胡说八道了这么多,相信你对数据分析有了一个初步的了解吧。
欲了解更多的内容,请关注下面购买地址


3. 网站购买地址

京东:
https://item.jd.com/12054675....
当当:
http://product.dangdang.com/2...
天猫:
https://detail.tmall.com/item...


4. 一些信息

博文视点:
http://www.broadview.com.cn/b...
豆瓣:
https://book.douban.com/subje...
百度百科:
http://baike.baidu.com/item/全栈数据之门/20490226

请输入代码

本文题图取自《全栈数据之门》的封底,使用的是Orange3制做的数据挖掘流程『演示』图。

相关文章
相关标签/搜索