上周在极客时间偶然看到陈旸博士的关于数据分析的课程,以为很不错,便坚决果断的花钱买了这个课程,今天抽空看了实战分析第二讲,感触最深的就是学习过程必定要作笔记,不只能锻炼本身的概括总结能力,更能对这一讲的东西进行回顾,还能时不时回头看看当初的想法。因此,我也试着开始作些笔记,毕竟大神都是这么过来的,好了,话很少说,进入今天的正题:数据分析全景图及修炼指南。算法
该讲主要引导读者从全局去了解什么是数据分析?为何作数据分析?怎么去作数据分析?答案就是:掌握数据,就是掌握规律。当你了解了市场数据,对它进行分析,就能够获得市场规律。当你掌握了产品自身的数据,对它进行分析,就能够了解产品的用户来源、用户画像等等。因此说数据是个全新的视角。数据分析如此重要,它不只是新时代的“数据结构 + 算法”,也更是企业争夺人才的高地。数据结构
谈到数据分析,咱们通常都会从3个方面入手:工具
数据分析的三驾马车的关系以下:学习
下面来大体认识下这三驾马车:blog
1)数据采集:数据分析
数据的采集,主要是和数据打交道,用工具对数据进行采集,经常使用的数据源,如何获取它们。在专栏里,后续会将介绍如何掌握“八爪鱼”这个自动抓取的神器,它能够帮你抓取 99% 的页面源。也会教读者如何编写 Python 爬虫。掌握 Python 爬虫的乐趣是无穷的。它不只能让你获取微博上的热点评论,自动下载例如“王祖贤”的海报,还能自动给微博加粉丝,让你掌握自动化的快感。数学
2)数据挖掘:产品
数据挖掘,它能够说是知识型的工程,至关于整个专栏中的“算法”部分。首先你要知道它的基本流程、十大算法、以及背后的数学基础。自动化
掌握了数据挖掘,就比如手握水晶球同样,它会经过历史数据,告诉你将来会发生什么。固然它也会告诉你这件事发生的置信度是怎样的。数据挖掘
3)数据可视化
为何说数据要可视化,由于数据每每是隐性的,尤为是当数据量大的时候很难感知,可视化能够帮咱们很好地理解这些数据的结构,以及分析结果的呈现。这是一个很是重要的步骤,也是咱们特别感兴趣的一个步骤。
数据可视化的两种方法:
Python :在 Python 对数据进行清洗、挖掘的过程当中,不少的库可使用,像 Matplotlib、Seaborn 等第三方库进行呈现。
第三方工具:若是你已经生成了 csv 格式文件,想要采用所见即所得的方式进行呈现,能够采用微图、DataV、Data GIF Maker 等第三方工具,它们能够很方便地对数据进行处理,还能够帮你制做呈现的效果。
数据分析包括数据采集、数据挖掘、数据可视化这三个部分。乍看你可能以为东西不少,无从下手,或者感受数据挖掘涉及好多算法,有点“高深莫测”,掌握起来是否是会吃力。其实这些都是没必要要的烦恼。我的以为只要心里笃定,认为本身必定能作成,学成,其余一切都是“纸老虎”哈。
再说下,陈博在文章中提到的如何来快速掌握数据分析,核心就是认知。咱们只有把知识转化为本身的语言,它才真正变成了咱们本身的东西。这个转换的过程就是认知升级的过程。
我本人也是很赞同这种说法,简单一句就是“知行合一”
总结