数据分析实战45讲(第二讲)--笔记

     上周在极客时间偶然看到陈旸博士的关于数据分析的课程,以为很不错,便坚决果断的花钱买了这个课程,今天抽空看了实战分析第二讲,感触最深的就是学习过程必定要作笔记,不只能锻炼本身的概括总结能力,更能对这一讲的东西进行回顾,还能时不时回头看看当初的想法。因此,我也试着开始作些笔记,毕竟大神都是这么过来的,好了,话很少说,进入今天的正题:数据分析全景图及修炼指南。算法

  该讲主要引导读者从全局去了解什么是数据分析?为何作数据分析?怎么去作数据分析?答案就是:掌握数据,就是掌握规律。当你了解了市场数据,对它进行分析,就能够获得市场规律。当你掌握了产品自身的数据,对它进行分析,就能够了解产品的用户来源、用户画像等等。因此说数据是个全新的视角。数据分析如此重要,它不只是新时代的“数据结构 + 算法”,也更是企业争夺人才的高地。数据结构

      谈到数据分析,咱们通常都会从3个方面入手:工具

  • 数据采集 -- 数据源,咱们要用的原材料
  • 数据挖掘 -- 它能够说是最“高大上”的部分,也是整个商业价值所在。之因此要进行数据分析,就是要找到其中的规律,来指导咱们的业务。所以数据挖掘的核心是挖掘数据的商业价值(所谓的商业智能BI)
  • 数据的可视化 -- 数据领域中的万金油,直观了解数据分析结构

  数据分析的三驾马车的关系以下:学习

  

  下面来大体认识下这三驾马车:blog

  1)数据采集:数据分析

  数据的采集,主要是和数据打交道,用工具对数据进行采集,经常使用的数据源,如何获取它们。在专栏里,后续会将介绍如何掌握“八爪鱼”这个自动抓取的神器,它能够帮你抓取 99% 的页面源。也会教读者如何编写 Python 爬虫。掌握 Python 爬虫的乐趣是无穷的。它不只能让你获取微博上的热点评论,自动下载例如“王祖贤”的海报,还能自动给微博加粉丝,让你掌握自动化的快感。数学

  

  2)数据挖掘:产品

  数据挖掘,它能够说是知识型的工程,至关于整个专栏中的“算法”部分。首先你要知道它的基本流程、十大算法、以及背后的数学基础。自动化

  掌握了数据挖掘,就比如手握水晶球同样,它会经过历史数据,告诉你将来会发生什么。固然它也会告诉你这件事发生的置信度是怎样的。数据挖掘

  

  3)数据可视化

   为何说数据要可视化,由于数据每每是隐性的,尤为是当数据量大的时候很难感知,可视化能够帮咱们很好地理解这些数据的结构,以及分析结果的呈现。这是一个很是重要的步骤,也是咱们特别感兴趣的一个步骤。

 数据可视化的两种方法:

  Python :在 Python 对数据进行清洗、挖掘的过程当中,不少的库可使用,像 Matplotlib、Seaborn 等第三方库进行呈现。

  第三方工具:若是你已经生成了 csv 格式文件,想要采用所见即所得的方式进行呈现,能够采用微图、DataV、Data GIF Maker 等第三方工具,它们能够很方便地对数据进行处理,还能够帮你制做呈现的效果。

   

  数据分析包括数据采集、数据挖掘、数据可视化这三个部分。乍看你可能以为东西不少,无从下手,或者感受数据挖掘涉及好多算法,有点“高深莫测”,掌握起来是否是会吃力。其实这些都是没必要要的烦恼。我的以为只要心里笃定,认为本身必定能作成,学成,其余一切都是“纸老虎”哈。

  再说下,陈博在文章中提到的如何来快速掌握数据分析,核心就是认知。咱们只有把知识转化为本身的语言,它才真正变成了咱们本身的东西。这个转换的过程就是认知升级的过程。

  

  我本人也是很赞同这种说法,简单一句就是“知行合一”

  总结

  • 记录下你天天的认知  
  • 这些认知对应工具的哪些操做
  • 作更多练习来巩固你的认知
相关文章
相关标签/搜索