数据分析

数据分析介绍

  • 数据分析是什么?
  • 数据分析能干什么?
  • 为何利用Python进行数据分析?
  • 数据分析过程概述
  • 经常使用库简介

一 、数据分析是什么

undefined

在咱们现在这个时代,相信大多数人都能明白数据的重要性,数据就是信息,而数据分析就是可让咱们发挥这些信息功能的重要手段。html

2、数据分析能干什么

undefined

对于数据分析能干什么其实咱们能够简单的举几个例子:python

  1. 淘宝能够观察用户的购买记录、搜索记录以及人们在社交媒体上发布的内容选择商品推荐算法

  2. 股票能够根据相应的数据选择买进卖出数组

  3. 今日头条能够将数据分析应用到新闻推送排行算法当中数据结构

  4. 爱奇艺能够为用户提供个性化电影推荐服务机器学习

其实数据分析不只能够完成像以上这样的推荐系统,在制药行业也可运用数据分析来预测什么样的化合物更有可能制成高效药物等函数

因此说数据分析绝对是将来全部公司不可或缺的岗位,目前社会上获取数据方式太多了,这么多的数据,只要咱们拥有数据分析的技能,绝对能够应付任何岗位上的工做。工具

三 、为何利用Python进行数据分析

  1. Python的代码语法简单易学学习

  2. Python能够很容易的整合C、C++等语言的代码设计

  3. Python有大量用于科学计算的库

  4. Python不只能够用于研究和原型构建,同时也适用于构建生产系统

四 、数据分析过程概述

4.1 提出问题

在真正的工做场景下,每每咱们须要的处理的是多个庞大的数据集还有多是类型彻底不一样的数据,那这个时候一个准确的问题就可让咱们汇集与问题相关的那部分数据,为后续的分析操做提供一个明确的方向,帮助咱们获得一个有意义的结论。

4.2 整理数据

整理数据主要分为三步:

I. 收集数据

经过多种途径拿到数据,导入到Jupyter Notebook

Ⅱ. 评估数据

这一步主要是须要找出数据是否存在质量或者结构等方面的问题

Ⅲ. 清理数据

经过修改、替换、删除等方式保证数据质量高、结构好

4.3 探索性数据分析

在这一步骤主要能够探索而且扩充数据

4.4 得出结论

undefined

在进行完探索性数据分析以后确定会得出一个结果或者说是结论,这样咱们就能够根据这样一个结论进行相应的操做,就好比说分析股票数据获得那个大盘趋势好能够选择买进,又或者说相似于万达这样的大型商场能够分析那种类型的商品会比较受用户的欢迎,以便针对性的存货。可是具体的操做可能就须要用到机器学习或者推断统计学来实现,这个就与数据分析不同了

4.5 传达结果

分析的能力有多强,分析的价值就有多大。

这一步主要是向其余人证实你发现的看法以及传达意义

五 、经常使用库简介

Numpy

NumpyNumerical Python的简写,主要能够用来作Python数值计算。它提供了多种数据结构、算法以及大部分涉及Python数值计算所需的接口。

  • 快速、高效的多维数组对象ndarray
  • 基于元素的数组计算以及直接对数组执行数学运算的函数
  • 用于读写硬盘上基于数组的数据集的工具
  • 线性代数运算、傅里叶变换,以及随机数生成
  • 用于将C、C++、Fortran代码集成到python的工具

Pandas

Pandas使咱们进行数据分析的一个主要工具。它所包含的数据结构和数据处理工具的设计使得Python中进行数据清洗和分析很是快捷。pandas通常也是和其余数值计算工具一块儿使用的,支持大部分Numpy语言风格的数组计算。PandasNumpy最大的区别就是Pandas是用来处理表格型或者异质性数据的,而Numpy则恰好相反,它更适合处理同质型的数值类数组数据

matplotlib

matplotlib是最流行的用于绘制数据图表的python库。

Scipy

Scipy是科学计算领域针对不一样标准问题域的包集合。提供了强大的科学计算方法(矩阵分析、信号分析、数理分析等)

IPython和Juypyter notebook

IPython是一个增强版的Python解释器,Juypyter notebook是一种基于Web的代码笔记本,最初也是源于IPython项目。

1554707038466

相关文章
相关标签/搜索