一、基础操作
数据分析的定义
- 简单来说,数据分析就是对数据进行分析
- 专业的说是指用适当的统计方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化的开发属功能,发挥数据的 作用。
数据分析的工作流程
- 明确分析目的和思路
- 数据收集
- 数据处理
- 数据分析
- 数据展示
- 报告撰写
excel中数据分析的插件
- power query 数据的查询和清洗
- power view 交互式报表
- power pivot 数据建模
- power map 三维地图
基本数据导入
数据的清洗与转换
条件格式的使用
- 简化版的热力地图,用于识别数据整体的终点关注区间
- 颜色渐变区间
- 分类图示,标示数据属于哪一个区域当前的状态
- 数据范围/图标种类
合并计算
- 去重
- 在任意一列旁边添加一个数字
- 在选择添加位置的时候,要选择添加数字的那列
- 标签选择最左侧
- 求和
- 随机函数
函数
- 输入表达式前需输入"="
- 括号必须成对出现
- 参数中需使用英文状态下的逗号
- 最基本的函数
- sum 求和
- average 平均值
- max 最大值
- min 最小值
- count 对数值的计数
- counta 对文本的计数
if函数
- 基础if函数
- if(logical_test,value_if_true,value_if_false)
- if(判断的逻辑值,满足的为真的条件,不满足的条件)
- sumif 带条件的求和
- sumif(range,criteria,sum_range)
- range 范围
- criteria 条件
- sum_range 求和的范围
- sumifs(sum_range,criteria_range1,…)
- sum_range 和的范围
- criteria_range1 第一个条件的范围
- averageif 带条件的平均值
- range 范围
- criteria 条件
- average_range 平均值的范围
- average_range 平均值的范围
- criteria_range 第一个条件的范围
- countifs(criteria_range,criteria1…)
- 条件1的范围
- 条件1…
- rank(number,ref,[order])
- number 条件1
- ref 条件的范围
- []中的内容可有可无 asc 升序 desc 降序
闰年判断
=IF(OR(AND(MOD(H21,4)=0,NOT(MOD(H21,100)=0)),MOD(H21,400)=0),“闰年”,“平年”)
文本函数
- left 左侧提取
- left(文本,要提取的数值)
- right 右侧提取
- right(文本,要提取的数值)
- mid 中间提取
- mid(文本,从第几个开始,提取几个)
- upper 将英文小写转大写
- lower 将英文大写转小写
- find 精确查找
- find(查找的文本,源文本,从第几个开始)
- search 模糊查找
- search(查找的文本,源文本,从第几个开始)
- replace
- replace(源文本,从第几个开始,替换的数值,新文本)
- subsistute
- subsistute(文本,源文本,新文本)
数据函数
- lookup_value 用谁去找
- table_array 去哪找(表的区域)
- col_index_num 找的范围
- range_lookup (0 精确 1 模糊)
- hlookup 行查找 (使用方法同上)
- indirect 设置二级下拉菜单
- match(用谁去找,找的范围,排序)
- match_type=1 lookup_array为升序排序
- match_type=-1 lookup_array为降序排序
- match_type=0 lookup_array为无序 (可以省略)
数据透视表
创建数据透视表
透视表
显示区域
数据透视表字段
数据透视图
柱形图 进行元素和元素之间的比较 条形图 元素多时使用 饼图 表现的是占比情况以及面积 折线图 表现的是趋势/走势(和时间有关) 散点图 表现的是相关关系