用excel进行数据分析(一)

一、基础操作

数据分析的定义

  • 简单来说,数据分析就是对数据进行分析
  • 专业的说是指用适当的统计方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化的开发属功能,发挥数据的 作用。

数据分析的工作流程

  • 明确分析目的和思路
  • 数据收集
  • 数据处理
  • 数据分析
  • 数据展示
  • 报告撰写

excel中数据分析的插件

  • power query 数据的查询和清洗
  • power view 交互式报表
  • power pivot 数据建模
  • power map 三维地图

基本数据导入

  • 文本导入
  • web导入
  • access导入

数据的清洗与转换

条件格式的使用

  • 色阶
  • 简化版的热力地图,用于识别数据整体的终点关注区间
  • 颜色渐变区间
  • 图标集
  • 分类图示,标示数据属于哪一个区域当前的状态
  • 数据范围/图标种类
  • 迷你图
  • 提供对数据的形象表示
  • 可以显示数值系列中的趋势
  • 数据条
  • 查看某个单元格相对于其他单元格的值

合并计算

  • 去重
    • 在任意一列旁边添加一个数字
    • 在选择添加位置的时候,要选择添加数字的那列
    • 标签选择最左侧
  • 求和
  • 随机函数
    • randbetween(最小值,最大值)

函数

  • 函数输入要满足的条件
  • 输入表达式前需输入"="
  • 括号必须成对出现
  • 参数中需使用英文状态下的逗号
  • 最基本的函数
    • sum 求和
    • average 平均值
    • max 最大值
    • min 最小值
    • count 对数值的计数
    • counta 对文本的计数

if函数

  • 基础if函数
    • if(logical_test,value_if_true,value_if_false)
    • if(判断的逻辑值,满足的为真的条件,不满足的条件)
  • sumif 带条件的求和
    • sumif(range,criteria,sum_range)
      • range 范围
      • criteria 条件
      • sum_range 求和的范围
  • sumifs(sum_range,criteria_range1,…)
    • sum_range 和的范围
    • criteria_range1 第一个条件的范围
  • averageif 带条件的平均值
  • range 范围
  • criteria 条件
  • average_range 平均值的范围
  • averageifs 多个条件的平均值
  • average_range 平均值的范围
  • criteria_range 第一个条件的范围
  • countif 计数的范围
  • 范围
  • 条件
  • countifs 满足多个条件的计数
  • countifs(criteria_range,criteria1…)
  • 条件1的范围
  • 条件1…
  • rank 排名
  • rank(number,ref,[order])
  • number 条件1
  • ref 条件的范围
  • []中的内容可有可无 asc 升序 desc 降序

闰年判断

=IF(OR(AND(MOD(H21,4)=0,NOT(MOD(H21,100)=0)),MOD(H21,400)=0),“闰年”,“平年”)

文本函数

  • 提取
  • left 左侧提取
  • left(文本,要提取的数值)
  • right 右侧提取
  • right(文本,要提取的数值)
  • mid 中间提取
  • mid(文本,从第几个开始,提取几个)
  • 转换
  • upper 将英文小写转大写
  • lower 将英文大写转小写
  • 合并
  • &
  • concatenate 直接添加文本
  • 查找
  • find 精确查找
  • find(查找的文本,源文本,从第几个开始)
  • search 模糊查找
  • search(查找的文本,源文本,从第几个开始)
  • 替换
  • replace
  • replace(源文本,从第几个开始,替换的数值,新文本)
  • subsistute
  • subsistute(文本,源文本,新文本)
  • 重复
  • rept
  • rept(跟重复的次数)

数据函数

  • vlookup 列查找
  • lookup_value 用谁去找
  • table_array 去哪找(表的区域)
  • col_index_num 找的范围
  • range_lookup (0 精确 1 模糊)
  • hlookup 行查找 (使用方法同上)
  • indirect 设置二级下拉菜单
  • indirect(通过谁查找)
  • match 获取某个数据在所有数据的位置
  • match(用谁去找,找的范围,排序)
  • match_type=1 lookup_array为升序排序
  • match_type=-1 lookup_array为降序排序
  • match_type=0 lookup_array为无序 (可以省略)
  • index 通过坐标找数值
  • index(表的区域,行坐标,纵坐标)

数据透视表

创建数据透视表
在这里插入图片描述

透视表
在这里插入图片描述

显示区域
在这里插入图片描述

数据透视表字段

在这里插入图片描述

数据透视图

柱形图 进行元素和元素之间的比较 条形图 元素多时使用 饼图 表现的是占比情况以及面积 折线图 表现的是趋势/走势(和时间有关) 散点图 表现的是相关关系