【职问 数据分析】

1、统计学知识

均值、中值、众数、最大最小值、方差、标准差数据库

 一、正态分布

 二、相关

 

如图,Y轴和X轴存在相关性,X越大,Y越大。所以花粉数量和防晒霜销量呈正相关机器学习

 三、回归

 

 

 

 

 

 

 

2、Excel

Vlookup函数

 3、数据库

文本类型学习

 数值类型spa

 日期类型3d

 一、建立、调整、删除表

#生成数据表结构
create table users(
    user_id int primary key,
    name varchar(20),
    age int,
    city varchar(20),
    state varchar(20),
    monthly_active int
);

#描述表结构
describe users;

#删除表
drop table users;

#再次建立表:1、主键放最后声明;2、加上name非空、city惟一的限制;3、设置city缺省值
create table users(
    user_id int,
    name varchar(20) not null,
    age int,
    city varchar(20) unique default 'unknown',
    state varchar(20),
    monthly_active int,
    primary key(user_id)
);

#调整数据表:增长字段、删除字段
alter table users add gender char(1);
alter table users drop column gender;

二、增删改

2.一、 insertcode

# 1、向空表插入数据
insert into users values 
(1,'Jack',19,'Dallas','Texas',22),
(2,'Lucy',20,'Boston','Massachusetts',15),
(3,'Tom',13,'Los Angeles','California',8),
(4,'Alice',22,'San Jose','California',17),
(5,'Zhang',32,'Chicago','Illinois',22);

#2、向指定列添加数据 
INSERT INTO users (user_id,age,city,state,monthly_active) VALUES (1,19,'Dallas','Texas',22);

2.二、 deleteblog

# 删除符合某种条件的记录
DELETE FROM users WHERE user_id=4;
DELETE FROM users WHERE monthly_active<15;

2.三、 updateci

UPDATE users SET state='CA' WHERE state='California';
UPDATE users SET name='Jackie',age=29 WHERE user_id=1;

三、其余

3.一、 COUNT函数数据分析

COUNT(1)=COUNT(*),统计全部的记录

COUNT(列名),列名中为NULL的忽略不计

3.二、 ER图

 4、Python

一、基本数据类型

 

 1)Number

id=1000           #int类型
deposit=2013.88   #float类型
is_male=True      #bool类型
com=2013.88+1000j #复数类型 

2)String

3)List

 

 

 

 

4)Tuple

列表用[]定义,元组用()定义;列表内容可修改,元组不可修改

tup1 = () # 空元组
tup2 = (20,) # 一个元素,须要在元素后添加逗号
tup3 = (100000, 100001, 100002, 100003, 100004)

5)Set

六、Dictionary

 

 

二、条件控制与循环

 

 

 

 

三、科学计算库Numpy

四、数据分析处理库Pandas

五、数据可视化库Matplotlib

六、Python与SQL的联动

 

 5、可视化

tableau和AntV

 6、爬虫

 7、机器学习

 8、商业分析

一、百度财报分析

 

 财报基本概念——三张表(资产负载表、利润表、现金流量表)

 

 一、2019Q1百度财报总览

   百度股价相对年初降低40%+

 二、主营业务介绍

  财务分析

  挑战和机遇

三、新业务和AI战略业务分析

  爱奇艺业务分析:总体概览、挑战、优点和机遇

  DuerOS业务分析:总体概览、挑战、机遇

   Apollo无人驾驶业务分析:~

 

 四、基于数据和业务分析的洞察和判断(建议)

  主营业务-搜索和信息流(用户端、商业端)

  新业务和AI战略业务

二、商业分析

 

 一、老板要什么

  老板的职责、你应该交付什么

二、总体分析,局部分析

  看总体:看主营业务,看其余

  总体和局部分析后的进一步洞察(总结、结论)

三、看大盘,看竞对,看团队

  看大盘:广告在GDP的比重,在线广告和传统广告走势

  看竞对:国外Google,腾讯,微博,头条

  综合大盘和竞对的洞察(总结、结论)

  看团队

四、造成方案和计划

  对交付的考虑

  交付方案要点

  方案和计划组成:目标为可量化的具体描述(如手机百度DAU从200W到250W)

相关文章
相关标签/搜索