“数据产品”是怎样的存在?


数据背景:为了了解各公司在“数据产品”岗位招聘时的要求,作者通过八爪鱼爬虫工具,采集了3月28日发布于拉钩网的“数据产品”相关岗位招聘信息。共采集记录410条,经过整理去重后,保留391条记录。下面是针对这391条招聘记录的数据分析。

一、地域分布

北京提供了220个数据产品相关岗位,占总招聘岗位数的56.5%。是数据产品岗位需求最大的城市,需求量是第二名上海的4倍,是杭州的5倍,深圳的7倍。


当然,由于没有对比其他招聘网站数据分析,因此这种分布这也可能是由于拉钩网在北京业务较多导致。不过,参考最近网上热传科技部发布的独角兽企业分布,北京也是远超其他城市,因此北京数据产品岗位较多,也是可以理解的。


各地起薪

由于“马上金融”在北京、深圳、重庆都发布薪资范围是“40k~80K”数据产品专家岗位,加之重庆一共只有3个数据产品岗位,导致重庆起薪平均值被拉到19.33k的高位,但是参考对于重庆整体水平参考意义不大。

 

一线城市中,北京以17.59k的平均起薪水平位居第一,当然这也从侧面反应了帝都消费水平。上海杭州同处长三角地区,起薪水平也较为接近,分别是16.67k和16.50k。而广深为主的珠三角地区在数据产品岗位起薪上,已经与上述城市拉开了一定的差距,分别为广州13.94k和深圳的14.91k。

 

从各地起薪最高的企业来看,金融类(北京的马上金融和宜信宜人,广州的广州银行)、O2O服务(上海鱼泡泡、杭州奇点云)、以及数据服务(浙江执御、云徒科技)类企业给出起薪较高的。



二、行业分布

从行业标签来看,定位为“移动互联网”的企业有246家占62.9%,金融和O2O分布式67和66家,接下来是电子商务和数据服务公司,均为59家。说明以上行业公司对于数据产品岗位需求较大。


需要提请各位注意的是,由于拉钩主要为互联网企业提供招聘服务,因此大部分客户具有“移动互联网”标签也是拉钩自身的定位有关。另外,一个公司可以有2个标签,因此标签比例合计超过100%。


行业薪资

起薪:生活服务类企业起薪相对较高,起薪幅度范围也较大。金融行业虽然有部分高起薪异常点,但是主要还是集中在14k~20K范围内,与其他行业差别不大。相对的电商行业提供的起薪较低。

 

顶薪:出人意料,金融行业的顶薪水平并没有想象中高,基本与其他行业持平,反而是O2O、生活服务、数据服务行业的顶薪上四分位数触及到了40K线。当金融行业异常高值也十分明显,80K的顶薪也是之前提到的“马上金融”的岗位。电商行业也存在少了异常值,但是水平较其他行业的顶薪要低。



三、工作职责与要求


对采集的内容,经过分词和词频统计之后,总结了“数据产品”主要的岗位职责和任职要求的关键字。剔除了“数据”、“产品”两个岗位名称相关的词语,以及“熟悉”、“能力”之类的形容词或辅助性的词语之后,选择了各自TOP20的词语。


岗位职责:

可以看到排在最前的是“业务”、“需求”、“分析”与“设计”。可以说,作为数据产品经理,和其他产品经理相同的要求,就是对于业务需求的分析与理解,以及产品设计。接着是“运营”、“用户”,说明数据产品是需要服务于用户运营的。在TOP20词语中,“数据分析”仅列第9位,说明这并非数据产品岗位的核心职责。

 

任职要求:


也用R做个词云来凑数

“经验”以超过第二位关键词“数据分析”2.3倍的频率位居第一。但是,以目前社会招聘需求而言,各公司都希望能招到富有经验的人员,因此“经验”一词可以说是社招岗位共同的核心词。除去“经验”之后,“数据分析”在任职要求中排名第二,同时也可以说是“数据产品”岗位要求中,最为关注的能力要求。虽然“数据分析”在岗位职责中仅排在第9位,但是,可以说数据分析是数据产品人员的基础能力要求。如果不懂数据分析,是不可能成为一名合格的数据产品人员的。

任职要求中,紧随“数据分析”之后的是“沟通”、“分析”、“业务”对应岗位职责中“数据产品”人员需要与业务人员进行沟通,并进行业务分析,才能设计出好的“数据产品”。

在TOP20关键字当中,也出现了“工具”、 “SQL”、“数据挖掘”、“技术”等具体的技能要求,以及“本科”、“数学”、“计算机”等几项学历背景要求。


R分词、词频、词云源码。

 

#########安装wordcloud2包##########

#install.packages('devtools') 

#devtools::install_github("lchiffon/wordcloud2") 

 

 

library(jiebaR)  #载入jieba分词包

library(wordcloud2)  #载入wordcloud2词云包

 

req <- scan('req.TXT',sep='\n',what='',encoding="UTF-8") #读取任职要求文本文件

 

seg_req <- qseg[req] #使用qseg类型分词,并把结果保存到对象seg中

seg_req<- seg_req[nchar(seg_req)>1] #去除字符长度小于2的词语

seg_req <- tolower(seg_req) #英文转化为小写

seg_req <- table(seg_req) #统计词频

seg_req <- seg_req[!grepl('[0-9]+',names(seg_req))] #去除数字

 

length(seg_req) #查看处理完后剩余的词数

 

seg_req <- sort(seg_req, decreasing = TRUE) #降序排序,并提取出现次数最多的前100个词语

 

#write.table (seg_req,file ="seg_req.csv", sep =",", row.names = FALSE)

 

head(seg_req) #查看处理完后排名靠前的内容

 

data = data.frame(seg_req) #改为dataframe格式

data[1:100,]

head(data)

 

wordcloud2(data[2:50,],fontFamily = "微软雅黑",color = "random-dark",

           backgroundColor = "white",shape = "star")

 

#制作成“特定文字形状的词云,性能消耗比较大,生成慢。。

letterCloud(data, word = "数据", wordSize = 2,

           color = 'random-dark',backgroundColor = "snow")  


“数据产品”是近些年随着大数据的兴起而产生的岗位,兼具了数据分析和产品经理的岗位角色,要求能力也更加综合,既要懂业务,又要懂数据。


今天的文章,先写这么多,后续再尝试分析“数据产品”和“数据分析”,以及“产品经理”岗位的差异。还可以尝试分析高薪岗位是否有有不一样的要求。


希望与其他想成为“数据产品”人的同学共同勉励,砥砺前行。


原文载于本人微信公众号“悦读数享”,欢迎关注


--本文完--