近几年来,大数据、人工智能、云计算概念如火如荼,而数据分析作为大数据和人工智能领域必备的职能之一,在人才市场上需求越来越强劲。
那,数据分析职位,一般在哪些城市需求较多,各城市分布情况如何?需要哪些技能?适用于企业哪些业务哪些职能?薪酬竞争力如何?集中在哪些行业需求较多?
接下来,以2019.4.23拉勾网最新发布职位数据为例,一窥数据分析职位现状。
一、研究问题
1、全国数据分析岗位的需求主要分布在哪些区域、行业?
2、数据分析师对经验、学历的要求如何?
3、数据分析的薪酬分布情况如何?
4、哪些企业存在较为高级的数据分析师需求?
5、职位所需关键技能有哪些?适用企业哪些职能(eg产品/借贷/风控/运营等)?
二、数据收集
爬虫工具:后羿采集器
筛选依据:城市-全国,搜索项-数据分析
三、数据清洗
拉勾网采集的数据比较完整,需要补充和清洗的地方不多。这里简单记录一下数据清洗的过程。主要涉及到的操作有分列、替换、筛选、删除,以及一些公式,如mid、SUBSTITUTE等,比较简单,如果遇到难题可以先尝试Google/Baidu搜索。
下面进入具体的操作步骤——(注:刚刚对“数据分析”职位数据处理过程没有截图留存,现在用另一份“数据”职位来操作说明。)
1、分列:将聚集到同一个单元格的薪资、工作年限、学历多项信息分开。
此处以li_b_1列“20k-30k经验1-3年/本科”为例,其他列(例如industry)则简单一些,直接使用“数据-分列-特殊符号”即可。
7、添加一列“职位含金量”,按照最高薪资(>=20k)和最低薪资(<10k)划分为三个标签:高端职位、入门职位、普通职位。
这一项是,后面分析的时候想到多一些维度,回来补上。
8、调整行业industry
后面分析我们发现,如果用源数据的行业中第一项作为标的,则“移动互联网”行业占据了大半壁江山,而源数据“行业”的第二项则被忽略,这样一来可视化结果的可参考性不足。所以我们回到源数据,将第一项为“移动互联网”而第二项不为空且有有效值(例如“金融”“数据服务”“电子商务”等)的数据,尽量统一为去“移动互联网”的格式。
四、数据可视化分析
数据清理完毕之后,即可以开始正式分析过程。Excel也有自带的透视表和透视图等可视化功能,不过毕竟侧重数据分析功能,而在可视化方面稍逊于同为Microsoft家族专门定位“数据可视化”的PowerBI,所以,接下来我们采用PowerBI来进行可视化分析。
以下是具体的分析过程:
1、全国的数据分析岗位的需求主要分布在哪些区域、行业?
(2)接下来看看行业分布。我们看到除了“移动互联网”之外,需求量最大的行业是金融,遥遥领先。其次是数据服务、电子商务。再然后就是O2O,教育,企业服务。
(3)为了进一步了解各城市职业分布情况,我们看看各城市数据分析职位薪酬分布:
——扎心了我大广州。。。
不过细看,排名前五的非北上广深杭的城市,有苏州和重庆。而苏州和重庆,分别只有4条和1条职位数据,所以可以判断,苏州重庆总共发布的5条职位,均是偏高端职位。
另外,推测广州发布的职位中,有一部分是偏传统行业的数据分析所以薪酬水平普遍较其他一线城市低。这个猜测我们后面分析行业的时候再进一步证实确认。
针对经验的分析可以帮助我们了解这一岗位的发展潜力,和对业内对经验的认可程度。如果岗位的经验需求呈现梯度分布时,说明这一岗位是具备较为明确的上升路径的,通过岗位积淀也能够获得更多的机会和认可。另外,如果招聘岗位大部分要求经验1年以上,那作为应届生或者转行求职者,应该如何获得敲门砖?
学历要求则可以带我们了解数据分析岗位的学历门槛。比如,作为数据新人,是否有必要考研?如果学历较低是否能够获得入门机会?
从工作经验来看,需求最多的分布在:3-5年经验和1-3年经验,分别占比44%和38%,两者占据了80%以上的岗位需求,可谓大半壁江山在手。其次到5-10年经验,说明岗位的分布是具有层次性的,高经验人才的需求不低,占到了接近9%,不算太低也不算太高,对比另外2018年年中分析的帖子数据,已经呈上升趋势,说明数据分析未来的职业发展较为可观,整体岗位需求目前正在上升趋势。而不限经验、应届生、1年以下经验,则数量较少,累计占比9%左右,说明没有经验的求职者如需转向数据分析岗位,难度不小,第一关简历关也只能选择其中9%的职位。
针对“没有经验的求职者如何转向数据分析岗位”这个难题,题主我作为跨行求职者之一,曾经刷过不少知乎之类的经验帖。总结来说,零经验入行,只能扎扎实实攒项目实战经验了,搞个博客,打几个比赛,做几个实用又炫酷的demo等等,用来证明自己有着等同于1年以上工作经验的能力。如果还有其他方式,欢迎交流共享。。。。。
针对以上现象我有两种猜想:
一、数据分析岗位的发展阶段仍处于早期但也渐趋成熟的阶段,业内高经验人才逐渐增多,企业高端人才需求也逐渐增多,整个数据分析人才市场将会逐渐形成具规模的梯度分布,但目前阶段尚未形成。
二、可能是由于招聘网站的性质导致的,高端人才的招聘需求未在这里展示出来,而是通过其他渠道发布,所以导致3-5年经验之后的5-10年经验需求数量呈断崖式下跌。通过了解猎头市场的活跃职位以及咨询互联网大厂的朋友,验证我们的猜想:对于互联网行业来说,在岗位的经验需求达到5年以上的时候,企业更偏向于通过如猎头、内推等形式挖掘这类人才,而非在招聘网站上公开发布。
因此,对于有意向从事数据分析岗位的人来说,具备大专学历是最基本的门槛,具备本科学历则是大势所趋。对于大专以下学历求职者来说,学历将成为对数据分析岗位职业发展路径上的“通关牌”;而对于本科学历求职者来说,学历不足以成为对数据分析岗位职业发展路径上的“通关牌”。
首先,数据分析职位基本符合工作经验越多,薪资越高的规律;也基本符合学历越高,薪资越高的规律。也存在一些特例,例如应届毕业生平均薪酬高于职位要求“1年以下工作经验”,据此推测,企业方的角度,应届毕业生比“1年以下工作经验”的求职者有更强的可塑性,从人才的角度来说也就是更加有价值(所以开薪高)。从学历来说,特例是硕士薪酬与博士比肩。硕士薪酬比本科高一大截,本科比大专高一大截,而博士并没有比硕士高一大截,这也说明了,数据分析职位暂不需要博士生那么高的专业知识和技能,本科硕士大专基本已足够。
通过筛选器可以通过学历、经验、薪资维度可以筛选出符合标准的招聘需求。
例如,设置筛选项为:工作经验3-5年,可以筛选出如下的企业:
……(未完待续)
5、职位所需关键技能有哪些?
五、回顾
这次的数据分析过程经历了三个阶段,一是数据采集,二是数据处理,三是数据可视化。
1、数据采集。
直接使用后羿采集器。
2、数据处理。
因数据量不大,且相对比较干净,直接使用Excel处理即可。
如果数据量特别大导致在Excel中处理较慢,又或者是有些比较复杂的处理过程无法用Excel快速高效解决,那可以考虑用“万能”的Python来“提升效率”。俗话说得好,人生苦短,我用Python。当感觉到办公吃力的时候(仅限电脑处理类的机器逻辑工作,不涉及人际沟通等),就是到了可以研究“如何用Python提高工作效率”的时候了。
3、数据可视化。
相传业界最厉害的可视化工具是Tableau,可惜了是个付费软件,作为转行无业渣渣,貌似也没有直接买一个账户的必要。加上微软的PowerBI也是一项不错的免费软件了,也可以满足大部分需求,又和Excel一脉相承,那就先用着PowerBI,让Tableau歇会儿先。
毕。满打满算搞了六个小时。还是有点耗时。人生苦短,我用Python,下次搞个Python版,然后把“数据分析”职位替换成“项目经理”,再替换成其他各式各样的职位,来瞄几眼看看各行各业各城各市百花齐放。