e成科技AI算法团队许惠琳、钟海霞作者

从程序员到CTO要走多少步?人工智能职业发展预测告诉你

不管是对于企业还是个人,职业发展已经变得越来越重要,对于企业来讲员工职业发展作为一种重要的激励手段,对于个人来讲,自我实现是人的最高层次需求,职业发展与规划也将对人产生巨大的激励作用。 那么,在数字经济时代,我们如何通过人工智能技术,实现职业发展路径科学规划和精准预测呢?

2018年9月,当马云宣布由张勇接任董事局主席,众人才开始注意到这位“成功男人背后的男人”,原来是位出身CFO的CEO。

张勇是CFO成功转型的典范,试想一下如果以后财务人的职业规划中有了CEO这样的角色,是不是很激动人心呢?

对于个人而言,根据马斯洛的需求层次理论,自我实现是人的最高层次需求,个体通过实现自己的理想抱负,实现自己的追求,成为伟大的或具有影响力的人物满足此层次需求。职业发展属于满足人的自我实现需求范畴,对人的发展产生很大的激励作用。

对于企业来讲,企业发展与个人成长密不可分。职业发展是企业激励员工的重要手段之一,清晰的职业发展路径和得到成功的能力和技能,能够帮助员工释放最大价值、提高员工敬业度,激活组织、降低人才流失率。

作为HR或者猎头顾问,如果对候选人职业发展规划了如指掌或者能够帮助候选人进行详细规划/提出规划建议,那么就能在与候选人沟通的过程中抢占先机。

职业路径是人才发展领域核心的基础模块,在人才发展领域,e成科技基于海量职场数据,设计了整套智能化解决方案,并命名为灯塔(Lighthouse),寓意为职场用户提供个人发展的指引与建议。

背景大起底:学新闻可以去写代码吗?

这里,我们主要针对互联网科技行业相关岗位(IT岗)进行举例探索。想要探索互联网行业职业发展路径,首先我们对IT岗人群与全市场的多维度背景进行对比分析。

众所周知,互联网行业中男女比例差距明显,而在上表中也显示出了这一特征,并且男性占比较高于全市场水平。而从学校排名及学历角度来看,其两项占比均与全市场接近。
 
IT岗人群入岗年龄呈右偏态分布,其中有73.8%的人在22-26岁之间开始任职IT岗,由此我们可以认为,大多数IT岗人员都是大学刚毕业就开始从事IT岗的,半路出家转岗进互联网的占少数

IT岗人群的专业分布情况并不让人意外,其中有近一半的人是计算机科学、电子信息工程、数学等理工科专业背景,而全市场在职人群专业分布相比之下较为均衡,占比最大的是财务与会计(9.2%),其次是计算机科学与技术,但比例仅占8.5%。

△IT岗人群专业背景
 
特别地,我们探索了全市场不同职能下从事每份工作的平均时长,i.e., 跳槽周期。我们发现通用管理和生产是最稳定的岗位,平均跳槽周期在两年半左右;相比之下,影视媒体是流动性最大的岗位,周期在1年左右。
 
IT岗也相对流动性较大,平均跳槽周期为21个月,不足2年。更进一步地,我们挖掘了IT岗下各细分职能的平均转岗周期,发现职级最高的首席技术官的转岗周期相对也最长,而运营和软件开发的周期最短,仅为一年半左右。

互联网行业职业发展路径探索

现在,我们对IT岗人群背景有了基本了解,我们接下来深入探索他们的职业发展路径。

岗位轮动蕴含的行业转换>

IT的岗位轮动中,有61%是在互联网行业内发生的;仅有39%涉及行业转换,这其中,工业与互联网行业之间的轮动最为高频(约20%),其次是消费品行业,而医药和生活服务业则与互联网行业属性差异较大,之间的岗位轮动较少见。

可见上图近似轴对称,其他行业与互联网之间的转入与转出比例十分相近,互联网行业的规模增长主要取决于自身规模的扩展(即第一份工作就入职互联网的人群),而不是从其他行业的转入。第一部分的入岗年龄统计结果也一致印证了这一点。

职业发展路径图展示>

接下来,我们便来看看IT岗人群的职业发展路径具体长什么样吧。我们结合了丰富的数据挖掘算法和业务规则,运用e成科技独特的职能实体识别技术,从每份简历中提取其职业发展路径(e.g., 软件测试->前端开发->移动开发),最终得到各职能下的高频发展路径,下图为部分IT岗的路径示例。

程序员VS首席技术官(CTO):CTO的差异化特征是什么>

就像上图所示,很多程序员在其职业生涯当中,一直在技术圈中打转,却很难有质的跨越。那王侯将相宁有种乎?取得突破的程序员都有什么特征呢,为此e成君分析了下CTO的表面信息。

从统计结果看,CTO中男性占比近90%,本科及以上学历占82.9%,约26%为计算机相关专业;所需工作年限呈现出右偏分布,主要集中在5-10年之间。可见,学历学校等基本背景并不是让程序员的发展之路产生差异化的主要因素,而且,也并不是工作年限越长越可能成为CTO。那么,是什么影响了程序员的晋升之路呢?

带着这个疑问,我们探索了各职能所需的重要技能列表。我们基于成熟的实体识别技术,得到职能实体及其对应的技能实体列表,再结合多样化数据挖掘和统计方法,得到了多种指标下,各个职能所需的重要技能序列。我们在下表中列举了部分IT岗的所需技能之Top5。

从表格中我们可以发现,不同技术岗所需的重要技能偏向于细分领域的工具或技术知识,特别地,MySQL在程序员中的使用率是相当高的;而CTO所需的头部技能大都为“冰山下”技能

  • 商业头脑和市场运营。这需要程序员不光有钻研技术的踏实努力,更需要多一份对外界的好奇心,培养广博的视野和格局,去观察和体会市场变化,顺势而行。

  • 管理能力和战略规划。CTO作为企业技术部的一把手,搭班子第一、带队伍第二、定战略第三。刘备找来关、张、赵、诸葛亮,拿捏住这四个人的心理诉求,基本不用操心其他了。这点则需要有良好的沟通能力作为支撑,有效的沟通能让你事半功倍。

当然,除此之外CTO也需要有较强的架构设计能力。这点也一定程度支持了从“系统架构工程师”到“首席技术官”的职业路径的合理性。

个性化职能预测

以上我们展示了丰富的数据挖掘和大数据统计的结论,e成科技还拥有丰富的算法经验,我们结合了多样化的深度学习算法实现了个性化职业路径预测功能可根据不同个人背景和过往经历,为其推荐更适合的职业发展方向。
 

我们的模型数据主要基于简历中的个人基本信息与工作经历,基本信息为学历、专业等静态属性信息,工作经历则包括过往职能、技能、行业等序列信息。为此,我们选择LSTM作为整个模型的主体部分,完整的模型结构见下图。

如上图所示,对于每一个工作经历的序列节点,我们用Global Average将节点特征压缩为单个向量,在此也可以使用Attention或者全连接等方式来处理,因为节点信息诸如职业/技能等,并没有前后序列相关的信息,所以使用Attention这种无序的信息抽取方式会比全连接更具鲁棒性。院长的实验结果显示,Attention结构并没有比Global Average取得更佳的结果,因此最终还是选择了更为简单的Global Average结构。

工作经历抽象为向量序列后,我们将数据喂给了双层LSTM。一般情形下,循环神经网络都能较好的处理序列数据,但对于RNN结构来说,在序列过长之后很容易出现前期数据遗忘的问题,且易发生梯度爆炸或者梯度消失,所以通常会选择带门控的循环神经网络,如LSTM、GRU等等,这里我们选择了LSTM结构。序列建模经常会用到双向结构,但我们的序列信息属于一种时间序列,如果选择双向结构,则会发生信息泄露的问题,所以最终选择了单向的LSTM模型。

最后在将整个序列信息转为向量t之后,直接拼接基本信息,经过两层全连接输出预测的职能,此为主任务。为了提高模型鲁棒性,我们将前面每个节点的输出(如上图t1)同样的跟基本信息拼接,并预测下一份职能,此为副任务。只预测最后一个职能,会失去一些职能转换的多样性,而副任务可以很好地解决这个问题,并且能让模型更好地学习到职能等特征之间的关系,也变相地增加了数据量。

如上表所示,在得到模型之后,我们对模型效果进行了验证,结果表明:61.5%左右的预测职能与真实职能一致或者高度相似;13.5%左右的预测职能与真实职能相对低阶,容易相互转换;17%左右的预测职能比真实职能看起来更合理;仅8%左右的预测职能与真实职能偏差较大。

这么看来,在大部分情况下,模型预测的结果都符合预期或者相对合理,换句话来说,如果当你对下一份工作不是特别清晰的时候,也许我们能帮你指出一个不错的方向哦!

e成科技
e成科技

e成科技作为助力人才战略成功的AI平台, 开创性地将AI技术与人才战略升级场景深度结合,并基于画像和Bot(智能对话机器人),形成AI咨询、 AI招聘和AI产业三大支柱产品线,为企业和政府提供智能数字化决策解决方案。 e成科技始终秉持“打造人与任务新型连接平台” 的愿景,将“科技驱动人才升级” 作为自身使命不懈奋斗。

工程程序员数据挖掘
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

信息抽取技术

信息/数据抽取是指从非结构化或半结构化文档中提取结构化信息的技术。信息抽取有两部分:命名实体识别(目标是识别和分类真实世界里的知名实体)和关系提取(目标是提取实体之间的语义关系)。概率模型/分类器可以帮助实现这些任务。

推荐文章
暂无评论
暂无评论~