Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

大数据文摘转载

清华2018顶级数据团队建设全景报告发布:Python最受欢迎,C语言含金量最高

大数据和人工智能正成为了这个时代的主题曲,与此同时,焦虑感也开始在行业中蔓延,从初创公司、行业巨头到从业者,都急切地想要跟上这股越来越热的浪潮。但在数据化转型的尝试中,很多企业却面临着数据团队建设目标不清晰、业务界限模糊、人才缺乏等问题。

我的公司是否需要独立的数据团队? 我该何时、怎么样建设自己的数据团队? 

2017 年 7 月,清华大学数据科学研究院联合《大数据文摘》发布了首份《顶级数据团队建设全景报告》。致力于盘点数据团队建设现状,回答数据团队发展中面临的问题,力求为行业内数据团队的组建和高校数据人才的培养提供指导性意见。

在之前的课题基础上,9 月 26 日,今年的《2018 顶级数据团队建设全景报告》(下称报告)在清华大学重磅发布。

本次《报告》将镜头拉近,对准 AI 转型浪潮中,数据团队的变革情况,以及数据从业者的自我建设:

在 AI 革命大潮下,数据团队需要做哪些准备?多数数据从业者的对自己的认知更偏向 AI 还是数据?AI 转型中他们如何发展自己,如何看待自己的技术责任?

调研囊括 110,000+条海内外网络数据分析、1,000+份调查问卷内容,和 8 位海内外业界大咖深度访谈内容,从数据团队本身、技术从业者和高校三个方向,给出了一幅顶级数据团队建设图景。

以下为《报告》部分要点。

人工智能大背景下的数据团队建设

人工智能正在成为时代重要议题,也对数据团队建设产生了重要影响。部分数据团队也已经承担或者计划开展人工智能相关工作。

据调研问卷结果显示,人工智能技术已经成为一半以上数据从业者所在机构的战略性议题。八成以上从业者考虑在未来工作中更频繁使用人工智能相关技术。

人工智能项目实施上,18% 的机构直接由原有数据团队实施,14% 的机构为数据团队转型的 AI 团队实施,22% 的机构新建 AI 团队实施项目,10% 的机构将这一工作外包出去。

Python 为数据从业者使用最多的数据分析工具,但 C、C++、JS 含金量最高

根据数据相关职位描述中要求的编程语言信息以及相对应的薪资水平,我们计算出了每种编程语言的「技能含金量指数」。

从数据分析结果来看,Python 可以说是数据从业者中最受欢迎的编程语言,问卷调研的受访者中,超过 7 成在工作中需要使用 Python。

但大量的使用者也拉低了该语言的含金量。相反,使用人数占比相对较少的 C、C++ 和 JavaScript 在市场上更具薪资竞争力。

多数数据从业者愿意承担相关技术责任,监管机构和团队管理者更应该对技术后果负责

数据从业者是否应该在技术之外分出心力,了解技术背后更深的影响呢?这一在战争年代常引发巨大争议的话题,在数据安全和人工智能威胁日渐严重的今天,又被重新提上辩论场。

针对「开发者是否应该考虑代码的道德性?」,「如果需要为不正当的用途写代码,你会写吗?」两个问题,多数从业者选择为自己的技术/代码结果负责。

开发人员或可以成为抵御不道德代码和数据安全的最后一道防线。

在我们的问卷反馈中,针对「你认为谁应该为使用大数据人工智能技术带来的道德问题承担主要责任」这一问题,36% 的受访者选择了政府/监管机构,30% 选择了管理者、19% 选择了技术人员。

在 2018 年 Stack Overflow 针对同一问题的全球调研中,近半数开发人员认为,机器学习人工智能算法背后的创造者和技术人员最应该对人工智能所带来的社会问题负责。

Stack Overflow 相关调研 :https://insights.stackoverflow.com/survey/2018/#overview

相比国际从业者普遍观点,中国数据团队从业者在「技术责任」这一问题上更强调监管机构和团队管理者的责任。

高校传授技能与市场需求匹配存在偏差:高校注重基础学科,市场更看重实操技能

通过对比国内高校传授技能和公司技能需求,我们发现高校课程设计十分重视包括计算机系统、数据结构、高等数学等基础课程,而这些基础学科能力并不常出现在市场招聘需求中。

而,市场招聘需求中更多地提到了项目管理、产品设计与管理在内的实操技能,这些技能在高校课程中并不常见。

点击阅读原文,下载报告精华版(22页)。

产业清华大学大数据PythonC语言
2
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

推荐文章
暂无评论
暂无评论~