何晓斌作者

清华大学何晓斌:未来人才培养是大数据、AI和人文社会科学的结合

[ 导读 ]由清华大学数据科学研究院、网易新闻、网易有道联合举办的“创新,无界——中国AI创新者论坛”于3月21日下午在清华大学举办。清华大学社科学院社会学系副教授何晓斌做了《AI背景下的文科人才培养》主题报告。

何晓斌提到目前我国人工智能人才培养与美国相比还是远远落后的。无论是在高校研究者的数量上还是研究成果上,都有较大的差距。比如在全球人工智能研究排名前20的高校中的顶级学者数量进行比较,美国占68%,中国占24%;而人工智能人才的从业人数美国也是中国的近两倍。

何晓斌表示我国人工智能尚未成为独立专业,大部分高校未形成人工智能交叉学科的人才培养,校企合作力度也不够。“从整个情况看,在目前AI人才需求方面,在合作培养方面,确实存在一个很大的空缺、短板。”何晓斌认为。

何晓斌注意到斯坦福大学计算机系李飞飞教授和前教务长John Etchemendy教授主导成立了的“HAI”(Stanford Human-Centered AI Institute):斯坦福以人为本的人工智能研究院。该研究院认为AI的最终目的应该是增强人性,而不是减少或取代它;AI需要融入人类智慧的多样性、差异性和深度。该研究院的宗旨是推动人工智能的研究、教育、政策和实践,以造福全人类。

对于未来人才培养,何晓斌认为未来人才培养必然是大数据、AI和人文社会科学领域的结合。

因此,何晓斌倡议在未来人才培养中,应该:

  • 加强人文社科和AI领域的教师的研究和教学合作;

  • 加强校企合作,校企合作项目加入培养项目当中,开发合适工具;

  • 加强校内不同专业人才的联合培养;

  • 建设大数据人工智能学习分享平台,建立项目和数据库

以下为清华大学社科学院社会学系副教授何晓斌演讲实录:

非常高兴有机会跟大家分享一下作为一线教育者在AI人才培养方面的一些心得体会。我也是参加韩院长的数据科学研究院的基础课程,大数据分析课程的主讲老师之一,过去3年一直从事相关方面的教学工作。

今天的分享不会像谢老师分享那么高屋建瓴、系统深入。我主要结合自己的工作,分享一些体会,也可能是比较粗浅的体会,我也是昨天下午才接到分享的通知,讲的不对的地方还请大家多批评指正。

先看一下目前中国人工智能培养的现状,跟美国对比,能够非常明显看到,虽然全世界很缺人才,不管美国还是中国,但是在人才供给方面,跟美国相比,我们还是远远落后的,不管是在高校研究者数量、硕博生的培养数量上。在开设相关人工智能方向的全球368所高校当中,美国有168所(占46%左右),我国只有21所。在人工智能领域前20所顶级高校当中,美国占14所,中国只占了4所。从这里可以看到,科研机构有比较悬殊的差距。

第二,顶级学者数量,20所顶级高校当中,美国占到68%,中国占24%,我们都知道人工智能领域中国、美国在全世界领先。但是在学术的积累方面,我们跟美国还是有比较大的差距。

从业人员来看,中国相关从业人员39000多人,美国78000多人,从数量上比较,美国是我们的近2倍。相关从业人员热点的领域,美国在自然语言处理、处理器、机器学习与应用,智能无人机计算机视觉与图像方面,从业人员明显超过中国的;中国在自动驾驶语音识别、智能机器人、技术平台上面是超过美国的。

如果把从业人员人才分3个类型:大数据AI的基础层,跟技术层、应用层方面,从业人员总体数量上,美国明显超过中国。但从三个方面人才比例上可以明显看到,中国在应用层的人才比例是要大于技术层和基础层的。而美国在技术层跟基础层加起来超过应用人才。美国整个AI人才的梯队是非常均衡的。

国内培养人工智能人才的缺口是很大的,有各种研究的报告,大家也能听到和看到。基本的结论是独立的人工智能的专业是没有的,大数据科学是有的。大数据科学是3年前北京大学开始就开设了本科的专业。目前在中国的高校当中,人工智能是没有成为独立专业的,也没有形成人工智能交叉的人才培养的系统的项目,清华数据科学院5年前就开始尝试了。

但是从从全国范围来看,从整合的角度来讲,全国高校还是很不成熟的。但是清华的理念还是做得比较好的,像数据科学研究院“融”的理念,不光是校内不同专业的老师之间需要合作;学校跟业界,还有政府部门也需要交流合作目前全国高校这些方面的力度远远不够。

整个情况看,在目前AI人才需求方面,在合作培养方面,确实是存在一个很大的空缺、短板。

我关注到斯坦福大学最近在人工智能方面的动向,人工智能上世纪60年代斯坦福大学计算机教授约翰·麦卡锡提出的一个概念。我本人也是在斯坦福大学社会学系取得的博士学位,我在斯坦福待了7年,对学校培养环境和学术环境有所感悟。斯坦福的人才培养特点是特别强调交叉融合、整合。去年媒体没怎么宣传,最近才看一些朋友发消息,18年10月份的时候,斯坦福大学的教授李飞飞,也是人工智能的标志性人物跟斯坦福前教务长John Etchemendy专门成立了叫HAI,以人为本的人工智能研究院。

谢老师和韩院长也提到一些理念,AI这么多年很热闹,基本上是工程师、技术人员,我们叫科学家的舞台。但目前发展到一定阶段,就会越来越多的对“科技到底是用来做什么”这个问题作出思考。谢老师也提出了很好的问题。在斯坦福研究院刚开始发布的宣言当中,引领性的提出了AI未来发展,对培养人才方面有非常大的启发作用。该研究院的宗旨是推动人工智能的研究、教育、政策和实践,造福全人类。核心就一句话“以人为本”。所以这个机构想到,不管大数据、AI,其他先进的科技,最后是为了创造人类福祉的。它也讲到了很多的方向,都是比较大的方向。并不是所有从事人工智能领域工作的人都会想得那么远。

我上学期也是参与了百度的企业社会责任的项目,跟一些AI工程师讨论的时候,工程师从来不想这些问题,或者没有时间想这些问题。但是作为人文社会科学的研究者,其实我们很早就关注这个问题。科技和社会的互构和相互影响一直都有人文社会科学家在研究。

总体来讲,是以人为本,AI的发展应该是为了能够更好的增加人类福祉,为了更好的增强人性,而不是取代它,其次是允许社会的多样性和差异性和深度。AI是全社会的事情,不单单是工程师、科学家的事情,应该是多代人努力的事情。它把这个讲得很大,整个是生态,所以需要全社会的人都来参与。跟教育相关的,这个研究院旨在“教育和培训学术界、工业界、政府和公民社会的AI领导者”。

对于清华大学在人工智能领域未来的发展,这个机构在这方面应该是很有参考价值的。因此,人工智能领域的发展和培养是个大工程。这个研究机构把斯坦福61位不同专业背景的研究者结合在这个研究院的时候,就是为了应对人工智能这个挺复杂的事情,因为它涉及到伦理、法律,涉及到社会未来。人工智能创建出来以后,未来应该如何更好为人类服务,长期人类的和谐、减少不平等,增加人性这些方面应该得到全社会的重视。

因此,回到今天我演讲的主题,AI人才的培养。我认为AI未来,AI未来必然是人文社会科学与大数据人工智能相关专业技术人才的结合。这个方向很多人应该也会认识到,特别在人文社会科学领域、法律界的人士都是在思考。问题是未来到底怎么做?其实很重要的一个方面,像今天这样的这种会议,各行各业人坐下来,大家真诚的交流,提出问题,来解决这些问题。当然人文社会科学家是善于提出问题,不善于解决问题,解决问题更多是靠工业界的朋友,或者说在政府的政策制定、执行相关部门的朋友。

上面是我的一些粗浅思考。目前我在参与的,我们社会科学院在做的事情,建立一些供大家学习交流的平台(清华大学计算社会科学平台),大家都知道大数据人工智能这个东西很热,也很有用。很多时候,特别是对于文科的人才,却不知道怎么用的。所以我在近3年来一直参与清华大学数据科学研究院大数据分析基础课程的讲授,基本是为人文社会科学、经济管理类的学生开设的,这个课程三年前刚开始的时候是42人,到现在每年150人,已经培养520多人。

给我非常大的启发是,学科的交融在清华的平台非常有效果。5个人组成的项目小组,必须有文科和理科的背景,他们会有一定的分工。这是我们开设的课程,课程也是多学科背景老师来讲的,计算机系老师、社会学系的老师、政治学系、经管学院的老师,涉及到最前沿的人工数据挖掘文本分析的内容。课程需要做项目的报告。

课程的宗旨是能够多学科交叉。这么多年发现确实真正能用大数据作出一些有意思的项目。我自己一直做社会科学领域的量化研究,在统计学方面花了很多的功夫学习。但是大部分文科学生的优势是读了很多书,有很多理论,想法,弱点是他们不太清楚怎么样用数据验证这些理论,或者他们找不到数据,或者不知道哪儿找数据。理工类同学的优势是抓数据厉害,工程类学生编程学得快,他们的弱点是没有想法,这个数据结果出来他不知道背后是什么逻辑,同样的数据结果出来背后的人的动机是什么,这个需要由人文社会科学背景的人来帮助解释。我做量化研究这个体会是非常深的,数据本身不会说话,这时候需要人文社会科学背景的人来提供一个方向、解释的机制。

THU数据派
THU数据派

THU数据派"基于清华,放眼世界",以扎实的理工功底闯荡“数据江湖”。发布全球大数据资讯,定期组织线下活动,分享前沿产业动态。了解清华大数据,敬请关注姐妹号“数据派THU”。

产业大数据何晓斌清华大学
相关数据
网易机构

网易成立于1997年6月24日,是中国领先的互联网技术公司,为用户提供免费邮箱、游戏、搜索引擎服务,开设新闻、娱乐、体育等30多个内容频道,及博客、视频、论坛等互动交流,网聚人的力量。

https://www.163.com/
李飞飞人物

李飞飞,斯坦福大学计算机科学系教授,斯坦福视觉实验室负责人,斯坦福大学人工智能实验室(SAIL)前负责人。专业领域是计算机视觉和认知神经科学。2016年11月李飞飞加入谷歌,担任谷歌云AI/ML首席科学家。2018年9月,返回斯坦福任教,现为谷歌云AI/ML顾问。10月20日斯坦福大学「以人为中心的AI计划」开启,李飞飞担任联合负责人。11月20日李飞飞不再担任SAIL负责人,Christopher Manning接任该职位。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

文本分析技术

文本分析是指对文本的表示及其特征项的选取;文本分析是文本挖掘、信息检索的一个基本问题,它把从文本中抽取出的特征词进行量化来表示文本信息。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

无人机技术

无人机(Uncrewed vehicle、Unmanned vehicle、Drone)或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

百度机构

百度(纳斯达克:BIDU),全球最大的中文搜索引擎、最大的中文网站。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术,于 2000年1月1日在中关村创建了百度公司。 “百度”二字,来自于八百年前南宋词人辛弃疾的一句词:众里寻他千百度。这句话描述了词人对理想的执着追求。 百度拥有数万名研发工程师,这是中国乃至全球最为优秀的技术团队。这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://home.baidu.com/
推荐文章
暂无评论
暂无评论~