[ 导读 ]由清华大学数据科学研究院、网易新闻、网易有道联合举办的“创新,无界——中国AI创新者论坛”于3月21日下午在清华大学举办。清华大学社科学院社会学系副教授何晓斌做了《AI背景下的文科人才培养》主题报告。
何晓斌提到目前我国人工智能人才培养与美国相比还是远远落后的。无论是在高校研究者的数量上还是研究成果上,都有较大的差距。比如在全球人工智能研究排名前20的高校中的顶级学者数量进行比较,美国占68%,中国占24%;而人工智能人才的从业人数美国也是中国的近两倍。
何晓斌表示我国人工智能尚未成为独立专业,大部分高校未形成人工智能交叉学科的人才培养,校企合作力度也不够。“从整个情况看,在目前AI人才需求方面,在合作培养方面,确实存在一个很大的空缺、短板。”何晓斌认为。
何晓斌注意到斯坦福大学计算机系李飞飞教授和前教务长John Etchemendy教授主导成立了的“HAI”(Stanford Human-Centered AI Institute):斯坦福以人为本的人工智能研究院。该研究院认为AI的最终目的应该是增强人性,而不是减少或取代它;AI需要融入人类智慧的多样性、差异性和深度。该研究院的宗旨是推动人工智能的研究、教育、政策和实践,以造福全人类。
对于未来人才培养,何晓斌认为未来人才培养必然是大数据、AI和人文社会科学领域的结合。
因此,何晓斌倡议在未来人才培养中,应该:
加强人文社科和AI领域的教师的研究和教学合作;
加强校企合作,校企合作项目加入培养项目当中,开发合适工具;
加强校内不同专业人才的联合培养;
建设大数据和人工智能学习分享平台,建立项目和数据库。
以下为清华大学社科学院社会学系副教授何晓斌演讲实录:
非常高兴有机会跟大家分享一下作为一线教育者在AI人才培养方面的一些心得体会。我也是参加韩院长的数据科学研究院的基础课程,大数据分析课程的主讲老师之一,过去3年一直从事相关方面的教学工作。
今天的分享不会像谢老师分享那么高屋建瓴、系统深入。我主要结合自己的工作,分享一些体会,也可能是比较粗浅的体会,我也是昨天下午才接到分享的通知,讲的不对的地方还请大家多批评指正。
先看一下目前中国人工智能培养的现状,跟美国对比,能够非常明显看到,虽然全世界很缺人才,不管美国还是中国,但是在人才供给方面,跟美国相比,我们还是远远落后的,不管是在高校研究者数量、硕博生的培养数量上。在开设相关人工智能方向的全球368所高校当中,美国有168所(占46%左右),我国只有21所。在人工智能领域前20所顶级高校当中,美国占14所,中国只占了4所。从这里可以看到,科研机构有比较悬殊的差距。
第二,顶级学者数量,20所顶级高校当中,美国占到68%,中国占24%,我们都知道人工智能领域中国、美国在全世界领先。但是在学术的积累方面,我们跟美国还是有比较大的差距。
从业人员来看,中国相关从业人员39000多人,美国78000多人,从数量上比较,美国是我们的近2倍。相关从业人员热点的领域,美国在自然语言处理、处理器、机器学习与应用,智能无人机、计算机视觉与图像方面,从业人员明显超过中国的;中国在自动驾驶、语音识别、智能机器人、技术平台上面是超过美国的。
如果把从业人员人才分3个类型:大数据AI的基础层,跟技术层、应用层方面,从业人员总体数量上,美国明显超过中国。但从三个方面人才比例上可以明显看到,中国在应用层的人才比例是要大于技术层和基础层的。而美国在技术层跟基础层加起来超过应用人才。美国整个AI人才的梯队是非常均衡的。
国内培养人工智能人才的缺口是很大的,有各种研究的报告,大家也能听到和看到。基本的结论是独立的人工智能的专业是没有的,大数据科学是有的。大数据科学是3年前北京大学开始就开设了本科的专业。目前在中国的高校当中,人工智能是没有成为独立专业的,也没有形成人工智能交叉的人才培养的系统的项目,清华数据科学院5年前就开始尝试了。
但是从从全国范围来看,从整合的角度来讲,全国高校还是很不成熟的。但是清华的理念还是做得比较好的,像数据科学研究院“融”的理念,不光是校内不同专业的老师之间需要合作;学校跟业界,还有政府部门也需要交流合作目前全国高校这些方面的力度远远不够。
整个情况看,在目前AI人才需求方面,在合作培养方面,确实是存在一个很大的空缺、短板。
我关注到斯坦福大学最近在人工智能方面的动向,人工智能上世纪60年代斯坦福大学计算机教授约翰·麦卡锡提出的一个概念。我本人也是在斯坦福大学社会学系取得的博士学位,我在斯坦福待了7年,对学校培养环境和学术环境有所感悟。斯坦福的人才培养特点是特别强调交叉融合、整合。去年媒体没怎么宣传,最近才看一些朋友发消息,18年10月份的时候,斯坦福大学的教授李飞飞,也是人工智能的标志性人物跟斯坦福前教务长John Etchemendy专门成立了叫HAI,以人为本的人工智能研究院。
谢老师和韩院长也提到一些理念,AI这么多年很热闹,基本上是工程师、技术人员,我们叫科学家的舞台。但目前发展到一定阶段,就会越来越多的对“科技到底是用来做什么”这个问题作出思考。谢老师也提出了很好的问题。在斯坦福研究院刚开始发布的宣言当中,引领性的提出了AI未来发展,对培养人才方面有非常大的启发作用。该研究院的宗旨是推动人工智能的研究、教育、政策和实践,造福全人类。核心就一句话“以人为本”。所以这个机构想到,不管大数据、AI,其他先进的科技,最后是为了创造人类福祉的。它也讲到了很多的方向,都是比较大的方向。并不是所有从事人工智能领域工作的人都会想得那么远。
我上学期也是参与了百度的企业社会责任的项目,跟一些AI工程师讨论的时候,工程师从来不想这些问题,或者没有时间想这些问题。但是作为人文社会科学的研究者,其实我们很早就关注这个问题。科技和社会的互构和相互影响一直都有人文社会科学家在研究。
总体来讲,是以人为本,AI的发展应该是为了能够更好的增加人类福祉,为了更好的增强人性,而不是取代它,其次是允许社会的多样性和差异性和深度。AI是全社会的事情,不单单是工程师、科学家的事情,应该是多代人努力的事情。它把这个讲得很大,整个是生态,所以需要全社会的人都来参与。跟教育相关的,这个研究院旨在“教育和培训学术界、工业界、政府和公民社会的AI领导者”。
对于清华大学在人工智能领域未来的发展,这个机构在这方面应该是很有参考价值的。因此,人工智能领域的发展和培养是个大工程。这个研究机构把斯坦福61位不同专业背景的研究者结合在这个研究院的时候,就是为了应对人工智能这个挺复杂的事情,因为它涉及到伦理、法律,涉及到社会未来。人工智能创建出来以后,未来应该如何更好为人类服务,长期人类的和谐、减少不平等,增加人性这些方面应该得到全社会的重视。
因此,回到今天我演讲的主题,AI人才的培养。我认为AI未来,AI未来必然是人文社会科学与大数据、人工智能相关专业技术人才的结合。这个方向很多人应该也会认识到,特别在人文社会科学领域、法律界的人士都是在思考。问题是未来到底怎么做?其实很重要的一个方面,像今天这样的这种会议,各行各业人坐下来,大家真诚的交流,提出问题,来解决这些问题。当然人文社会科学家是善于提出问题,不善于解决问题,解决问题更多是靠工业界的朋友,或者说在政府的政策制定、执行相关部门的朋友。
上面是我的一些粗浅思考。目前我在参与的,我们社会科学院在做的事情,建立一些供大家学习交流的平台(清华大学计算社会科学平台),大家都知道大数据、人工智能这个东西很热,也很有用。很多时候,特别是对于文科的人才,却不知道怎么用的。所以我在近3年来一直参与清华大学数据科学研究院大数据分析基础课程的讲授,基本是为人文社会科学、经济管理类的学生开设的,这个课程三年前刚开始的时候是42人,到现在每年150人,已经培养520多人。
给我非常大的启发是,学科的交融在清华的平台非常有效果。5个人组成的项目小组,必须有文科和理科的背景,他们会有一定的分工。这是我们开设的课程,课程也是多学科背景老师来讲的,计算机系老师、社会学系的老师、政治学系、经管学院的老师,涉及到最前沿的人工数据挖掘、文本分析的内容。课程需要做项目的报告。
课程的宗旨是能够多学科交叉。这么多年发现确实真正能用大数据作出一些有意思的项目。我自己一直做社会科学领域的量化研究,在统计学方面花了很多的功夫学习。但是大部分文科学生的优势是读了很多书,有很多理论,想法,弱点是他们不太清楚怎么样用数据验证这些理论,或者他们找不到数据,或者不知道哪儿找数据。理工类同学的优势是抓数据厉害,工程类学生编程学得快,他们的弱点是没有想法,这个数据结果出来他不知道背后是什么逻辑,同样的数据结果出来背后的人的动机是什么,这个需要由人文社会科学背景的人来帮助解释。我做量化研究这个体会是非常深的,数据本身不会说话,这时候需要人文社会科学背景的人来提供一个方向、解释的机制。