杜玮 董鲁皖龙作者中国教育报来源

做计算机学科的国际领跑者 ——清华大学11次获国际性大学生超算竞赛冠军的背后

本文由机器之心经授权转载自中国教育报,未经授权禁止二次转载。

当地时间11月15日下午,美国得克萨斯州达拉斯市。

2018国际大学生超级计算机竞赛颁奖现场,当组委会主席约翰·卡泽宣布,来自中国的清华大学超算团队夺冠时,团队成员们——来自清华不同年级的6名本科生激动欢呼,48小时,清华赢了。

至此,清华大学包揽了今年世界三大超算竞赛冠军,实现了继2015年后又一次“大满贯”。清华超算团队在三大国际性大学生超算竞赛中累计获11项冠军

今年10月底,在《美国新闻与世界报道》(US News)发布的2019世界大学计算机学科排名中,清华大学成功蝉联,再居首位

两夺高性能计算研究领域国际最高奖戈登·贝尔奖,打破该奖项设置29年来无国人获奖的空白;上世纪80年代起布局人工智能研究,研究成果大放异彩;人才培养抓主干课程、重基础、强实践;人事制度改革将教师分系列管理,激活动力……近日,记者采访了清华大学计算机系,探求该校11次获国际性大学生超算竞赛冠军背后的“独门秘籍”

当地时间11月15日下午,2018国际大学生超级计算机竞赛在美国达拉斯举行颁奖,来自中国清华大学的6名本科生与指导老师一起登上冠军领奖台。

找准方向 重回领跑席

成立60年,清华计算机系战果辉煌:晶体管、电子管、集成电路……这些课本当中常见的语汇都曾是该系叱咤风云、笑傲江湖的“绝学”。过去近10年,清华计算机学科更是取得了质的飞跃。

但一度,学科的发展也陷入迷茫,甚至被外人评价“除了计算机不搞,啥都搞”。

2010年,清华大学组织对计算机学科开展首次国际评估,评估委员会给出的评价是:“清华大学要在国际上力争达到顶级水准,必须有世界一流的计算机学科,并具有在该学科某些领域内成为国际领导者的抱负。

这一年,计算机系教授吴建平刚担任系主任,他也在思考:系里研究方向10多个,做什么的都有,但重点不突出,到底该在哪些方向领跑?

经讨论,系里公认:计算机系不做计算机不行,不做计算机系统不行。“这是建系之本”。

吴建平教授

于是,传统优势项目高性能计算机系统被高度关注,人工智能、下一代互联网也被系里列为另两个重点努力的目标

但手头没有高性能计算机系统的大项目,让不少教师信心不足。

大数据时代来临,国之重器应运而生。2010年以来,“天河一号”“天河二号”“神威·太湖之光”等超级计算机的惊艳亮相,刷新着人们的想象力,也让清华计算机系看到了机遇。

凭借多年积淀,计算机系主动出击,开始运营当时全球运行速度最快的“神威·太湖之光”超级计算机。“通过合作,把我们的优势发挥出来。”吴建平说,“全球最快计算机你都不摸,你怎么去赶上别人?”

这算完成了第一步。紧接着,要在这个“大块头”上做通用应用软件。

几年不懈努力。2016年,依托“神威·太湖之光”超级计算机,以清华计算机系为中坚力量的研究团队,完成了国际上首次用超过千万核对气候高速度、高精度的数值模拟,将戈登·贝尔奖收入囊中,实现该奖项29年来中国首次获奖;2017年,清华计算机系又基于数据压缩、异构任务划分等一系列创新,在国际上首次实现对唐山大地震的高分辨率模拟,再次斩获戈登·贝尔奖。

2016年戈登·贝尔奖领奖现场,左起:清华大学计算机系博士生王欣亮、计算机系博士后甘霖、地球系统科学研究中心副教授付昊桓

高性能计算机系统重回国际第一方阵,其他研究方向也开出绚烂之花。

“月明清影里,露冷绿樽前。赖有佳人意,依然似故年。”去年12月,一款名为“九歌”的写诗机器人在电视节目中“机智过人”,凭借对30万首诗歌的深度学习,通过两轮人类测试,圈粉无数。而在另一档益智问答节目中,名为“汪仔”的机器人也“碾压”了多名选手。这些“黑科技”都与清华大学计算机系有着密切关联,而在人工智能领域,清华已深耕40载。

“改革开放初期,(我们)看了很多英文材料,发现所有美国大学计算机系都有人工智能方向,我们决定‘先结婚,后恋爱’。”中国科学院院士、清华大学人工智能研究院院长张钹回忆说,之后,在上世纪80年代,清华计算机系成立了国内首个智能机器人实验室,发表了国内第一篇人工智能领域论文,在国内首获人工智能领域第一个国际重要奖项。上世纪90年代,又成立全国第一个与人工智能有关的国家重点实验室——“智能技术与系统”国家重点实验室。如今,清华人工智能的研究方向包括数据驱动与知识驱动相结合的深度学习,与脑科学结合的交叉学科的探索……

张钹院士

而历经10余年,下一代互联网也取得了快速发展:从IPv4到IPv6,再到下一代更大规模、更快、更安全的互联网平台……

回望当初的“小目标”,吴建平有些“小自豪”:“方向完全正确,成果可圈可点。”


把握本源 锻造好学生

在清华计算机系,如果要问教师“科研为什么会这么牛”,不少人回答:“学生牛。”

这里,会聚了来自全国各地的“学霸”,但有了好的原材料,如何加工出优质的人才“产品”?身处人工智能大数据物联网云计算区块链等新技术层出不穷的时代,又该培养怎样的学科人才?

“既适应时代,又不能完全随它跑。”吴建平说。在他看来,学生培养过程中,“计算机科学本质的东西必须牢牢掌握”,“知道以后,可以去适应各种新的思维,如果本质不知道的话,你连基本的判别能力都没有”。

保证本源性的东西在培养体系里突出,是清华计算机系近年来本科生培养的着力点和焦点。

而往往,本源性的课程还包含着清华培养学生的一大传统特点——强调动手能力

计算机系同学讨论

“奋战三星期,做台计算机”,曾是清华大学生超算团队冠军成员,如今已读研的王邈,一直对“计算机组成原理”课的课程实验念念不忘,这也是近年来系里推动课程改革的得意之作。学生要在三星期里,做出计算机的中央处理器和部分外设,使之能够运行操作系统,实验要综合运用数字电路、软件工程等多方面知识,颇具挑战度,但可以“把计算机工作的本源搞清楚”。

这学期,吴建平又放出一个让学生们压力山大的“大招”:“网络原理”课做路由器。一个月左右,完成路由器,并且全班联成局域网。“不做路由器,根本不懂互联网原理,就会被社会上五花八门的概念左右,学生就没有定力,跟着时髦跑。”吴建平说。

2018超算竞赛现场的清华计算机系团队

重基础、强实践是计算机系人才培养的特色,而实践的底色不只停留在第一课堂,也延伸到了课外

超算比赛即是一例。参赛过程中,学生要经历从赛前挑选机器型号,到组装、调试机器,再到赛场跑程序的全链条历练,从中真正学会分析问题、系统完整地解决问题。

写诗机器人“九歌”,是清华计算机系学生矣晓沅在读研期间完成的科创项目。而事实上,早在大二下学期,他就有机会进入导师孙茂松教授的课题组,利用人工智能对诗人的用词习惯等定量分析,完成了初版的集句诗系统。

在计算机系,大学生研究训练计划(SRT)、学术新星计划等一系列活动的开展,都能让学生尽早接触到科研,培养学术志趣

读本科期间,如果学生能有高质量论文发表,还有机会出国参加“高大上”的国际学术会议,费用由学校统筹支出。国际交流上,清华计算机系还与美国斯坦福大学、麻省理工学院等世界一流高校建立学生深度交流项目,设立学生交流专项资金,有多种交流形式,每年出国访问、短期交流和联合培养的学生达300人次以上。


改革人事 激发教师内在力

无论是教学还是科研,教师都是关键。建设世界一流的大学与学科,更离不开一流师资。如何吸引大师来,又如何激发教师的内在动力?

(评价体系)要和国际接轨。”吴建平说,教师队伍要有具备国际视野和国际可比性的人才

计算机系教授史元春曾在2000年左右到美国麻省理工学院做访问学者,她发现,国内外的教师体系有着很大不同,“在美国,大学叫学术共同体,非常清楚哪些人是学术的主导”。

史元春教授

参照国际惯例,2012年起,清华正式全面推进教师人事制度改革,按照“学校定边界,院系定方案”的原则,2014年,计算机系的改革也正式启动。

改革的重磅举措,就是将教师分为三个系列:既精于国际前沿研究又能教学的教研系列;偏重于国内重大需求、应用工程,能带团队的研究系列;专职基础教学的教学系列。

改革一铺开,意味着全系100多名教师要“全部卧倒,重新排队”。同时,对于新引进和晋升的教师,还将进行国际评估。

“国际评估一定是让在国际排名前30名的学校担任正教授的学者去评价候选人的情况,然后给他打分,他够不够资格,在同龄人里面属于3%还是5%,在全球范围属于3%还是5%。如果进入你们的学校,够不够格。”吴建平说。

“把原有的体系打破,新造一个体系,代价是非常大的。”史元春说,“但对学校更进一步的发展是奠基性、制度性的保障,每个教师要知道自己做什么,什么是做一个好教师的标准,奋斗目标是什么。”

历时两年,清华计算机系完成了原有教师队伍向新体系的过渡,2017年起开始正常进行新体系教师的职称晋升和人才引进工作。


孙茂松教授

在孙茂松看来,制度是一方面,激发人才活力的,还有清华的文化和氛围,“要么不做,要么就做第一”

“大家都很优秀,我压力就很大,3个月不看新的东西,博士生说的东西我就听不懂。”今年已经83岁的张钹院士笑着说,“在精英的集体中成长,迫使你必须变成精英。”

在清华读完博士,在人工智能领域知名学府——美国卡内基·梅隆大学完成博士后研究工作后,2011年,朱军选择回清华任教。除了国内良好的发展态势和环境之外,吸引他的还有导师张钹团队对科研规律的尊重、宽松自由的氛围。“给你充分支持,让你主动去探索。”朱军说。

张钹院士与学生讨论

吴建平认为,计算机系的成长与发展同国家战略、需求共振,与改革开放的大潮密不可分。而清华教师又有着较强的社会责任感和国家使命感,能设定更高目标,奋力往前冲。

在一些世界大学排名榜单中,清华计算机学科评估占据“C位”。而面向瞬息万变、新技术快速迭代的未来,清华计算机系将继续按照学校“十三五”学科建设规划,实现到2020年,在世界各大学科排名中位居前20名左右的发展目标,产生若干具有国际重大影响的学术成果和解决国家重大战略需求的科技成果。

做计算机学科的国际领跑者,清华稳步前行。

本文由机器之心经授权转载自中国教育报,未经授权禁止二次转载。

原文链接:http://m.jyb.cn/zgjyb/201811/t20181119_1264535_wap.html?from=timeline&isappinstalled=0

产业竞赛计算机科学
相关数据
朱军人物

朱军,清华大学计算机系长聘副教授、卡内基梅隆大学兼职教授。2001 到 2009 年获清华大学计算机学士和博士学位,之后在卡内基梅隆大学做博士后,2011 年回清华任教。主要从事人工智能基础理论、高效算法及相关应用研究,在国际重要期刊与会议发表学术论文百余篇。担任人工智能顶级杂志 IEEE TPAMI 和 AI 的编委、《自动化学报》编委,担任机器学习国际大会 ICML2014 地区联合主席, ICML (2014-2018)、NIPS (2013, 2015, 2018)、UAI (2014-2018)、IJCAI(2015,2017)、AAAI(2016-2018)等国际会议的领域主席。获 CCF 自然科学一等奖、CCF 青年科学家奖、国家优秀青年基金、中创软件人才奖、北京市优秀青年人才奖等,入选国家「万人计划」青年拔尖人才、MIT TR35 中国区先锋者、IEEE Intelligent Systems 杂志评选的「AI's 10 to Watch」(人工智能青年十杰)、及清华大学 221 基础研究人才计划。

区块链技术

区块链是用分布式数据库识别、传播和记载信息的智能化对等网络, 也称为价值互联网。 中本聪在2008年,于《比特币白皮书》中提出“区块链”概念,并在2009年创立了比特币社会网络,开发出第一个区块,即“创世区块”。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

数据压缩技术

数据压缩是指在不丢失有用信息的前提下,缩减数据量以减少存储空间,提高其传输、存储和处理效率,或按照一定的算法对数据进行重新组织,减少数据的冗余和存储的空间的一种技术方法。数据压缩包括有损压缩和无损压缩。在计算机科学和信息论中,数据压缩或者源编码是按照特定的编码机制用比未经编码少的数据位元(或者其它信息相关的单位)表示信息的过程。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

推荐文章
暂无评论
暂无评论~