清华计算机系超算团队以总分88398分取代麻省理工

105次浏览 已收录

  美国得克萨斯州达拉斯市,在2018国际大学生超级计算机竞赛(SC18)现场,当组委会主席约翰卡泽宣布中国清华大学超算团队夺冠时,团队成员们来自清华不同年级的6名本科生激动欢呼,48小时,清华赢了。他们以总分88.398分(满分100分)摘得总冠军,并取代麻省理工成为计算机专业最强的大学

  计算机和互联网如今渗透进我们生活的方方面面,以及新出现的云计算、大数据及人工智能都是基于计算机技术,由此可见计算机技术将在未来很长的时间内经久不衰。

  美国当地时间11月15日下午,美国得克萨斯州达拉斯市。在2018国际大学生超级计算机竞赛(SC18)现场,组委会主席约翰卡泽宣布,来自中国的清华大学超算团队夺冠时,团队成员们来自清华不同年级的6名本科生激动欢呼,48小时,清华赢了。

  这一次,清华计算机系超算团队以总分88.398分(满分100分)摘得总冠军,并取代麻省理工成为计算机专业最强的大学。

  全球超级计算大会(Supercomputing Conference,简称SC)是国际超算领域的顶级会议,国际影响力巨大。作为会议的重要组成部分,SC比赛是超级计算机领域的顶级赛事,每年举办一次,吸引着世界各国家和地区的众多高校参与。比赛旨在促进大学生与工业界之间的联系,推动世界各地区超算青年人才交流和培养,提升超算应用水平和研发能力。

  本次竞赛共有来自全球15所高校的本科大学生组队参赛。清华大学作为唯一一所内地高校参赛,与传统强队新加坡南洋理工大学和台湾新竹清华大学等传统强队激烈角逐。

  至此,在2018年三大国际大学生超算竞赛ASC、ISC和SC中,清华大学超算队伍包揽了全部三项竞赛的总冠军,实现了继2015年后的又一次“大满贯”。这也是清华大学超算队伍在此三大国际性大学生超算竞赛中累计获得的第11项冠军。

  清华大学计算机系成立于1958年,经过60年的不懈努力从零到全球第一,现有5名两院院士及7名长江学者。1974年清华大学设计、研制成功采用集成电路的DJS-130小型计算机,运算速度达每秒100万次,为我国超算打下基础,这无疑是一种飞跃式的发展。

  回顾比赛的过程,成员郑立言说,“我们要让一个程序不停地优化,让它跑得更快,还要降低功耗需求,我觉得这样的事情特别有趣。”

  “从进入清华就拜托班主任打听超算团队了。”大学刚入学,成员赵成钢就对超算团队产生了浓厚的兴趣,从参加组会、熟悉规则到做外围支援,从优化程序、操控机器到训练临场应变,一年多之后,刚刚上大学二年级的赵成钢就进阶为正式队员。

  “团队的选拔和培养主要以兴趣为主,我们其实是一个兴趣团队。”翟季冬介绍到,同学们在日常培训中会表现出不同的兴趣,比如纪平、欣健对硬件感兴趣,成钢、晨耀对程序优化和程序分析方面有很大的发挥空间,立言和家傲的英文表达非常好我们会在比赛中极力去发掘和培养他们的这些兴趣。

  在各司其职的比赛现场,互相照顾成为了这48小时中6个年轻人的日常状态。何家傲说,我们一起解决问题,是志同道合的朋友更是患难之交。

  “我们常说超算比赛就像F1赛事,是非常综合的一个比赛。不仅要拥有先进的硬件设备,同时还需要队员们对相关科学领域的应用有深刻的理解,在高性能计算方面有扎实的基本功,极佳的现场应对策略及语言表达能力等等。”指导教师韩文弢介绍到。

  超级计算(supercomputing),也称为高性能计算(high-performance computing),是研发超级计算机(supercomputer)及其软件和应用的领域。 编程是让计算机为解决某个问题而使用某种程序设计语言编写程序代码,并最终得到相应结果的过程。为了使计算机能够理解人的意图,人类就必须要将需解决的问题的思路、方法、和手段通过计算机能够理解的形式告诉计算机,使得计算机能够根据人的指令一步一步去工作,完成某种特定的任务。这种人和计算机之间交流的过程就是编程。 跑数据指编程后,为检验其是否有纰漏,代入各种情况,并将其输出结果与标准答案比对的过程。 NetCDF(network Common Data Form)网络通用数据格式是由美国大学大气研究协会(University Corporation for Atmospheric Research,UCAR)的Unidata项目科学家针对科学数据的特点开发的,是一种面向数组型并适于网络共享的数据的描述和编码标准。目前,NetCDF广泛应用于大气科学、水文、海洋学、环境模拟、地球物理等诸多领域。用户可以借助多种方式方便地管理和操作NetCDF 数据集。

  比赛要求参赛队伍在总功率3000瓦的限制条件下,自行搭建计算集群并在集群系统上进行6个应用程序的性能比拼。

  在48小时的竞赛中完成超算集群的性能基本测试HPL(直译为高性能线性系统软件包)和HPCG(直译为高性能共轭梯度),大规模机器学习,核裂变链式反应的稳态求解与模拟,论文复现特大地震模拟,现场公布的神秘应用等内容。

  同时还设置了采访、参会、海报设计等环节,成员需在比赛中向评委介绍自己优化的应用和正在进行的软件优化设计,还需要在48小时内完成一篇在国际权威杂志具有发表能力的英文论文。

  最让队员们忧心的神秘应用是WRF(The Weather Research and Forecasting Model)天气预报模式,是一道超算领域里面的经典应用题目。在当今世界,WRF主要应用于天气预报的预测,通常具有极大的数据量。

  “夸张一点说,如果使用本次比赛的集群要有将近一栋楼的倍数,才能跑完整个数据。”何家傲解释到,“所以我们要在48个小时之内对应用进行编译还要尽量跑更多的数据点,这是非常大的挑战。”

  在多次比赛的积累中,清华团队凭借对同类题目的了解,迅速跑完了第一个数据点。但由于题目编译的复杂程度超乎寻常,在比赛已经进行到差不多一半时间时,题目的第二个数据点的编译问题一直没有解决。

  凌晨4点,6个年轻人被紧张的气氛笼罩着。于纪平回忆“WRF三个数据点,输入数据均为NetCDF(network Common Data Form)网络通用数据格式,但是后两个数据使用了旧版的NetCDF文件格式。多次尝试之后,我们发现了问题所在,通过在编译过程中加入NetCDF对旧版格式的支持后修复了这个问题。”