会议纪要
2020年9月27日,第六届高性能计算中间件技术研讨会(HPCMid2020)在四川绵阳桃花岛酒店成功召开,并在本届研讨会为软件架构特别论坛,从计算机软件理论、高性能计算中间件、高性能CAE软件、装备数字孪生、复杂系统仿真五个层次,介绍不同层次软件架构的理论、方法与技术,探讨工业软件自主化面临的挑战与机遇。
研讨会简介
高性能计算中间件技术研讨会面向科学与工程计算数值模拟应用在当前及下一代超级计算机上面临的挑战,围绕高性能计算中间件关键技术,邀请国内外学者报告最新研究进展和探讨未来发展趋势。会议创办于2015年,每年固定在全国高性能计算学术年会前一天举行,已分别在无锡、西安、合肥、青岛、呼和浩特成功召开了五届。
研讨会概况
今年因防疫要求,本次会议采用线下(绵阳大会现场)受邀参会和线上视频直播参会模式。来自国防科大、中科院、华为、索为云网、国家超算天津中心等单位的近300余名院内外嘉宾参加了现场会议,1680余人参加了线上会议,创下了历届研讨会参会人数之最。
研讨会组委会成员莫则尧研究员(中国工程物理研究院)、张林波研究员(中国科学院数学与系统科学研究院)、曹小林研究员(中物院计算机应用研究所)、丁肇辉首席(华为技术有限公司)、金钟研究员(中科院计算机信息网络中心)、刘青凯研究员(北京应用物理与计算数学研究所、中物院高性能数值模拟软件中心)、田荣研究员(中物院高性能数值模拟软件中心)、王戟教授(国防科技大学)、徐小文研究员(北京应用物理与计算数学研究所)等出席了会议。
会议议程包括邀请报告和Panel主题讨论两个环节。
会议共安排了9个邀请报告,报告人均是国内从事高性能计算的顶级专家和知名学者,他们是:
王戟(国防科技大学,研究员)
丁肇辉(华为技术有限公司,计算产品线HPC首席技术专家)
刘奇(苏州同元软控信息技术有限公司,副总经理)
郑澎(中国工程物理研究院计算机应用研究所、中物院高性能数值模拟软件中心,研究员)
刘伟(金航数码科技有限责任公司、研发中心(平台)部部长)
田荣(中物院高性能数值模拟软件中心,研究员)
李义章(北京索为系统技术股份有限公司,董事长)
赵康(上海数巧信息科技有限公司,创始人/CEO)
徐小文(北京应用物理与计算数学研究所,研究员)
在Panel主题讨论环节,王戟、宋鹏、田荣、李义章、徐保文作为嘉宾,围绕软件架构、软件平台、中间件等,与参会人员进行了热烈讨论。
邀请报告
首先,研讨会主席莫则尧研究员做开幕致辞,介绍了本届研讨会的背景与主题。他希望参会同行能借助研讨会的平台,交流新进展、探讨新想法、踊跃提问,取得预期收获。随后,张林波研究员和徐小文研究员分别主持了上午的报告。
来自国防科技大学的王戟研究员通过线上平台做题为《面向HPC应用的软件工程》报告。在报告中回顾了过去12年高性能计算和软件工程的现状,围绕高性能计算对软件技术的挑战与进展,列举了领域化软件工程面向高性能计算应用需求的特点。他认为数据驱动的软件是高性能计算软件工程未来的发展方向,并在报告中分享了软件设计开发和正确性验证理论与方法的一些思考。
来自华为技术有限公司计算产品线HPC首席技术专家、HPC实验室主任丁肇辉做题为《HPC,Bigdata,AI融合时代下的集群调度中间件》报告。在报告中介绍了调度器过去30年的发展历程,介绍了当前高性能计算与AI、大数据技术融合的趋势给集群调度器研发带来的挑战。他指出目前开源的调度器面临如何监视作业I/O、如何快速处理节点故障、如何提升资源可用性、如何与云计算协同等长期以来的痛点,介绍华为自研Donau调度器的设计理念,对异构算力、多负载融合与集群规模扩大的应对方法,以及Donau调度器在不同场景下的应用。
来自苏州同元软控信息技术有限公司副总经理刘奇做题为《基于模型的复杂系统仿真验证平台开放架构》报告。在报告中探讨了基于模型的工业软件自动生成创新模式,并指出系统级建模仿真技术是工业软件创新发展的新途径。随后介绍了苏州同元系统级设计仿真平台NWorks及其在复杂工程系统研制中的应用,基于NWorks平台开放架构,可以汇聚高校、科研院所多年积累的软件模块,共建模型库的生态环境,加速中国工业软件的发展。
来自中国工程物理研究院计算机应用研究所、中物院高性能数值模拟软件中心的郑澎研究员做题为《高性能CAE软件的前后处理一体化研发平台》报告。她列举了前后处理一体化研发的四大屏障,介绍了前后处理一体化研发平台及设计思路,指出基于该平台,能不断沉淀共性前后处理方法,打通“前处理-计算-后处理”流程衔接瓶颈,解决“四个屏障”问题,实现对高性能CAE软件产品的快速定制。她还介绍了研发平台的应用情况,目前定制了面向武器物理、复杂电磁环境、工程力学等领域的高性能CAE软件产品,使软件产品的可用性大大提高。
来自金航数码科技有限责任公司的研发中心/平台部部长刘伟做题为《自主可控的工业软件开发平台》报告。他结合工业软件的发展现状,介绍了自主工业软件的发展思路、工业软件体系以及工业软件所需的技术平台。重点分享了航空工业自主可控的工业软件开发平台以及基于该平台进行研发的工业软件应用情况,并提出要面向企业数字化转型,构建基于三维的云架构自主工业软件体系,打造全新的工业软件生态系统,提供开放完备的工业软件社区。
下午的4个报告由刘青凯研究员主持。
来自中物院高性能数值模拟软件中心的田荣研究员做题为《“茉莉平台”——面向高性能CAE软件快速研发》报告。在报告中他介绍了我国重大装备与大型工业CAE软件自主化的研发背景,然后介绍了高性能CAE软件快速研发平台——“茉莉平台”,包括编程框架、离散中台、交互引擎三大部分以及各自的标准化开放编程接口组成。随后,他介绍了茉莉平台在结构、流体、电磁、传热、燃烧等6大类学科专业的一些应用,目前已有137款超算软件在聚变能源、航空发动机、水利水电等11个应用领域实现快速研发。
来自北京索为系统技术股份有限公司的李义章董事长做题为《工业软件发展框架与自主可控路径》的报告。系统地介绍了国内外工业软件发展路径和趋势,提出自主工业软件应聚焦于系统设计、工程开发、产品生命周期管理、工业APP四大领域。在报告中他指出中国的现状决定了无法重复国外工业软件的发展路径,应当先构建工业软件操作系统平台,再将国内、国外的软件集成到平台上,建立工业软件测评系统,再逐步发展壮大国内工业软件。
来自上海数巧信息科技有限公司的创始人兼CEO赵康做题为《Simright国产云端CAE》的报告。从CAE云化观察与Simright国产云端CAE两方面探讨国产CAE软件逐渐从单机发展为云端的趋势,总结了目前CAE软件的前处理-求解器-后处理云化的3个阶段。随后,他介绍了CAE云化的4.0版,即全流程自动化,并分享了Simright在云端CAE领域探索的经验与成果。
来自北京应用物理与计算数学研究所的徐小文研究员做题为《基于中间件的激光聚变数值模拟高性能计算支撑》的报告。他指出激光聚变是当前最复杂的大型科学工程之一,挑战科学、技术和工程的极限,数值模拟是激光聚变研究领域不可或缺的方法,如何快速建立与高置信度数值模拟需求相匹配的超级计算能力是其中的关键任务。他介绍了激光聚变数值模拟的流程、基于中间件的高性能计算架构实现和数值模拟软件的研究方法,并展示了过去十年基于中间件的数值模拟计算能力提升与应用成效。
Panel讨论
Panel讨论环节由研讨会共同主席莫则尧研究员主持,围绕“软件架构”这一主题,五位嘉宾结合各自研究与经验,畅所欲言,现场气氛十分热烈。
王戟研究员结合多年软件工程研究的经验指出,在高性能计算应用领域,软件承担基础设施的重要地位,软件架构是重中之重,软件的形态呈现机物融合的过程。软件可以定义为抽象的载体,向上的接口是可编程模型,向下的接口是虚拟化平台。设计软件架构的关键点在于软件的成长性与适应性。
宋鹏研究员结合多年ICF软件架构设计经验,指出过去的ICF软件发展基于编程框架,屏蔽了并行编程,实现了软件模块化以及适应复杂计算机体系结构。随着应用领域对置信度的要求以及精细建模的要求,软件还需要进一步向平台方面发展,沉淀共性算法模块,封装物理建模和数值离散等过程。
田荣研究员结合多年高性能CAE软件的研究经验,分享了自己对这次会议的感受,指出目前国内CAE软件的自主化力量比较雄厚。然后提出了一个问题,就是如何形成合力。他指出国防军工行业90%以上的CAE软件来自国外,存在生态壁垒,打破壁垒难度较大,而且和国外存在很多年的历史差距。壁垒加上差距,导致各单位单打独斗的难度较大,必须要形成合力来突破。
李义章董事长结合多年工业软件中间件研发经验,分享索为经历的过程。介绍了一个国外工业软件的研发案例,探讨一系列优秀的工具软件如何转换为软件工程,强调了工业软件操作系统是连接基础软件与应用软件的桥梁。
徐保文总经理结合多年工业软件体系设计与研发经验,对工业软件发展提出了几个建议。他提出工业软件必须扎根于工业,在工业中的使用对工业软件的发展非常重要。其次是做工业软件必须要有关键技术,这种技术不仅仅是理论上的,而且还要是被证明在工程中有效的技术。最后他提出工业软件必须和先进的IT技术相结合,并强调了工业软件的IT属性。
在随后的提问环节中,现场听众踊跃发言,问题范围涉及多学科协同持续发展、多部门研发软件的共赢模式、国产工业软件发展之路、人才培养以及如何组建软件研发团队等等,五位嘉宾及主持人针对以上问题,进行了精彩的发言,阐述了自己的观点,引发了大家热烈的讨论。
本届研讨会为高性能计算中间件领域的学者搭建了一个展示成果、交流合作、探讨未来发展趋势的开放平台,取得了预期效果。