首页 > HPCMid > HPCMid-2018 > 邀请报告

邀请报告


孙凝晖.jpg

孙凝晖,研究员,中科院计算技术研究所

中科院计算所所长,计算机体系结构国家重点实验室主任,研究员,博士生导师,基金委杰青。

先后参加了曙光一号并行计算机,曙光1000大规模并行机,领导了曙光2000-I、曙光2000-II高性能计算机、曙光3000超级服务器、曙光4000超级服务器、曙光5000A高效能计算机、曙光6000高性能计算机、新型高通量计算机的研制,1999年获中国科学院青年科学家奖一等奖,2001、2003、2006、2013年四次荣获国家科技进步二等奖,2005年获中国科学院杰出科技成就奖,2006年获得“中国青年科技奖”和“中国十大杰出青年”荣誉称号。主要研究领域是高性能计算机、计算机系统结构。    

报告题目:高性能计算机的普及

报告摘要:高性能计算机的普及长期以来一直是人们追求的目标之一。在报告中首先回顾高性能计算机从高端专用走向普及的发现历程,讨论在高性能计算机的系统硬件、应用软件上有助于普及的技术,最后介绍我们在降低高性能计算机应用的开发门槛、提高开发效率上的思考与实践。

肖侬.jpg

肖侬,教授,国防科技大学

国防科技大学计算机学院教授、博士生导师。获得教育部长江学者特聘教授、国家杰出青年科学基金、CCF Fellow。现任中国计算机学会工委副主任、信息存储专业委员会副主任、大数据专家委常务委员和高性能计算专业委员会委员。研究方向为高性能网络计算与云计算、新型存储和系统结构。负责过863重大项目和一般项目、国家重大基础研究项目973课题、国家自然科学基金重点项目等。获得国家科技进步二等奖1项、省级部委级一等奖2项和二等奖3项,发表论文160多篇。

报告题目:面向大数据的高性能新型存储技术

报告摘要:以NVRAM为代表的新型存储介质技术发展迅猛,为缓解大数据时代的计算机系统中越来越严重的I/O挑战性问题提高了一个有效的途径。我们将重点探讨面向大数据的、基于新型存储介质的存储技术。


窦勇.png

窦勇,教授,国防科技大学

国防科学技术大学计算机学院教授,并行与分布处理国防科技重点实验室常务副主任,博士生导师,国家杰出青年基金获得者。主要开展并行计算体系结构与应用研究工作,先后主持或参与国家自然科学基金、国家863 计划等10 多个课题研究,先后获得部委级科技进步一等奖3项、湖南省自然科学奖1项。

报告题目:计算机体系结构多样性与软件生态建设

报告摘要:首先从当前微电子物质基础出发分析计算机体系结构面临的挑战,"通用+定制"的异构并行模式成为未来体系结构发展趋势,重点分析当前的几种异构并行体系结构特点,GPU、FPGA、智能加速器等,以及对应的软件生态建设。


陈云霁.jpg

陈云霁,研究员,中科院计算技术研究所

14岁就读于中国科大少年班,24岁博士毕业于中科院计算所,29岁担任中科院计算所研究员/教授、博士生导师。目前担任中科院计算所智能处理器研究中心主任,中国科学院脑科学卓越中心特聘研究员,以及中国科学院大学教授。被MIT技术评论评为全球35位杰出青年创新者(2015年度)。

从2002年起,陈云霁研究员一直从事国产处理器的研发工作,先后负责或参与了多款龙芯处理器的设计。他在包括ISCA、HPCA、MICRO、ASPLOS、ICSE、IJCAI、ISSCC以及8种IEEE/ACM Trans在内的学术会议及期刊上发表论文近一百篇,申请发明专利近一百项。获得中国青年科技奖、首届国家自然科学基金"优秀青年基金"、首届国家万人计划"青年拔尖人才"、中科院青年科学家奖和中国计算机学会青年科学家等奖项荣誉。

报告题目:深度学习处理器

报告摘要:以深度学习为代表的人工神经网络是机器学习最重要的方法之一,在云端和终端都有非常广泛的应用(例如广告推荐、自动翻译、语音识别、图像识别等)。然而传统的CPU和GPU芯片在进行神经网络处理时遇到了严重的性能和能耗瓶颈。近年来,我们提出了国际上首个深度学习指令集,和Inria合作设计了国际上首个深度学习专用处理器架构,能将深度学习处理能耗降低多个数量级。在此基础上研制了国际上首个深度学习专用处理器芯片寒武纪,引起了国际同行的广泛关注。


莫则尧,研究员,北京应用物理与计算数学研究所

报告题目:超大规模数值模拟软件高效研发平台

1200x1600.jpg

陈文光,教授,清华大学

主要研究领域为操作系统、程序设计语言与并行计算。获国家科技进步二等奖一次,部级科技一等奖两次。现为中国计算机学会杰出会员和杰出讲者,副秘书长,青年科技论坛荣誉委员;ACM中国理事会主席,ACM中国操作系统分会ChinaSys主席。多次担任高性能计算和并行计算重要国际会议如OSDI、PPoPP、CGO、SC、ICSPLDI、ASPLOS和APSYS的程序委员会委员。

报告题目:神图-扩展到数万结点图数据处理系统

报告摘要:图数据是一类重要的大数据系统,在搜索引擎、金融反欺诈、公共安全等领域有广泛应用。实际应用中的图数据,可能高达数百TB,有万亿量级的结点和十万亿量级的边,如何处理这样的大图是业界面临的重大挑战性问题。本报告介绍我们在神威太湖之光计算机上开发的可扩展图计算系统“神图”,通过创新的图划分方法和通信优化技术,以及对数据混洗算法在神威众核处理器上的优化,可以扩展到神威太湖之光全机数万结点千万量级处理器核。我们在世界上首次公开实现了对10万亿量级边的真实图在全内存处理,每一轮pagerank算法仅需10余秒时间。这项工作也对超级计算机用于大数据处理提供了实例。

李肯立.jpg

李肯立,教授,湖南大学

湖南大学信息科学与工程学院院长,博士生导师,湖南大学国家超级计算长沙中心主任,教育部长江学者特聘教授,国家杰出青年科学基金获得者,国家万人计划科技创新领军人才入选者。先后入选“教育部新世纪优秀人才支持计划”、“湖南省杰出青年基金”、湖南省“芙蓉学者”特聘教授、科技部中青年科技创新领军人才等。担任IEEE高级会员、国家超级计算创新联盟副理事长、CCF杰出会员、CCF高性能计算专业委员会常务委员、湖南省计算机学会秘书长等学术兼职,IEEE-TC编委,JCSS、C&F、IJPP、CCPE、JIFS等特刊编委。作为项目负责人主持国家重点研发计划、国家自然科学基金重点项目等国家和省部级项目20余项。以排名第一获得湖南省技术发明一等奖、科技进步一等奖、湖南省自然科学奖二等奖和教育部科技进步二等奖等。主要研究领域为并行分布式处理、超级计算与云计算、大数据管理等。在IEEE-TC、IEEE-TPDS、IEEE-TSP、JPDC、IEEE-TSP、IEEE-TETC、IEEE-TKDE、中国科学、计算机学报、软件学报等国内外高水平计算机学术刊物上发表论文200余篇,其中SCI(E)收录150余篇,IEEE/ACM Transactions论文50多篇。申请专利和软件著作权共9项。

报告题目:面向人工智能的大规模张量异构并行处理方法

报告摘要:作为大数据表示的基本方法,张量在图像处理、社交网络、推荐系统等人工智能相关领域领域具有极广泛的应用。张量运算是探寻张量固有内在数据关系的关键。随着人工智能应用的不断深入,用以描述的张量维数或阶数迅速增大,张量运算已成为计算和数据密集型应用,对高性能计算提出了极大的需求和挑战。本项目将针对高维高阶稀疏张量中非零元素的分布特征,设计相应的密度函数,据此探求张量的多维度压缩存储方法,研究新型张量运算异构并行算法,并结合国产异构超算系统的体系结构、面向未来E级计算,研发其高可扩展并行算法库,并通过推荐系统和高光谱遥感图像处理等人工智能相关应用对其性能进行验证,以最终实现大规模张量的快速运算。本项研究将不仅为国产超算系统人工智能基础并行算法及算法库研制奠定基础,对于促进高性能计算和其他学科的交叉研究和发展,发挥超算在日益增长的大数据和人工智能中的作用,拓宽我国超算的应用范围,也具有相当意义。

翟季冬.jpg

翟季冬,副教授,清华大学

清华大学计算机系副教授,博士生导师。主要研究领域为高性能计算、性能评测、大规模并行程序性能分析和优化。2015-2016在斯坦福大学计算机系任访问助理教授。相关研究成果发表在高性能计算领域重要的国际会议和期刊SC、PPoPP、ICS、MICRO、CGO、IEEE TPDS、IEEE TC等。其中SC14论文入选会议Best Paper Finalist,是大陆学者首次入围该奖项。担任NPC 2018程序委员会主席、ACM/IEEE SC 2018程序委员会委员、中国计算机学会高性能计算专业委员会委员。担任清华大学学生超算团队教练,指导的团队共七次获得世界冠军。在2015年包揽了SC、ISC、ASC三大国际超算竞赛的总冠军,实现大满贯。其中,SC15冠军是大陆高校首次在该项赛事中获此殊荣。获教育部科技进步一等奖、中国电子学会科学技术一等奖、中国计算机学会优秀博士学位论文奖、国家自然科学基金优秀青年科学基金。

报告题目:大规模高性能计算机上系统性能异常检测研究

报告摘要:在当前的大规模高性能计算机中,性能异常行为变得越来越具有挑战性。即使在相同数量的计算节点上多次运行相同程序,程序执行时间也会具有显著的差异。性能异常不仅会导致程序性能不可预测,而且还会使理解程序的行为变得更加复杂。有效地在线检测性能异常是当前大规模高性能计算机一个重要问题。为了解决上述问题,我们提出一种轻量级在线性能异常检测方法。我们发现大量并行程序中大量包含以不变工作量重复执行的代码片段。基于这一观察,我们采用静态分析的技术自动识别这些固定工作量代码段,并将它们作为有效检测系统性能异常的检测器。我们在天河-2高性能计算机上用大量并行程序评价了我们的方法。结果表明,我们的系统可以有效地检测高性能计算机上的系统性能异常。其中,在16384个进程下系统的性能开销小于4%。