x740配什么主板

不知不觉,2018年已经走到了尾声,再有几天我们就要跨入全新的2019年。俗话说,一寸光阴一寸金,寸金满买寸光阴。在这个万象更新之际,回顾2018年HPC市场的发展,不由得让人感慨万千。在过去的2018年,曾10次蝉联全球超算TOP500的中国队终于走下“神坛”,美国凭借着Summit的神勇表现再度…

不知不觉,2018年已经走到了尾声,再有几天我们就要跨入全新的2019年。俗话说,一寸光阴一寸金,寸金满买寸光阴。在这个万象更新之际,回顾2018年HPC市场的发展,不由得让人感慨万千。


x740配什么主板

在过去的2018年,曾10次蝉联全球超算TOP500的中国队终于走下“神坛”,美国凭借着Summit的神勇表现再度荣膺第一名;

在过去的2018年,智能化不仅仅没有停止发展的脚步,而是再度迸发出火热的浪潮。AI化已经成为整个IT行业不可逆转的潮流,同样也为HPC应用注入了全新的生机;

在过去的2018年,公有云与混合云同样有了蓬勃的发展,特别是“超算应用”的云化也成为了行业发展的潮流。无论是“超算云”还是“云超算”,都为用户来带了全新的服务模式,也推动传统超算行业的迭代与发展;

在过去的2018年,你又能想起什么呢?

2018年HPC关键字之一:绿色计算

2018年6月,德国法兰克福会展中心内,ISC世界超算大会正在进行中。这已经是ISC大会连续第四年在法兰克福举办,在此之前的4年中,这个会场的冠军一直被来自中国的两台超级计算机所占据,它们的名字叫做——天河二号和神威·太湖之光。


x740配什么主板

但是在这一次的ISC大会上,当TOP500的发起者、美国工程院院士,橡树岭国家实验室田纳西大学杰出教授Jack Dongarra带着些许激动念出“Summit”这个名字的时候,台下引起了不小的惊呼声。准确说来,由中国连续10次蝉联的TOP500超算冠军终于易主,这也意味着美国继当年Titan之后再度夺回了第一名。

“这台机器的一大特性就是它实测的效率高达70%以上,应该是现有异构平台中最高的”,中科院计算机网络信息中心副主任迟学斌如是说。无独有偶,美国上一次活动的TOP500冠军的Titan也同样是一台异构计算的系统,当年它的出现也证明异构计算(CPU+GPU)的模式在超算应用中完全行得通。

当然,Summit的出现不仅仅是复制了Titan当年的成功,更重要的是它的效率很高,这也意味着我们在采用异构计算的情况下,同样可以获得较高的能效比(一般纯CPU状态下能效比可以高达90%以上),而能效比这个问题与百亿亿次计算的挑战密切相关。

这不由得不让整个业界将关注点转移到了绿色能源的层面。其实早在多年前,尽可能的“节能”就成为了这些超算“巨兽”不得不面对的问题,而当年荣膺全球第一的天河二号就创新性的采用了液冷散热的方式,如今这种设计在超算设计中已经成为主流。

E级计算的一个标准就是较高的能效比,或者说能够在达到百亿亿次计算的时候将系统的能耗控制在合理的范围内。对此,业界曾提出过20兆瓦的标准,后来随着计算能力的提升这个数字放宽到了30兆瓦,但目前看来这个数字依然很难实现。


x740配什么主板

即便不为了冲击全球第一,能耗控制依然具备深度的现实意义。其实在商业环境中,超级计算机的能耗更容易被用户所关注,因为每增加1%的能耗都意味着巨大的经济代价。为此,许多超算中心或者数据中心都建在了电价较为低廉的地区。

比如在内蒙古的呼和浩特,数据中心的电价只要0.26元/度,但是在人口稠密的北京地区,即便政府给与了补贴之后,这个数字也高达0.6元以上。“地方政府如今的观念也在转变。从传统的黑色能源输出(煤炭)变成了全新的计算力输出,将这些能源发出的电力转变为计算力,供给全国各地使用。如今曙光已经在与呼和浩特相关部门接洽,建设高品质的计算中心”,曙光副总裁、中国国家高性能计算机工程技术研究中心副主任何铁宁表示。

能源的节省只是超算应用的一方面。节流固然重要,更重要的则是“开源”。在刚刚过去的全球超算SC18大会上,中科曙光一款名为“硅立方”的产品进行了首次亮相,其创新性的采用了全浸没液冷的散热方式,这一产品在美国一经展出,就引起了与会人士的广泛关注。


x740配什么主板

据悉,硅立方是全球首款采用浸没式液体相变冷却技术刀片服务器的超算系统,这种冷却技术使系统性能提升5%以上,电能使用效率(PUE)降至1.04以下,相当于40瓦的功率即可冷却1000瓦的设备,而传统的风冷系统则需要500瓦到1000瓦的功耗。

在体积上,硅立方3个机柜相当于12到15个传统机柜,计算密度提升4到5倍。硅立方所具有的能效比和计算密度高等特点,为未来超算技术及其应用发展打开更多想象空间。更重要的是,它的部署对于基建和场地要求非常宽泛,“它甚至可以作为一个景观放在建筑外面。未来,按照部署地区的不同,有的地方可以制暖,有的地方可以做游泳池,有的地方甚至可以温室或者培养花”,何铁宁表示。


x740配什么主板

不过对于用户来说,无论未来无论是建游泳池还是温室花房,都只是硅立方的附属价值,而大家最关心的还是运营成本。这种差异化的系统相对于传统超算中心来说,是否会带来投资的增加呢?对此,曙光HPC方案专家杜夏威算了一笔账——虽然硅立方的初期采购成本略高,但由于良好的节能效果,硅立方的运营成本会相较于传统超算中心低很多。以行业惯例的5年生命周期为标准的话,硅立方运营的前2~3年,其节省出来的运营费便已抵消了采购增加的成本。而后两年节省出来的运营费,相当于降低了数据中心的拥有使用成本。

近年来,超级计算机向每秒百亿亿次的运算速度迈进,随之而来的能耗问题也成为行业关注的焦点。如今看来,通过增加系统规模和功耗来增加机器性能的方式已经走不通了,超算性能提升将更加依赖于系统能效比的提升。从外部条件来说,采用更为低廉的电价或许成为一种解决燃眉之急的有效方式,但是从更为长远的角度考虑,类似硅立方之类的新型超算模式定会受到业界的欢迎,成为迈向E级计算行之有效的方式之一。

2018年HPC关键字之二:AI化

在IT行业,你很难想象一个概念能够持续“热”很多年。如果是这样,就意味着这个概念真的是行业所亟需的。上一次“热” 了多年的词是云计算,而这一次,则轮到了AI——人工智能。

似乎从2016年开始,AI这个词就已经在行业内悄然兴起,距离它前两次席卷全球仅仅过去了20多年的时间(在计算机发展史上,这是第三次AI热潮,上一次是在上世纪90年代)。不过与之前不同的是,这一次AI热潮所需的三要素——计算、算法、数据——都已经齐备了。于是从2017到2018,AI这个名字火爆了整整两年,也带动了各行各业朝着智能化的方向迈进,当然包括高性能计算。


x740配什么主板

其实说起AI,特别是AI赖以实现的深度学习和机器学习,这两大应用都脱胎于高性能计算,甚至在许多应用中,恰恰是高性能计算孵化了AI应用的雏形。传统意义上,高性能计算包括了大气模拟、海洋模拟、地球勘探、物理仿真、生物基因工程等等,而这些应用的一部分就成为了AI发展的主力。不过恰恰是AI的出现,也为高性能计算带来了新的发展机遇,也从传统的阳春白雪变得接地气。

作为一家常年专注于HPC的公司,曙光同样也没有错过AI发展的良机。如果我们将AI比作金矿淘金的话,那么曙光无异于是一家提供淘金解决方案的公司。这里我们说的解决方案不仅仅包括锹镐之类淘金的工具,更包括找矿、筛选等许多“技术范儿”的工作,这也恰恰是曙光的强项所在。

在2018年11月举行的GTC China苏州大会上,曙光展示了全新XMachine系列AI服务器,这个系列主要包括X745-G30、X785-G30、X795-G30、X740-H30等四款产品。这些产品均基于英特尔最新的Skylake平台,该系列AI服务器最多可支持8个NVIDIA NVLink的GPU或10个训练GPU或20个推理加速卡。


x740配什么主板

更重要的是,XMachine系列AI服务器可做到一个硬件平台,两块不同主板(CPU、GPU),三种不同拓扑,可实现更多种类、更强适应性的AI服务器变化。“XMachine就像变形金刚一样,可以通过不同的组合满足不同客户、不同业务的需求”,曙光智能计算技术总监许涛解释说。

仅仅有硬件还远远不够,如果不能通过平台将一台台硬件设备管控起来或者实现统一的协调应用,终究还是无法形成合力,也对于AI应用的发展不利。为此,曙光还推出了一款名为SothisAI 2.0的人工智能管理平台,在加强对于主流AI加速芯片支持的同时,采用容器技术与高性能计算调度技术相融合的方式,为用户提供快速高效的机器学习、深度学习环境部署、使用和管理,也可根据用户需求进行定制化服务。


x740配什么主板

据悉,SothisAI2.0加强了对主流AI加速芯片的支持性,可支持NVIDIAGPU、AMD GPU、FPGA、DCU(Deep Computing Unit)、寒武纪等目前主流的深度学习加速器,并可集成更多框架和环境。当然对于大部分用户来说,能够良好的支持NVIDIA GPU就已经足够了。

除此之外,SothisAI 2.0还具备容器化快速部署、灵活的弹性运维、对主流框架的全面支持、比虚拟机更高效等特点,用更加实用、易用的服务帮助用户快速部署AI应用。

无论是各行各业,都有AI应用的需求。古话说,“工欲善其事,必先利其器”。想做好AI计算,想在AI的时代获得寒假工业领先,一方面需要强大计算能力的AI硬件平台,另一方面也需要能够实现AI管理的工具。有了这样优秀的工具,无论是科研领域的进步还是日常生活应用的普及化与便捷化,才成为了可能。

2018年HPC关键字之三:超算的云化

早在5年前,我参加过中科院某所的发布会,会议的主题就是某超算中心对外开放计算资源,用户可以通过在线或者快递硬盘的方式,用到更好的超算平台。而时至今日,这样的应用已经成为一种常态,用户只要动动手指,便捷的超算云服务就呈现在大家的面前。

“超算云,英文叫做HPC in cloud,HPC还是HPC,只不过在云里面”,对于超算云这个概念,迟学斌老师有着自己的理解。其实无论英文还是中文,超算云这个概念显然是强调了超算的重要性,而“将超算云化”也就成为了顺理成章的解读。在这个定义中,超算云所实现的就是通过云计算或者说网络接入的手段,将传统的超算平台开放给外面的用户使用。


x740配什么主板

同样,在业界还有一个类似的概念,叫做“云超算”。虽然听起来差不多,但是云超算更多的则是在云端实现了超算应用,重点在于云化的环境。这样一来,整个系统的架构就是云化的,是弹性扩展的,而HPC只是植入在云平台上的一项应用,同样也是面向全社会提供商业服务应用的。

虽然听起来有点晕,但是两者的区别却非常明显。简单说来,超算云更多在于超算本身,而超算(超级计算机)是一台系统,无论这台系统的名字是叫Summit还是叫天河二号,都是一台系统;而云超算,则是让云平台实现了超算的效果,这其中云平台的底层(IaaS层)可能是由众多的虚拟机组成的,并非是一台系统。

不过对于用户来说,大家并不看重两者的差异化,而是更关心能否解决业务方面的难题。对于大部分购买超算服务的用户来说,时间就是金钱,如何保证系统算得快、算得准,就成为了摆在用户面前的难题。

所谓“算得快”就要求系统的软硬件得搭配要出色;“算得准”,就要求程序代码经过调优,可以发挥系统的最大性能。但是通常情况下,许多用户不具备“算得准”的能力,所以“算得快”就成为了他们的唯一诉求。


x740配什么主板

但是如今,这个问题在曙光的手中却得到了很好的解决。今年10月,接着HPC China青岛大会的契机,曙光也举行了先进计算服务平台的上线仪式。“曙光注重不同计算技术的科技创新及与不同行业的应用融合,同时也密切关注高性能计算本身的迭代优化,并致力于打造功能完善且符合用户习惯的先进计算服务平台。”曙光公司高性能事业部总经理李斌表示。基于这一出发点,曙光先进计算服务平台应运而生。

正如我们前面提到的,由于技术能力、人员配备或者其他相关的因素,许多用户都无法搞定“算得准”的问题,而在看到这个行业痛点之后,曙光借助于自家独特的应用专家团队,推出了“500销售+500技服”的贴心服务团队,从而实现全生命周期、全流程服务。用李斌的话讲,“扶上马一起走”。


x740配什么主板

原来,这次发布的先进计算服务平台作为曙光原有EasyOP的升级版,将在提供HPC在线7×24小时全生命周期SaaS级服务的基础上,进一步提升功能完善度和客户体验度。在硬件配置上可以实现“原厂商、资源新、配置高、性能稳定”等特点,同时在软件层面也搭配了众多的主流应用软件,并且对于其中的相关数据已提前优化并部署,尤其是针对AI、工业仿真、生命、气象环保、材料等垂直领域可提供深度支持。

回首即将过去的2018年HPC市场,我们收获了太多的惊喜,也承担了太多的重担。这其中,有得益于应用进步的喜悦,也有来自国际舞台的压力;有技术落地的累累硕果,也有E级计算探索的孜孜不倦;但是更多的,我们看到了HPC市场依旧蓬勃发展的生命力,看到了曙光为代表的中国企业在产品上、技术上、服务上不断地突破和创新,也看到了千万名HPC从业者的努力与奋斗。

面对百亿亿次的挑战,曙光正在前方。

趣懂得网所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们1875979182@qq.com 反馈 本站将在三个工作日内改正。

发表评论

您的电子邮箱地址不会被公开。