在6月的ISC 2020大会上,TOP500官方宣布了新一届全球最强超算的排名。这次的TOP500榜单有很多亮点,去年发布的第二代AMDEPYC(霄龙)处理器在前50名中占据四席,并助力Selene超算斩获第七名,这也是TOP500中首次使用64核128线程的处理器。
64核EPYC处理器在TOP500超算中初露锋芒,代表着x86处理器在HPC高性能计算中的新生,这也是AMD超算逆袭的开始。因为过不了多久,基于EPYC处理器的新一代超算将征战百亿亿次性能,毫无疑问会成为TOP500超算新冠军。
泰坦超算退役 从16核到64核 AMD全新高性能计算架构接棒
EPYC处理器进入超算位列也颇具历史意义,因为一年前AMD历史上最强的超算Titan退役了。位于美国橡树岭国家实验室ORNL的Titan泰坦超算拿下过2012年的TOP500第一,它使用的是AMD皓龙6274处理器,这是x86处理器中首款16核服务器CPU,助力超算性能登上2.7亿亿次。
AMD用16核处理器将HPC高性能计算推上了亿亿次时代,如今超算要挑战的是百亿亿次性能,百倍的性能提升同时还要有更高的能效,这对高性能计算提出了严峻的挑战。不过AMD最终还是交出了满意的答卷,这就要靠近年来横空出世的全新EPYC处理器了。
2017年,AMD正式推出第一代EPYC(霄龙)处理器,一下子就做到了32核64线程。不过,32核开只是开胃菜。AMD在2019年又推出了第二代EPYC处理器,做到了64核128线程,并带来了PCIe 4.0等全新一代技术。
64核128线程不仅创造了x86多核处理器的新纪录,更是一举将原本挤牙膏式发展的高性能计算市场往前推了一大步,AMD表示,数据中心的性能在2年时间里直接提升了一倍,
在当前的时代里,人们对AI人工智能、深度学习、生命科学、药物合成、石油勘探、天文计算等领域的算力要求已经大幅提升,第二代AMD EPYC超过一倍的性能提升使得它在HPC领域大显身手,开始全面接棒新一代超算平台。
高性能算力哪里来?AMD创新7nm Zen2/Zen3+IF总线+小芯片设计
在半导体行业,大家都知道最近十年来摩尔定律一直在放缓。算力提升不是一件简单的事,那AMD又是如何做到2年间算力翻倍的呢?这还得从第二代EPYC处理器的诸多创新算起。
首先是全新的架构,第一代EPYC使用了14nm工艺及Zen架构,做到了32核64线程,这已经是x86中的创举,但当前在用的第二代EPYC则是升级到了7nm Zen2架构,使得IPC性能提升了15%。
与第一代Zen架构相比,Zen2架构优化了L1指令缓存、操作缓存容量翻倍、浮点单元数据位宽翻倍,同时L3缓存翻倍到16MB,64核EPYC处理器轻松拥有128MB L3缓存,远高于对手标准。
在这样的改进下,Zen2架构的性能相比前代有了明显提升,同时凭借7nm工艺带来的高能效优势降低了功耗,同样在225W TDP下也能做到64核128线程,提高了HPC高性能计算的能效。AMD六年前定下的25x20能效目标提前就完成了,7nm Zen2功不可没。
此外,AMD的CPU路线图是一以贯之的。2019年是7nm Zen2,今年还会有Zen3架构,虽然官方还没公布具体数据,但性能可期。
在今年5月份的财务分析师大会上,AMD又正式宣布了Zen4架构,面向未来的5nm工艺,预计会在2022年问世,首发用于第四代EPYC处理器Genoa(热那亚),这将会是新一代超算的又一个重要选择。
光是先进的工艺和架构也不行,支撑第二代EPYC处理器提升到64核128线程的还有全新的Chiplet小芯片设计,这也是AMD在x86处理器上的一个创举——将CPU核心与IO核心分离,前者使用7nm工艺制造,后者使用14nm工艺制造,集成了不同数量的DDR主控、PCIe主控、IF总线等IO单元。
这样一来,EPYC处理器就可以摆脱之前的束缚,超多核心极具灵活性,从8核到64核处理器就像是搭积木一样,1个IO模块可以连接多个CPU模块,64核只要1个IO模块、8个CPU模块即可。
Zen2架构与小芯片设计完成之后,AMD的高性能EPYC还欠一股东风,那就是Infinity Fabric总线技术。它是CPU核心之间、CPU与IO核心之间的关键,从第一代的10.7GT/s速率提升到了18GT/s,4路插槽并行的话可获得202GB/s的超高带宽,是64核EPYC处理器发挥性能的关键之一。就好像高速公路一样,有了它,超级能装的EPYC处理器才能跑得更快,运载的“数据”越多。
EPYC处理器冲刺新一代超算 抢占2百亿亿次性能制高点
上面所说的EPYC三大性能改进还只是AMD高性能架构中的一部分,其他的还有PCIe 4.0,第二代EPYC是首个面向PCIe 4.0技术而生的高性能处理器,总计128条PCIe 4.0通道,不论数量还是带宽,这赋予了高性能计算极高的扩展性,搭配新一代计算卡、FPGA及网络芯片都是如虎添翼。
基于这些全面性的提升,AMD的EPYC处理器很快就获得了各大超算中心的青睐,这两年来使用EPYC芯片的超算不下于20多台,今年进入TOP500的就有10台,而且这个名单还在不断地扩大中。
在这些超算中,最强大的两台是Frontier及El Capitan,前者是AMD联合Cray公司为美国能源部橡树岭实验室打造的超算系统,浮点性能可达150亿亿次,而El Capitan则是AMD联合HPE为劳伦斯利弗莫尔国家实验室(LLNL)打造的,浮点性能可达200亿亿次。
这两台超算的性能都超过了百亿亿次,El Capitan甚至翻倍到了200亿亿次,是人类有史以来最强大的超算,它们使用的都是新一代EPYC处理器,前者预计在2021年问世,El Capitan预计在2023年问世,届时无疑会改写TOP500超算排名。
总之,在HPC高性能计算领域,随着AI时代的到来,人们对算力的需求是无穷无尽的。现在的矛盾是如何高效率地提升算力,而AMD EPYC处理器凭借先进的工艺、架构、小芯片设计及PCIe 4.0的领先,已经领先业界一步,将超级计算机的算力推向了百亿亿次时代。未来在算力提升的道路上,AMD EPYC将如何改写市场格局,无疑是非常值得期待的。
关键词: AMD