Nehalem性能魅力感染中科院超算分中心

时间:2009-11-02   来源:   网友评论:0   人气: 292 作者:

经中央国家机关政府采购中心组织招标,中国科学院合肥物质科学研究院计算中心日前完成了12万亿次/秒超级计算机的投建。前不久,记者采访了该项目负责人中国科学院固态物理研究所副所长曾雉女士。
  据了解,合肥分中心最终选用了刀片集群的方案,由112个浪潮NX7140N计算刀片(双路四核Nehalem 2.8GHz处理器,DDR3内存,3GB/core);2套4路Xeon X7460(2.66GHz/6c)/16M L3/1066MHz,4GB/core,共48个内核的胖节点;一套16.2T容量的LUSTRE并行文件系统,一套8T容量的存储系统;2个网格节点,1个登陆节点和管理节点,采用了高速互联网络环境(20Gbps InfiniBand计算网络 + 1000M 管理网络)互联。此外,浪潮赠送了浮点计算峰值性能为2万亿次/秒的GPU HPC一台,双方联合针对典型应用开展GPU平台研发和推广。
英特尔,至强5500,服务器处理器,Nehalem" border="1" /中国科学院合肥物质科学研究院计算中心超级计算机结构示意图
  从方案选型来看,该方案是一种典型瘦计算节点,搭配胖节点的集群方案,适用于MPI类型的并行程序运算。其中的胖节点主要适用于Open GL类型并行程序运算,需要很高的内存和处理计算能力。从合肥分中心的应用需求看,主要集中在核聚变、大气光学、材料物理等应用和研究上,其典型的应用程序,如VASP算例、Vien2k算例等,均适用于这种瘦计算节点的集群方案。
  该方案有两个决策部署引人注目,一是选用了Intel最新的Nehalem处理器,二就是采用了刀片集群的方案。谈到采用Nehalem处理器,曾雉坦诚确实承受了价格上的压力。据了解,最终中标的浪潮方案,并不是价格最低的方案。参与投标的方案中,有很多的标案,价格都低于最终的方案。曾雉指出,所以没有采用最低价格的投标方案,主要源于测试的结果。据透露,它们对包括Nehalem、AMD上海、AMD巴塞罗那在内的多款处理器进行了测试。从运行结果看,在VASP算例应用上的表现,同等4核心的情况下,Nehalem处理器表现最为优异,加速比有近68.2%的提升。随着核数的增加,加速比有所减低,但仍然有23%左右优势。在 Vien2k算例测试中,Nehalem也有近50%的性能优势。
  这种性能优势,是浪潮方案最终中标的最主要原因。曾雉指出,在性能与价格之间的取舍,首先是考虑性能。Nehalem处理器内部集成了内存控制器(IMC),并采用QuickPath实现处理器对外I/O的点对点连接,设计技术上的改变,是Nehalem处理器具有优异性能表现的主要原因。
  除了性能之外,能耗也是选型重要原因。据曾雉介绍,招标指出就决定采用刀片集群的方案,而没有采用机架式服务器集群,最主要的考虑就是节能。刀片服务器在节能、易管理等特性方面,具有突出的表现。这是确立刀片方案的重要原因。此外,最终选用刀片集群,一部分原因也是为了与中国科学院超级计算中心保持一致,合肥分中心作为中国科学院计算环境网格的一部分,在结构上要与中心保持一致。但是Nehalem以及刀片的节能表现,也是确立最终方案的重要因素。
  另外一个与超级计算节能相关的话题是虚拟化应用。实际上,鉴于超级计算中心,CPU100%利用率的状况,通过划分虚拟机,提高资源利用率的做法,在超级计算中心没有太多的用武之地,而且虚拟机自身多少还要消耗一部分的计算资源,这对于超级计算而言,就是很难接受的。但是虚拟化在超级计算机中,另外有应用。据浪潮高性能服务器产品部总经理刘军介绍,有些并行计算应用对Linux操作系统版本有要求,对于超级计算而言,也不可能安装更多版本的操作系统,这种情况下,就可以利用虚拟化平台,提供对不同操作系统的支持。这是目前可以看到的,虚拟化在高性能计算机的应用。
  据刘军透露,在合肥分中心的方案中,率先采用了SSD固态盘。从结果看,无论是性能,还是节能表现,SSD固态盘的效果均令人满意。

文章评论