IBM JS20刀片高性能计算解决方案

时间:2009-02-22   来源:   网友评论:0   人气: 573 作者:

方案简介
该方案中共配置了14个IBM JS20服务器,28颗IBM PowerPC970/2.2GHz处理器;内存容量为28GB。理论浮点运算性能达到2464亿/秒。 配置一台IBM OpenPower710服务器作为I/O节点。该服务器配置了1个IBM最新的Power5处理器。在IBM SMT(Simultaneous Muti-Threading)功能打开的情况下,该系统的逻辑处理器数为2个,完全可以胜任I/O吞吐负载。 配置了完善的高性能计算管理与开发软件,方便用户管理与使用。

方案优点:
1. 成熟的硬件与软件配置,构成完善的高性能计算集群系统;
2. IBM刀片服务器JS20采用处理能力极强的PowerPC970 RISC芯片。该芯片同时具有内置的向量扩展单元,可以大幅度提高适合向量化的应用程序的性能;
3. 在刀片服务器集群中,将计算网络数据传输网络完全分开,改善计算的通信性能和I/O处理能力;
4. 配置统一的共享文件系统,方便用户使用;
5. 采用单一的系统管理软件,实现整个集群系统的统一管理,方便用户进行系统管理与维护;

2. 方案二:34个刀片服务器
方案二配置示意图



方案简述: 该方案中共配置了34个IBM JS20服务器,68颗IBM PowerPC970/2.2GHz处理器;内存容量为68GB。理论浮点运算性能达到5984亿/秒。 配置一台IBM OpenPower710服务器作为I/O节点。该服务器配置了1个IBM最新的Power5处理器。在IBM SMT(Simultaneous Muti-Threading)功能打开的情况下,该系统的逻辑处理器数为2个,完全可以胜任I/O吞吐负载。 配置了完善的高性能计算管理与开发软件,方便用户管理与使用。

方案优点:
1. 成熟的硬件与软件配置,构成完善的高性能计算集群系统;
2. IBM刀片服务器JS20采用处理能力极强的PowerPC970 RISC芯片。该芯片同时具有内置的向量扩展单元,可以大幅度提高适合向量化的应用程序的性能;
3. 在刀片服务器集群中,将计算网络和数据传输网络完全分开,改善计算的通信性能和I/O处理能力;
4. 配置统一的共享文件系统,方便用户使用;
5. 采用单一的系统管理软件,实现整个集群系统的统一管理,方便用户进行系统管理与维护;

集群系统管理软件 集群系统管理软件和集群系统一样形形色色、多种多样。

下面简要介绍几种集群系统管理软件并比较它们实现的功能。
(1)IBM CSM IBM CSM(Cluster Systems Management )是IBM eServer Cluster 1300上的系统管理软件。IBM的Linux集群战略的一部分就是把运行在RS/6000 SP平台上的PSSP软件移植到基于xSeries的Linux集群系统上。CSM大部分功能来源于SP平台,但是它也集成了WebSM 2000、xSeries、开放源码工具和其他技术。CSM是一款功能很全面的管理工具,而且还在不断的发展中。
(2)xCAT XCAT是用于IBM eServer Cluster 1300上的系统管理软件。它由Egan Ford开发。它基本上是由shell脚本写成,相当简捷。但是它实现了集群系统管理大部分的内容,是个非常出色的管理软件。

下表比较了以上两种主要集群系统管理软件:


作业管理软件 有很多种选择去管理集群系统中的资源。其中PBS资源管理器和Maui作业调度器最适合集群系统。
 
(1) PBS PBS(Portable Batch System)是由NASA开发的灵活的批处理系统。它被用于集群系统、超级计算机和大规模并行系统。

PBS主要有如下特征:
· 易用性:为所有的资源提供统一的接口,易于配置以满足不同系统的需求,灵活的作业调度器允许不同系统采用自己的调度策略。
· 移植性:符合POSIX 1003.2标准,可以用于shell和批处理等各种环境。
· 适配性:可以适配与各种管理策略,并提供可扩展的认证和安全模型。支持广域网上的负载的动态分发和建立在多个物理位置不同的实体上的虚拟组织。
· 灵活性:支持交互和批处理作业。
OpenPBS(http://www.OpenPBS.org/)是PBS的Open Source的实现。商业版本的PBS可以参照:http://www.pbspro.com/。 (2)Maui Maui是一个高级的作业调度器。它采用积极的调度策略优化资源的利用和减少作业的响应时间。Maui的资源和负载管理允许高级的参数配置:作业优先级(Job Priority)、调度和分配(Scheduling and Allocation)、公平性和公平共享(Fairness and Fairshare)和预留策略(Reservation Policy)。Maui的QoS机制允许资源和服务的直接传递、策略解除(Policy Exemption)和指定特征的受限访问。Maui采用高级的资源预留架构可以保证精确控制资源何时、何地、被谁、怎样使用。Maui的预留架构完全支持非入侵式的元调度。 Maui的设计得益于世界最大的高性能计算中心的经验。Maui本身也提供测试工具和模拟器用于估计和调节系统性能。 Maui需要资源管理器与其配合使用。我们可以把Maui想象为PBS中的一个插入部件。 更多Maui的信息可以访问:http://www.supercluster.org

BladeCenter JS20 和Sun Fire B100s/B100x/B200x刀片竞争分析

 性能
l 支持主频2.2GHz PowerPC 970处理器,而目前Sun的客户受限于陈旧和速度更慢的UltraSPARC ІIi 650MHz处理器。
l JS20设计支持2颗处理器,而Sun Fire B100s/x只支持单颗处理器。
l 内存支持4GB(4GB 800MHz FSB模式)大大增加服务器性能,而Sun B100s/x内存只能扩展到2GB。 l IBM BladeCenter JS20为每一个刀片提供直接或冗余附件连接企业SAN,以获得到高性能磁盘阵列的非受限磁盘容量的高速带宽连接,而Sun仅依靠更慢的NAS连接硬盘
l 目前快速处理器和PCI总线需要更高的带宽支持。鉴于此原因,BladeCenter JS20设计使用PC2700 DDR,PC2700 DDR可以支持2700MB/s的传送速率,而Sun B100s PC133内存支持仅达1100MB/s,Sun B100x PC2100 内存支持仅达2100MB/s。


 

文章评论