100万亿次/S的GPU异构HPC集群系统方案

时间:2009-07-31   来源:   网友评论:1   人气: 3918 作者:

全球高性能计算TOP500的统计,有90%以上采用的是基于X86架构搭建的集群系统。不过随着高性能计算技术的发展和应用的不断扩大,目前占据市场主流的高性能集群系统在某些高性能计算领域的应用将面临CPU+GPU的强劲挑战。
16n-incm.jpg 

NVIDIA 新出的GPU并行计算卡GTX295,其峰值计算能力已达2万亿次/秒,成本是Tesla C10601/3,而速度确提高一倍。在科学研究项目中,虽然稳定性略差些,但从性价比角度考虑,这是最合适的选择,CPU+GPU异构多核架构的高性能计算系统在使用过程中也为用户带来更低的使用成本

 

  下面是运算速度在100TFlopsGPU集群系统方案

应用

设备

配置

单位

数量

GPU              计算节点

  

19"标准, 3U机架式

18

  Xeon5500系列

16GB DDR3-1066 RECC

150G SATA硬盘 10K

◇主板具有6个以上PCI-E x16插槽

◇双1000M以太网接口

20Gbps INFINIBAND网卡

1000W  EPS 电源

3nVidia GTX295480个处理器,1792MB GDDR3 800MHZ显存

磁盘阵列

 

采用NAS系统,具体的主机配置如下:

2

19"标准, 5U机架式,24盘位

◇采用最新直连架构(Xeon 55系列主频2.26GHz,四核,8M L3) 或者同等性能的AMD24系列

8GB DDR3-1066  RECC内存

2*150G SATA 10rpm硬盘

1*20Gbps Infiniband网口

4* 1000M以太网接口

3+1冗余 1140W

22* 2TB  SATA 3.5”

IOP348芯片高速阵列卡(1GB DDR2-533缓存)

管理节点

 

19"标准,2U机架式

1

◇采用最新直连架构(Xeon 55系列主频2.26GHz,四核,8M L3) 或者同等性能的AMD24系列

8GB DDR3-1066 RECC 内存

2*150G 10Krpm SATA硬盘 热插拔

◇双1000M以太网接口

1+1冗余 510W电源

机柜

 

19"标准, 42U

2

计算网

Infiniband网络

24infiniband 交换机  20Gbps

1

Infiniband高速互联卡 20Gbps

20

管理网

千兆以太网

24口千兆交换机

1

 

 

 

 

 

KVM

 

KVM切换器

1

 

 

 

 

 

操作系统

Windows

Win HPC server 2008

20

GPU编程环境

NVIDIA CUDA

nvcc C语言编译器

1

◇用于GPU(图形处理器)的CUDA FFT以及BLAS

◇分析器(Profiler

◇用于GPU(图形处理器)的gdb调试程序

CUDA运行时驱动程序

 

主要HPC系统硬件配置 

1. GPU计算节点

产品编号 XASUN GPU U22308TI
分类 型号规格 数量
CPU Quad Core Xeon E5520 2.26Ghz/QPI 5.86Gt/s 1
主板 Supermicro X8DTH-iF 1
内存 2GB  DDR3-1066 ECC/Reg 6
系统盘 WD 150G SATA 1万转 1
光驱 None  
网卡 双千兆  
高速互联卡 Infiniband 20Gpbps卡 1
电源 1000W EPS  1
GPU计算卡 nVidia GTX295 3
  CPU 采用CPU-内存直连技术、Nehalem核心,
技术要点 是GPU计算最完美架构平台
  主板支持4块GPU计算卡  

 

2.管理节点


RM217new.JPG 

产品编号 XASUN MC U22304TG
分类 型号规格 数量
CPU Quad Core Xeon E5520 2.26Ghz/QPI 5.86Gt/s 1
主板 Intel S5500BC 1
内存 2GB  DDR3-1066 ECC/Reg 4
系统盘 WD 150G SATA 1万转 2
高速互联卡 Infiniband 20Gbps卡 1
电源 510W EPS  1

 

3.存储节点
RM519.jpg 

产品编号 XASUN NAS S22304TG
分类 型号规格 数量
CPU Quad Core Xeon E5520 2.33Ghz/1366Pin/5.86Gt/s 2
主板 Intel S5500HC 1
内存 2GB  DDR3-1066 ECC/Reg 4
系统盘 WD 150G SATA 1万转 2
网卡 Intel 双千兆服务器网卡 1
高速互联卡 Infiniband 20Gbps卡 1
电源 3+1 1140W冗余  
阵列卡 Areca 1680-24 SAS/SATA 1
阵列盘 WD RE4 2TB SATA 22
技术要点 存储最大瓶颈在硬盘、网卡的IO上
阵列卡采用目前最快IOP348双核处理器,最高带宽达800MB/S支持远程管理,支持SAS硬盘
板载双千兆卡支持IO加速和绑定冗余功能

 

文章评论


评论人: 净土 2010-01-17
文章很精彩!