结构流体多物理场耦合高性能仿真计算集群配置推荐2022v4

时间:2022-10-23   来源:   网友评论:0   人气: 171 作者:

集群面临问题

经常听到客户反馈,某某分布式多机集群、某某云计算平台,在集群上做计算还不如普通电脑快,高性能计算集群做工程仿真计算效率很低,花了一大笔经费,经过一年多的方案论证、审批通过、采购、交货、使用,但集群性能表现很差
cpu=gpu-cluster.png

看似高性能集群的计算服务器、存储服务器、管理服务器、infiniband交换机等硬件设备放到机柜上,通过网络交换机全部连接好,系统、软件、开发工具也都安装调试正常了,HPC集群就OK了,真这么简单吗? 实际情况:
可能1  计算服务器硬件配置选型不合理,
可能2  并行存储服务器硬件配置有问题
可能3  作业调度方法存在问题
可能4  计算方式选择有问题,通过GPU计算更快,但确用CPU计算方式
可能5  网络io有问题,永远是满负荷
。。。
出现这些问题的原因,集群的配置方案往往是使用者想要一个“最先进、成熟的”集群计算架构,自己认为的一个方案,或者过度相信“丰富有经验的系统集成商”(大品牌,不用质疑),根据客户的预算,给出的高性能计算集群方案
使用者大部分是对软件熟悉,对工作计算任务熟悉,但因工作知识的局限性,可能对硬件配置,最新计算架构不是很精通,
集成商,大部分都是卖设备的,关心的是设备能否卖出去,对客户应用了解很少或不是很深入,因此这样两类人,在一起交流讨论仿真计算集群硬件配置方案,未来必然存在隐患。

那么一个合理、完美、高效的高性能计算集群方案的关键点都有什么?

首先 要根据客户的应用要求,跑什么软件,对这些软件特点进行分析
其次,根据掌握了应用情况,结合最新的硬件规格,分别给出计算服务器、GPU服务器、并行存储服务器、管理服务器、网络低延迟的交换机的对应方案,另外还要配备好一个高效的作业调度系统,这样这个集群方案更贴近仿真软件的计算要求,
关键点1  计算服务器用什么规格CPU、GPU、内存、硬盘,性能最大化?
关键点2  存储服务器,作为数据交换最密集的地方,最大的瓶颈,是什么?
不能忽略的情况:
如果不知道仿真数值模拟软件的不同求解器的特点,很可能计算服务器配置正常,软件运行正常,速度很慢,怎么回事?
如果不熟悉计算硬件架构,计算服务器的CPU频率高低无所谓,内存带宽无所谓,硬盘io无所谓,便宜就行,可能结果性能表现很差
如果不清楚很多软件已经支持GPU加速,求解过程得到10几倍的提升(用CPU就可以,或用最贵的GPU,也不快,什么情况?)
如果不清楚作业调度正确方式,按核调用,计算规模越大,分配更多核,速度就快?
因此,集群配置缺陷,将来必然面临并行计算效率低,性能表现差的问题,再加上作业调度软件问题或使用问题,集群运算效率自然好不到哪里。

(二)CX650高性能仿真计算集群

西安坤隆计算机公司,经过多年实际集群系统的应用软件运行和监测分析,我们可以给出从集群硬件配置和集群架构、作业调度全方位的满足不同仿真计算特点,通过采用最新CPU和GPU,以及合理硬件配置和高效作业调用,保证了集群的计算效率发挥到最大。
 
UltraLAB高性能仿真计算集群充分考虑应用软件的算法特点,保证整个集群每个环节,计算服务器或GPU超算服务器,并行存储服务器等集群配置架构,无死角、无卡顿、均衡,都能最大限度发挥各自的性能,

应用软件并行计算特点

 

应用种类

主要软件类

计算特点

计算设备

1

结构静力/动态仿真

Ansys

Abaqus

Ly-Dyna

 

有限元法,纯CPU计算

两个环节:

1 网格自动剖分单核计算,高频才能加速

2 求解器求解有限多核计算,调用合理的计算资源,加速

上述过程,反复迭代,直到收敛为止,

高频服务器

计算服务器

2

流体仿真

Fluent

有限体积法,CPUGPU结合

计算服务器

GPU计算服务器

3

多物理场耦合

Comsol Multiphysics..

有限元法,纯CPU计算

高频+有限多核+大内存带宽

高频服务器

计算服务器

4

电磁仿真

HFSSCST Feko..

频域类,有限元法,纯CPU计算

时域类,时域有限差分,GPU加速

高频服务器

计算服务器

GPU计算服务器

5

科学计算类

MatLAB

解释型高级语言工具,主模块单核计算为主,需要多核并行,要借助【并行计算工具箱】

计算服务器

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

CX650仿真集群系统介绍

CX650是采用intel xeon第三代可扩展处理器组成的集群,代表着目前最新的计算架构,求解更快、更高效。CX650集群系统是由【高频服务器】、【计算服务器】、【GPU超算服务器】、【管理与存储服务器】、【高性能低延迟交换机】、作业调度系统组成。

No

关键设备

配置规格

主要任务或功能

1

高频服务器

2颗或4Xeon高频处理器/大容量内存/高速固态盘/25G/56G 高性能网卡

针对有限元仿真计算网格剖分单核cpu计算特点,面对多个计算服务器计算过程的并发网格剖分,通过配置超高频CPU,大大缩短同时多个网格剖分计算时间,从而加速整个求解计算

2

计算服务器

2xeon+16根内存+25G/56G 高性能网卡

针对基于CPU计算的仿真模拟计算的重要计算过程---求解器求解,配备最新2intel Xeon3代处理器,40@高频+16通道内存带宽打造理想高速计算架构,每个计算节点高频+多核并行计算+内存IO带宽最大化,在核数与频率、低延迟响应达到完美均衡。

3

GPU超算服务器

配备最新2intel Xeon3代处理器(32@高频+16通道内存带宽)25G/56G 高性能网卡

针对基于CPUGPU异构超算,支持CPU仿真模拟计算,也支持GPU加速计算,

最新GPURTX A6000 48GB)单精度浮点算力40Tflops,可用于支持GPU求解计算,性能提升显著,例如Fluent求解,一块A6000卡算力(FP32 40Tflops)相当于44Xeon 银牌4316(累计880核)性能,

4

管理与存储服务器

xeon(核数充足)/高速缓存盘/并行存储/56G/100G高性能网卡

承担高速并行计算的海量数据密集读写,提供最强大的并行读写存储架构

承担集群管理

5

PSS作业调度软件

基于linux环节

支持全面任务调度,支持多种计算架构,支持混合计算架构

一款成熟、高可靠、易管理的作业调度软件,保证多任务计算作业调度、监控


 


 

文章评论