nvidia的 Ampere架构-RTX 3090上市,该卡是第一个拥有超1万个流处理器的最强算力GPU卡,由于该卡外形尺寸巨大,长度达313mm,厚度3个槽,另外功耗到350w,常规GPU计算机/工作站最多支持1~2块,市场上是否有支持更多RTX3090的硬件配置?
西安坤隆公司的UltraLAB GX630M深度学习工作站可支持到最大6块RTX3090卡或7块RTX3070,用于深度学习训练和推理,该配置的深度学习工作站的张量计算单元(Tensor Core)FP16性能达到1.7PTflops(理论上),这是目前最快的。
(一)UltraLAB深度学习工作站支持RTX30情况
No |
机型 |
关键配置 |
备注 |
1 |
GX380i /GX390i |
intel第9/10代高频 (8核@5Ghz-10核5.2GHz) 最大2块RTX30系列, 内存最大128GB 静音级 |
2块RTX3090性能超4块Titan RTX, 2块RTX3080性能超4块RTX2080ti |
2 |
GT410P |
intel第10代至尊处理器 (10核4.6GHz-18核4.2GHz), 内存最大256GB 最大5块RTX30系列, 20个硬盘位 静音级 |
4块RTX3080性能超7块Titan RTX和8块2080Ti |
3 |
GX630M |
2颗Xeon(最大56核) 最大6-7块RTX30系列 20个硬盘位 静音级 |
是目前具有最高GPU算力的工作站 |
UltraLAB深度学习工作站-GPU配备规格
下表是UltraLAB深度学习机型可供配置组合(按最高性能指标降序)
No |
型号 |
卡数 |
CUDA核数 |
FP32单精度 |
TensorCore FP16半精度 |
显存带宽GBs |
显存合计 |
应用推荐 |
|
Tesla V100 |
16块 |
81920 |
238Tflops |
1760Tflops |
653 |
512GB |
CNN+RNN |
1 | RTX3090 |
6块 |
62976 | 213Tflops | 1710Tflops | 936 | 114GB | CNN+RNN |
2 |
RTX3080 |
6块 |
52224 |
179Tflops |
1428Tflops |
760 |
60GB |
CNN |
3 |
RTX3090 |
5块 |
52480 |
178Tflops |
1425Tflops |
936 |
120GB |
RNN |
4 |
RTX3080 |
5块 |
43520 |
149Tflops |
1190Tflops |
760 |
50GB |
CNN |
5 |
RTX3090 |
4块 |
41984 |
142Tflops |
1140Tflops |
936 |
96GB |
RNN |
6 |
RTX2080Ti |
9块 |
39168 |
126Tflops |
990Tflops |
616 |
99GB |
CNN |
7 |
RTX3070 |
6块 |
35328 |
122Tflops |
978Tflops |
448 |
48GB |
CNN |
8 |
RTX3080 |
4块 |
34816 |
119Tflops |
952Tflops |
760 |
40GB |
CNN |
9 |
Titan RTX |
7块 |
32256 |
114Tflops |
910Tflops |
672 |
168GB |
CNN+RNN |
10 |
RTX2080Ti |
8块 |
34816 |
112Tflops |
880Tflops |
616 |
88GB |
CNN |
11 |
RTX3090 |
3块 |
41984 |
107Tflops |
855Tflops |
936 |
72GB |
RNN |
12 |
RTX3070 |
5块 |
29440 |
102Tflops |
815Tflops |
448 |
40GB |
CNN |
13 |
RTX3080 |
3块 |
34816 |
89Tflops |
714Tflops |
760 |
40GB |
CNN |
14 |
RTX3070 |
4块 |
23552 |
81Tflops |
652Tflops |
448 |
32GB |
CNN |
15 |
RTX3090 |
2块 |
20992 |
71Tflops |
570Tflops |
936 |
48GB |
RNN |
16 |
Titan RTX |
4块 |
18432 |
65Tflops |
520Tflops |
672 |
96GB |
CNN+RNN |
17 |
RTX3070 |
3块 |
23552 |
61Tflops |
489Tflops |
448 |
24GB |
CNN |
18 |
RTX3080 |
2块 |
17408 |
60Tflops |
476Tflops |
760 |
20GB |
CNN |
19 |
RTX2080Ti |
4块 |
17408 |
56Tflops |
440Tflops |
616 |
44GB |
CNN |
20 |
RTX2080s |
4块 |
12288 |
44Tflops |
252Tflops |
496 |
32GB |
CNN |
21 |
RTX3070 |
2块 |
11776 |
41Tflops |
326Tflops |
448 |
16GB |
CNN |
22 |
RTX3090 |
1块 |
10496 |
36Tflops |
285Tflops |
936 |
24GB |
RNN |
23 |
Titan RTX |
2块 |
9216 |
32Tflops |
260Tflops |
672 |
48GB |
CNN+RNN |
24 |
RTX2080Ti |
2块 |
8704 |
28Tflops |
220Tflops |
616 |
22GB |
CNN |
25 |
RTX3080 |
1块 |
8704 |
30Tflops |
238Tflops |
760 |
10GB |
CNN |
26 |
RTX3070 |
1块 |
5888 |
20Tflops |
163Tflops |
448 |
8GB |
CNN |
27 |
Titan RTX |
1块 |
4608 |
16Tflops |
130Tflops |
672 |
24GB |
CNN+RNN |
28 |
RTX2080Ti |
1块 |
4352 |
14Tflops |
110Tflops |
616 |
11GB |
CNN |
29 |
RTX2080s |
1块 |
3072 |
11Tflops |
63Tflops |
496 |
8GB |
CNN |
从上述表格看:
(1) UltraLAB 最高配置已经接近nvidia DGX-2性能
(2) 5块RTX3080性能超9块RTX2080Ti或7块Titan RTX
(3)3块RTX3080性能超4块Titan RTX
|
文章评论