支持6块RTX3090静音级深度学习工作站硬件配置方案2020v4

时间:2020-10-05   来源:   网友评论:0   人气: 168 作者:

nvidia的 Ampere架构-RTX 3090上市,该卡是第一个拥有超1万个流处理器的最强算力GPU卡,由于该卡外形尺寸巨大,长度达313mm,厚度3个槽,另外功耗到350w,常规GPU计算机/工作站最多支持1~2块,市场上是否有支持更多RTX3090的硬件配置?
西安坤隆公司的UltraLAB GX630M深度学习工作站可支持到最大6块RTX3090卡或7块RTX3070,用于深度学习训练和推理,该配置的深度学习工作站的张量计算单元(Tensor Core)FP16性能达到1.7PTflops(理论上),这是目前最快的。

(一)UltraLAB深度学习工作站支持RTX30情况

No

机型

关键配置

备注

1

GX380i

/GX390i

intel9/10代高频

(8@5Ghz-105.2GHz

最大2RTX30系列

内存最大128GB

静音级

2RTX3090性能超4Titan RTX

2RTX3080性能超4RTX2080ti

2

GT410P

intel10代至尊处理器

(104.6GHz-184.2GHz),

内存最大256GB

最大5RTX30系列,

20个硬盘位

静音级

4RTX3080性能超7Titan RTX82080Ti

3

GX630M

2Xeon(最大56核)

最大6-7RTX30系列

20个硬盘位

静音级

是目前具有最高GPU算力的工作站


UltraLAB深度学习工作站-GPU配备规格

下表是UltraLAB深度学习机型可供配置组合(按最高性能指标降序)

No

型号

卡数

CUDA核数

FP32单精度

TensorCore FP16半精度

显存带宽GBs

显存合计

应用推荐


Tesla V100

16

81920

238Tflops

1760Tflops

653

512GB

CNN+RNN

1 RTX3090

6

62976 213Tflops 1710Tflops 936 114GB CNN+RNN

2

RTX3080

6

52224

179Tflops

1428Tflops

760

60GB

CNN

3

RTX3090

5

52480

178Tflops

1425Tflops

936

120GB

RNN

4

RTX3080

5

43520

149Tflops

1190Tflops

760

50GB

CNN

5

RTX3090

4

41984

142Tflops

1140Tflops

936

96GB

RNN

6

RTX2080Ti

9

39168

126Tflops

990Tflops

616

99GB

CNN

7

RTX3070

6

35328

122Tflops

978Tflops

448

48GB

CNN

8

RTX3080

4

34816

119Tflops

952Tflops

760

40GB

CNN

9

Titan RTX

7

32256

114Tflops

910Tflops

672

168GB

CNN+RNN

10

RTX2080Ti

8

34816

112Tflops

880Tflops

616

88GB

CNN

11

RTX3090

3

41984

107Tflops

855Tflops

936

72GB

RNN

12

RTX3070

5

29440

102Tflops

815Tflops

448

40GB

CNN

13

RTX3080

3

34816

89Tflops

714Tflops

760

40GB

CNN

14

RTX3070

4

23552

81Tflops

652Tflops

448

32GB

CNN

15

RTX3090

2

20992

71Tflops

570Tflops

936

48GB

RNN

16

Titan RTX

4

18432

65Tflops

520Tflops

672

96GB

CNN+RNN

17

RTX3070

3

23552

61Tflops

489Tflops

448

24GB

CNN

18

RTX3080

2

17408

60Tflops

476Tflops

760

20GB

CNN

19

RTX2080Ti

4

17408

56Tflops

440Tflops

616

44GB

CNN

20

RTX2080s

4

12288

44Tflops

252Tflops

496

32GB

CNN

21

RTX3070

2

11776

41Tflops

326Tflops

448

16GB

CNN

22

RTX3090

1

10496

36Tflops

285Tflops

936

24GB

RNN

23

Titan RTX

2

9216

32Tflops

260Tflops

672

48GB

CNN+RNN

24

RTX2080Ti

2

8704

28Tflops

220Tflops

616

22GB

CNN

25

RTX3080

1

8704

30Tflops

238Tflops

760

10GB

CNN

26

RTX3070

1

5888

20Tflops

163Tflops

448

8GB

CNN

27

Titan RTX

1

4608

16Tflops

130Tflops

672

24GB

CNN+RNN

28

RTX2080Ti

1

4352

14Tflops

110Tflops

616

11GB

CNN

29

RTX2080s

1

3072

11Tflops

63Tflops

496

8GB

CNN

从上述表格看:

(1) UltraLAB 最高配置已经接近nvidia DGX-2性能

(2) 5块RTX3080性能超9块RTX2080Ti或7块Titan RTX

(3)3块RTX3080性能超4块Titan RTX


 

文章评论