您的位置：UltraLAB图形工作站方案网站 > 人工智能 > 深度学习 > 为什么UltraLAB深度学习工作站最快、性价比最高

为什么UltraLAB深度学习工作站最快、性价比最高

时间：2017-06-16 02:43:00 来源：UltraLAB图形工作站方案网站 人气：20481 作者：admin

目录
1    市场深度学习硬件配置严重缺陷
2    最合理深度学习硬件架构分析
3    UltraLAB 深度学习超级计算机完美配置推荐

2018年6月最新深度学习基准配置报价下载（直接点击）

（一）市场上提供的深度学习硬件配置有严重缺陷

深度学习太火了，卖深度学习的计算机、服务器、工作站，五花八门，到处都是卖家，到处都是专家，似乎，只要机器里能插GPU，插的越多性能越强，实际情况是：

反馈1：为什么4块GPU机器，比人家2块GPU机器还慢
反馈2：为什么同样8块GPU比人家8块GPU卡，还慢
反馈3：为什么2块GPU卡，一个快一个慢
反馈4：为什么这么多GPU卡，计算过程还是很慢
反馈5：我的机器噪音巨大，无法放到办公环境，怎么在静音环境下运行
…
误区1：只要有足够多GPU卡，性能更强大
误区2：同样数量GPU卡，谁便宜、谁性价比更高，就最好选择
误区3：CPU核数，频率不重要，把钱砸到GPU上就行
误区4：硬盘和内存不重要，最重要的是GPU卡越多越好
…
困惑1: 上述反馈是什么原因造成的？
困惑2：市场谁家能给出更好的配置架构

问题来了，深度学习需要什么样的硬件配置才是最合理，最高效的

（二）深度学习硬件架构分析

首先一定从深度学习计算过程分析开始

610m框架图副本3.jpg

上述图示，深度神经网络计算大致流程，下面通过深度神经网络计算环节，分析核心硬件配置理想要求

环节	主要操作	涉及硬件	瓶颈	配置推荐
1	数据调入	硬盘->内存	硬盘io是最大瓶颈	GPU和硬盘数量1:1 硬盘io越高越好
2	数据预处理	CPU(单核计算模式)	计算量巨大	CPU频率越高，处理越快
3	内存->显存->计算	GPU	计算量巨大	增加GPU，CPU核数大于GPU数量，内存比显存大
4	数据结果->内存	内存
5	数据保存	硬盘	硬盘io	用SSD或多硬盘

常见计算机硬件配置上的低级错误：
1．为了省钱，硬盘用普通PC硬盘，寿命短，带宽低，或数量不够，
2．为了节省，CPU用的最多的是Xeon E5 2620v（8核2.1GHz），频率太低，数据预处理太慢，成为整个计算的最大瓶颈，
3．为了把钱用到“刀刃上”—尽可能多配GPU卡，但是总显存比内存容量大，不合理，或者CPU核数低于GPU卡数，这些都会造成计算过程资源耗尽，数据来回从虚拟内存导入，计算变慢 #p#page_title#e#

（三）深度学习计算机、工作站最理想的硬件配置推荐

针对上述深度学习计算过程、低级配置错误分析，深度学习最合理硬件配置架构，保证整个机器是一台理想化异构超算系统，完美强大高效还静音

UltraLAB GXi/M图灵计算工作站是西安坤隆计算机公司2017年上半年推出的、目前市场上一款集多GPU超算、超高频率处理器、海量存储于一体、基于办公静音环境、应用于深度学习(机器学习、人工智能)的AI超级计算机系统。

和市面上深度学习计算机系统相比，显著优势：

拥有超高CPU频率，大幅加速深度学习预处理过程
支持最大4块（GX360i）/7块(GX480M)/9块（GX610M）GPU卡，单精度浮点100Tflops
拥有最大16个硬盘位，容量160TB，
完全处于办公环境（静音级）、不在被噪音所困扰
不需要专门的机房，不占过多空间，维护成本极低
完美的硬件配置和专业优化加速技术，保证整个机器系统高速高效运转

3.1 图灵计算工作站技术规格

610m框架图副本2.jpg

机型	硬件配置规格
机型	CPU	GPU	最大内存	存储
GX360i	单CPU架构 4核4.8GHz~5GHz	最大4块	64GB	并行存储最大40TB
GX480M	单CPU架构 6核4.5GHz 8核4.3GHz	最大7块GPU	256GB	并行存储，最大180TB
GX610M	双Xeon架构 2*Xeon E5 2689v4 （共计8核3.5GHz）	最大9块	1TB	并行存储，最大180TB

3.2深度学习工作站硬件配置参考

（1） GX360i机型配置参考（超值型）

该机型特点：支持4块GPU卡，CPU频率高达5GHz，整体配置均衡无死角，满足深度学习训练硬件配置要求

NO	CPU	内存	GPU/总显存	单精度	系统盘	并行存储	平台	售价
1	7600K OC (4核4.8GHz)	16GB	2块GTX1080 8GB	16Tflops	256GB SSD	1TB	塔式	36500
2	7700K OC (4核4.9GHz)	32GB	4块GTX1080 32GB	33Tflops	512GB SSD	*41TB**	塔式	58500
3	7700K OC (4核5.0GHz)	64GB	4块GTX1080Ti 44GB	45Tflops	512GB SSD	*44TB**	双塔单电	69000

备注：含23”高清图显

（2） GX480M、GX610M机型配置参考（高性能型）

该机型特点：支持最大到7块（GX480M）或9块（GX610M）GPU卡，CPU的频率和核数达到最大均衡，每个环节保证达到最高性能，整体配置均衡无死角，满足深度学习训练对配置的要求

NO	CPU	内存	GPU/总显存	单精度浮点	系统盘	并行存储	平台	售价
1	6850K OC (6核4.5GHz)	64GB	5块GTX1080Ti 55GB	56Tflops	1TB SSD	*51TB**	双塔双电	94500
2	6900K (8核4.3GHz)	96GB	6块GTX1080Ti 66GB	68Tflops	1TB SSD	*61TB**	双塔双电	115000
3	6900K (8核4.3GHz)	128GB	7块GTX1080Ti 77GB	79Tflops	1TB SSD	*71TB**	双塔双电	128000
4	2*Xeon E5v4 (20核3.1GHz，睿频3.8GHz)	128GB	8块GTX1080Ti 88GB	90Tflops	1TB SSD	*81TB**	双塔双电	159000
5	2*Xeon E5v4 (20核3.1GHz，睿频3.8GHz)	128GB	9块GTX1080Ti 99GB	101Tflops	1TB SSD	*91TB**	双塔双电	169000

备注：含23”高清图显

总结
UltraLAB GXi/M是一款静音级、真正高性能GPU超算的深度学习训练计算机，比市面上的机器，更安静，性能更强大，适合科研、研究部门在安静的办公环境下运行。

此外，该机型用途极广，扩展能力强，调整配置后，可为电磁仿真计算（CST）、量子化学/分子动力学计算（VASP、AMBER等）、超大屏拼接（8X9=72路视频拼接合成）、视频剪辑合成、指纹识别等应用，提供强悍的计算、图形生成能力

方案咨询
西安坤隆计算机科技有限公司
国内知名高端定制图形工作站厂家
业务电话：400-705-6800

微信

关闭此页

上一篇：深度学习台式、便携式、机架式、集群硬件配置选型2022v2

下一篇：地表最强深度学习训练平台~UltraLAB GPU硬件选型

为什么UltraLAB深度学习工作站最快、性价比最高

相关文章

工程技术(工科)专业工作站/服务器硬件配置选型

新闻排行榜

最新信息

应用导航: