NVIDIA专业卡Quadro FX5800性能评测

时间:2010-04-11   来源:   网友评论:0   人气: 9511 作者:

前言——提供完整解决方案的 Quadro FX 5800
QuadroFX5800A副本2.jpg 

NVIDIA 的工作站显卡按照档次,可以依次分为 Ultra-High-End、High-End、Mid-Range、Entry-Level 四档,其中 Ultra-High-End 为最高基本,性能规格和功能特性都是同时代产品中最强悍的。 

  Quadro FX 3800 Quadro FX 4600 Quadro FX 4700 Quadro FX 4800 Quadro FX 5600 Quadro FX 5800
GPU 内存容量 1GB GDDR3 768MB GDDR3 1GB GDDR3 per GPU 1.5GB GDDR3 1.5GB GDDR3 4GB GDDR3
内存界面 256-bit 384-bit 256-bit 384-bit 384-bit 512-bit
内存带宽 51.2 GB/s 67.2 GB/sec 51.2 GB/sec 76.8 GB/sec 76.8 GB/sec 102 GB/sec
CUDA SP数量 192 112 128 per GPU (共计 256) 192 128 240
最大功耗 108W 134W 226W 150W 171W 189W
占用插槽数 1 2 2 2 2 2
显示连接界面 DVI-I
DP
DP
STEREO
DVI-I
DVI-I
STEREO
4 X DVI-I
STEREO
DVI-I
DP
DP
STEREO
DVI-I
DVI-I
STEREO
DVI-I
DVI-I
DP
STEREO
Dual-Link DVI 1 2 4 1 2 2
Single-link DVI-I            
DisplayPort 2     2   1
OpenGL 3.1 3.1 3.1 3.1 3.1 3.1
Shader Model 4.0 4.0 4.0 4.0 4.0 4.0
DirectX 10.0 10.0 10.0 10.0 10.0 10.0
CUDA Yes Yes Yes Yes Yes Yes
NVIDIA SLI Multi-OS Yes     Yes   Yes
SLI Frame Rendering Yes Yes Yes Yes Yes Yes
Genlock/Framelock - Yes Yes Yes Yes Yes
可选Quadro SDI卡 Yes Yes Yes Yes Yes Yes
可选G-Sync卡   Yes Yes Yes Yes Yes
3D图元性能
每秒三角形处理能力 300 Million 250 Million 250 Million 300 Million 300 Million 300 Million
每秒纹理处理能力 38 Billion 24 Billion 32 Billion 38.4 Billion 38.4 Billion 52 Billion

NVIDIA 目前的 Ultra-High-End 产品有两款,分别是基于 G80 芯片的 Quadro FX 5600 以及基于 GT200 芯片的 Quadro FX 5800,而后者就是本文介绍的主角。 

QuadroFX5800D.jpg 

风鼓式散热器设计


支持 SLI 双卡并行和允许加插 SDI 视频捕捉、输出子卡


Quadro FX 5800 需要连接两个电源接口
分别是末端顶部的 6-pin 和末端后侧的 8-pin

Quadro FX 5800 和 Quadro FX 3800 使用的都是 GT200 芯片,但是后者的 TPC(纹理处理簇)并没有完全开放,只启用了其中的 24 个。此外,Quadro FX 3800 的内存总线位宽也都只有 256-bit。

在 GT200 架构中,每个 TPC 内包含有 24 个流处理器(stream processor,简称 SP),每 8 个 SP 组成一个 Streaming Multiprocessor(简称 SM)。

而 Quadro FX 5800 则是完全足本的规格,拥有 240 个单精度 SP,512-bit 内存总线,SP 在 3D 应用的时候频率为 1296MHz。

在不同的浮点运算指令组合下,Quadro FX 5800 理论单精度浮点性能为:

FMA+MUL:933.12 GFLOPS
FMA:622.08 GFLOPS
MUL:622.08 GFLOPS
ADD+MUL:622.08 GFLOPS
ADD:311.04 GFLOPS

Quadro FX 5800 也支持双精度浮点运算,但是由于是每 8 个单精度 SP 才搭配一个双精度 SP(这个双精度 SP 可以单周期执行一个 FMA指令),因此双精度性能只有单精度 FMA 的 1/8,即 77.76 GFLOPS,如果论FADD 或者 FMUL 时的双精度性能则是 38.88 GFLOPS。

与之对比,目前英特尔的 Core 2 i975 3.33GHz 的 FMUL+FADD、FMUL、FADD 指令双精度浮点运算性能均为 53.28GHz,同样指令下的单精度浮点运算性能均为 106.56 GFLOPS。

和其他 Quadro FX 显卡相比,Quadro FX 5800 的特别之处在于它能实现非常强大而完整的 work-flow(工作流)加速能力:支持几乎所有的工作站软件、捆绑了若干个针对常用软件的性能优化器、具备 4GB 大容量内存可以提供高速的大纹理支持和改善通用计算加速的本地内存容量约束问题。

你可以想象一下,在 Photoshop 里进行纹理创建和加工,然后把纹理应用到 3dsmax 中的场景里,接着渲染场景动画,在 Premiere Pro CS 中进行非线性编辑,而后把编辑好的序列导出为 h.264 压缩的视频或者动画,这一系列的过程都 Quadro FX 5800 都能为止提供相应的、不同程度的加速。

当然,这并不代表你不需要一个强力的处理器,对于工作站应用特别是高阶的应用,中央处理器越快总是越好的,Quadro FX 对这个 work-flow 的加速,更多的体现在中央处理器力不从心的地方,如此就能达到异构运算所提倡的互补增益效果。

Quadro FX 5800 的固定运算功能单元(例如纹理单元、三角形 Setup 引擎)频率为 612MHz,纹理填充速率填充速率为 73.44 GTexels/s,像素填充速率为 19.584 GPixels/s。

在 GT200 架构中,每个 TPC 内除了包含有 3个 运行于 1296MHz 的针对可编程运算的 SM 外,还有 32 个运行于 612MHz 的 8-bit 纹理单元。

需要注意的是,我们这里提到的频率是指全速模式下的规格,实际上Quadro FX 5800 的驱动程序会依据当前的负荷而自动调整运行频率,从而显著节省耗电和发热。不仅于此,NVIDIA 还在芯片电路效率上下了大量功夫,相对于 GT200 583 平方毫米的芯片面积和 14 亿晶体管,它的电力消耗表现其实相当出色的。

QuadroFX5800C02.jpg 

视频输出连接


惠普 DreamColor LP2480zx 支持 10-bit DisplayPort 输入


NVIDIA 开发者网站上的场景软件 NVSG 5.0 提供了 30-bit 显示支持

Quadro FX 5800 提供了两个 DVI-I、一个 DisplayPort、一个立体等多种输出接口,其中 DisplayPort 能提供每个色彩通道 10-bit 的颜色输出,例如在惠普的 DreamColor LP2480zx 显示器上,就能实现精确的同屏 30-bit (17 亿种,64 倍现有的 8-bit )色彩显示。


Quadro FX 5800 透过 SDI 子卡提供强大的动画布幕合成

不仅于此,Quadro FX 5800 还可以透过配装 SDI 子卡在 Adobe Premiere Pro、Adobe After Effects 等软件中实现向 SDI 显示器、SDI 磁带仓、SDI 投影机等专业广播设备输出无压缩(8-bit、10-bit、12-bit)的画面信号,用户藉此实现数字化的虚拟背景合成,例如体育比赛、天气报告的立体报幕、动画。

Quadro FX 5800 使用的 GPU GT200b-GL 其实就是从 GeForce GTX 285 的 GT200b 中经过特别筛选的,不仅芯片本身还有电路板以及配套的零件在电气特性上都有更严格的要求,在产品品质上更有保证。

按照 NVIDIA 的说法,Quadro FX 的产品生命周期长达 36 个月,这除了产品品质保证的基础,更重要的是 NVIDIA 长期以来在驱动程序、附加值软件以及与业界伙伴合作上的大力投入所达成的。

NVIDIA 在专业图形市场上历年以来的投入号称已经达到了一万五千人年,累计售出的 Quadro 专业卡超过 1500 万片,拥有 90% 的市场份额(包括 CAD/CAM、医疗设备、石油、数字内容创作和电视转播),有 300 位工程师专门为这个市场的应用程序配合,拥有非常丰富的整体解决方案经验。

在驱动程序上,NVIDIA 下了非常大的功夫,特别是兼容性稳定性方面有非常出色的表现,无论是 OpenGL、Direct3D 都能提供良好的支持,为 Quadro 度身定制的驱动程序版本还捆绑了一些针对 3dsmax 等软件的加速版驱动插件,这些都获得了业界软件商、整机厂商、系统集成商的广泛认证。


透过 PhysX DCC for 3dsmax 插件实现 PhysX 刚体碰撞物理模拟


透过 PhysX DCC for Maya 插件实现 PhysX 刚体碰撞物理模拟

NVIDIA 对业界软件的支持不仅仅体现在驱动认证、性能加速上,还有大量强大的开发工具与之配合,例如 PhysX DCC Plug-Ins,就是可以在 3dsmax、Maya、Softimage(其中 Softimage 本身已经捆绑了该插件)等重要三维创作软件中提供 PhysX 物理开发支持的插件。

单凭 NVIDIA 一家实现更多的 Quadro 附加值显然是不够的,NVIDIA 为业界提供了丰富的开发工具,例如 Cg、CUDA C 以及即将正式发布的 OpenCL、Compute Shader 等。

其中 CUDA C 作为今年来 NVIDIA 力推的 GPGPU 语言已经获得了业界的广泛的支持,大家可以看看下面这个长达 100 多页滚屏的连接,就可以了解 CUDA C 现在获得的支持是多么的蔚为壮观:

http://www.nvidia.com/content/cudazone/CUDABrowser/assets/data/applications.xml


Furry Ball GPUman For Maya
可以在 GeForce GTX 285 上用 2 秒的时间完成上面场景的渲染


按照 Furry Ball 于 Youtube 公布的视频
Quadro 可以达到游戏卡的 10 至 50 倍渲染速度
注意:大陆网友需要代理才能访问 Youtube

举个例子,上面的连接中有一个由 Furry Ball(毛毛球)公司推出的名为 GPUman(名字有点模仿 Renderman?)的渲染器,能够提供达到 300 倍于传统 CPU 渲染器(Renderman、MetalRay)的性能。

GPUMan 目前还是 1.0 beta 测试阶段,尚未正式发布,不过在其他的一些软件方面,就有已经有了商业上的正式版本,例如 Elemental 针对 Adobe Premiere Pro CS4 推出的 Elemental Accelerator H.264 视频编码器


 

文章评论