GPGPU将取代CPU?抢CPU “饭碗”(2)

时间:2008-11-23   来源:   网友评论:0   人气: 553 作者:

  DirectX 10让GPGPU迎来黄金时代

  虽然GPGPU早在DirectX 9时代就已经初现雏形,但只有在DirectX 10时代,新的GPU才能够真正促进GPGPU的成熟和高速发展。在浮点运算能力上,GeForce 8800 GTX的浮点运算能力达到了520 Gflops,是上一代顶级GPU的3倍以上!在输入/输出带宽方面,上一代GPU只能最多访问4个顶点纹理和16个像素纹理,而DirectX 10时代的GPU可以最多访问128个纹理,纹理尺寸达到8192×8192,对于着色程序来说,这就等于“无限”!让GPU和显存可以实现充分地互访。此外,GPU的通用计算主要是使用其像素着色器,上一代GPU的顶点着色器则毫无用武之地,而从NVIDIA的G80和AMD的R600开始,DirectX 10的GPU都会采用统一着色器,所有的着色器都能用于通用计算,不会造成资源的浪费
B4.jpg
B4.jpg 
 

AMD的两种物理解决方案
B5.jpg 
 

NVIDIA的SLI物理解决方案

   除了硬件的巨大进步,Shader Model和着色语言的成熟也将有力地助推GPGPU的发展。由于早期的Shader Model 1.0和Shader Model 2.0不支持动态流控制,只能提供有限的灵活性,阻碍了GPU的通用化。在DirectX 9.0c时期,动态流控制和着色程序几乎无限的资源访问能力,减少了编程时的限制。而在DirectX 10时代,Shader Model 4.0在动态流控制和资源访问上让程序员更加得心应手,几乎不用再担心编写程序时有任何限制,这也将让GPGPU在新时代的应用有了更多的可能性。关于DirectX 10和Shader Model 4.0的详细介绍,请参看本刊2006年8月上的《走进DirectX 10》和8月下的《Shader Model 4.0绝密解封》。

 

GPGPU就在我们的身边

  依靠上述优势,GPGPU在图形运算之外,能完成一些原本由CPU来处理的工作,以实现更高的处理速度和效率。
B6.jpg
B6.jpg 
 

GPGPU模拟风在城市环境下(纽约时代广场)的流动情况
B7.jpg
B7.jpg 
 

GPGPU模拟烟雾的扩散效果。在纽约大学30颗GPGPU的集群上,它也只能在480×480分辨率下达到每秒80帧的绘制速度,勉强达到实时性的要求,由此可见流体物理所需要的计算能力有多高。

   GPGPU看上去很遥远,但它实际上就在我们的身边。视频的编解码原本是CPU在负责处理,但由于高清视频的盛行,庞大的数据运算量让CPU不堪重负。而在播放高清视频时,GPU本来是不参与处理的,强大的性能基本处于闲置状态。因此NVIDIA和AMD分别开发了PureVideo和Avivo技术,利用GeForce 6/7系列和Radeon X1000系列GPU的像素着色器来加速视频编解码,包括视频编码过程中的4∶2∶2至4∶2∶0转换、噪声消除、逆3∶2PD矫正、反交错,还包括视频回放过程中的反交错、格式转换、块消除和后期处理等等。随着DirectX 10时代的到来,会有越来越多的视频处理可以由GPU来完成。这可以说是目前GPGPU最成熟、最广泛的一种应用,也是我们最常接触到的广义GPGPU

  既然GPGPU可以应用到视频处理上,那么GPGPU是否可以应用到音频处理上呢?答案是肯定的。英国剑桥大学的一个小组曾经宣布它们的音频视频交换(Audio Video Exchange)技术可以把音频数据转换成图形数据交由GPU处理,然后再将GPU处理的数据读出,并解释成音频数据播放出来。NVIDIA也表示过这一应用是可行的。但由于种种原因,该项目似乎没有了下文,进度不明。

  既然GPGPU能够从CPU那里夺来视频处理的任务,目前正渐入佳境的物理加速当然也少不了GPGPU。发布首款PhysX物理处理器(PPU)的AGEIA公司认为,GPU和PPU应该各自独立负责图形运算和物理加速。不过NVIDIA和AMD显然不这样看,PPU和GPU相互独立,在3D渲染计算量大的时候,PPU就会浪费;碰到物理计算量大的时候,GPU就浪费了。因此完全可以在对GPU做少量改动的情况下,让GPU来完成PPU的工作,并且可以实时负载动态调整,达到性能的最优化。AMD在去年的台北Computex上就展示了基于CrossFire系统的物理加速方案,当一个系统中有三块显卡时,可以使用其中一块显卡专门负责物理计算,而另外两块显卡负责图形渲染,即“2+1”模式;如果系统中有两块显卡,则一块负责物理计算,一块负责图形渲染,即“1+1”模式。NVIDIA同样也在SLI平台上实现了“1+1”模式的物理加速方案,而且两家公司都声称GPU加速物理运算的速度远超PPU。在DirectX 10时代,统一着色构架的采用,完全可以让GPU进一步加入物理计算引擎,让物理处理和顶点处理、像素处理、几何处理共享统一着色器。事实上,NVIDIA宣称G80中已经加入了Quantum Effects技术来进行物理加速,究竟效果如何,让我们拭目以待。


 

文章评论