Xeon X5570与六核Opteron 2435伊斯坦布尔性能较量

时间:2009-09-03   来源:   网友评论:0   人气: 1600 作者:

数周之前国外有网站Advanced Clustering Technologies对英特尔Nehalem和AMD“伊斯坦布尔”的平台做了高性能 Linpack(简称HPL)对比测试(国际上最流行的用于测试高性能计算机系统浮点性能的benchmark,通过对高性能计算机采用高斯消元法求解一元N次稠密线性代数方程组的测试,评价高性能计算机的浮点性能),种种测试结果表明AMD“伊斯坦布尔”战胜了英特尔Nehalem平台。

至强对决皓龙
至强5500与六核皓龙“伊斯坦布尔”代表了英特尔与AMD最新的技术

至强5500系列和皓龙2400系列HPL对比测试,皓龙胜

  此项对比测试的目的只有一个:展示GFLOPS(每秒钟进行10 亿次浮点运算的工作能力)的峰值。理论上每个系统GFLOPS峰值取决于处理器核心的数量、主频和IPC(Instructions Per Clock Cycle,指令/时钟周期)。几年前上一代的处理器也只能做两个IPC,而最新的处理器在全新架构的帮助下能够达到四个IPC。为了便于比较,较老的主频为2.2 GHz的双核皓龙处理器的理论峰值仅为17.6 GFLOPS每台机器而如今四核的皓龙理论峰值却能够达到70.6 GFLOPS。

  HPL对比测试的两个平台介绍,AMD方面为皓龙2435“伊斯坦布尔”系统(六核心,主频2.6GHz,16GB 800MHz DDR2内存 );英特尔方面为至强X5550 Nehalem系统(四核心,主频2.66GHz,12GB 1333MHz DDR3内存)。测试人员尽可能的保持测试平台的平等性,同样的电源、硬盘驱动器以及操作系统。内存的容量在发挥三通道内存架构的Nehalem和双通道内存皓龙之间性能各不相同。由于该测试项目倾向于内存容量和测试成绩成正比,因此,测试人员调整了两个平台的内容容量大小。

至强5500与皓龙2400系列处理器性能对比测试

处理器型号

理论峰值

实测峰值

效能 平台价格 每GFLOP运算成本

Nehalem X5550 2.66GHz

85.12 GFLOPS

74.03 GFLOPS

86.97% $3,800.00 $51.33

Istanbul 2435 2.6GHz

124.8 GFLOPS

99.38 GFLOPS

79.63% $3,500.00 $35.21

  简而言之,在该测试中AMD“伊斯坦布尔”战胜了英特尔Nehalem,其测试结果对比为99.38个gigaflop(每秒钟至少进行10 亿次浮点运算的工作能力)VS74.03个gigaflop。也许六核战胜四核并不在意料之外,但考虑到英特尔支持单核心双线程的hyperthreading技术,也许会预测英特尔要在并行运算占据优势。而在实际应用,我们发现hyperthreading技术带来的性能的提升很大程度上取决于具体的应用。

  据Advanced Clustering Technologies的工程师介绍,在运行HPL测试软件的时候,hyperthreading却导致了一定程度上性能的削减,工程师还指出Linpack少数几个不从hyperthreadin技术中受益的应用之一。

  在有着更高带宽DDR3内存的支持下,Nehalem更具计算效能(HPL峰值和理论上峰值),尽管用户一般并不关注这些度量标准,但实际上这在英特尔设计中起到了不错的平衡系统的作用。讨论的最多的就是价格性能测试结果,而在该测试中AMD占据了优势。每一个gigaflop运算成本测试成绩对比为35.21美元VS 52.33美元。

  HPL对比测试最后结论:AMD“伊斯坦布尔”在每GFLOP运算成本和峰值表现上都胜英特尔Nehalem至强一筹,这表明六核心处理器提供了强劲的浮点运算性能,但在整体性能平衡性上不及英特尔Nehalem至强。较低的效能测试结果很可能是缺乏内存带宽,加大“伊斯坦布尔”系统内缓存轮询所导致的,处理器闲置较长时间等待来自内存的数据的同时也在检测系统内12个处理核心的缓存命中(cache hit),内存宽带对整个系统性能表现带来的巨大影响。


 

文章评论