Nehalem在STREAM性能测试中击败Istanbul

时间:2009-08-01   来源:   网友评论:0   人气: 253 作者:

几周之前,高性能计算集群制造商Advanced Clustering Technologies的设计团队公布了基于Intel Nehalem和基于AMD Istanbul系统在High Performance Linpack (HPL)测试下的对比结果。当时的结果显示Istanbul在Linpack测试中超出了Nehalem

现在,Advanced Clustering Technologies的工程师再次使用STREAM基准测试对这两款微处理器进行测试,并在他们的网站上公布了结果。STREAM是HPC Challenge套件的一部分,主要是测试内存带宽——高性能计算系统的一个重要属性。

自从内核数不断增加以来,内存带宽对很多应用就变得越来越重要,计算能力已经超出了内存性能。与HPL一样,STREAM也是一项综合的性能测试,但是总得来说,如果一个应用是内存受限的,那么STREAM性能测试将是一个很好的相关性能指示。

一方面是一台配置了两个四核2.66GHz Xeon X5550的Pinnacle几家服务器,每个的热套封是95瓦,还配置了12GB的1.33GHz DDR3主内存。

另一方面是一台配置了两个六核2.6GHz Opteron 2435和16 GB 800MHz DDR2主内存,每个热套封是75瓦。

Corder采用相同的电源、硬盘和操作系统。他表示,两台设备上的内存容量之所以不相同是因为每个芯片架构支持的内存速度不同,而且内存通道数的也不同。

NehalemIstanbul的STREAM结果是在意料之中的。如果你时常关注x86市场的竞争形势,你可能已经猜到依赖于更高级的内存子系统的Intel Nehalem(至强5500)处理器会超出依赖于DDR2技术的AMD Istanbul Opteron。

测试结果是:基于至强5500的设备最高理论性能是85.12 gigaflops,在ACT的Linpack测试中实际表现为74.03 gigaflops。这说明,设备在实际工作负载下的性能是理论性能的86.97%。Istanbul设备的理论峰值是124.8 gigaflops,在ACT的Linpack测试中实际表现为99.38 gigaflops,有效率仅为79.63%。

Advanced Clustering Technologies工程师Shane Corder这样表示:

“甚至内存速度最慢的至强5500处理器也比速度最快的Opteron高出了20%,用Opteron与最快的至强相比,至强的性能高出75%多。至强5500获得如此之高的内存带宽主要是因为采用了三通道而不是双通道内存、提高时钟频率的DDR3以及Quick Path互连技术提供的高速点对点CPU连接。”

另外一个需要注意的数据就是在六核Istanbul上的STREAM表现要比在四核Shanghai上略低一些,Advanced Clustering Technologies工程师认为Istanbul额外增加的两个内核必须争取与Shanghai芯片中两个内存控制器相同的带宽。与Linpack结果一样,这些结果也从一个侧面反映了芯片的性价比。

“当你将每台设备的成本考虑其中的话,结果仍然显示至强5500具有明显优势。至强服务器的成本大约在3800美元左右,而皓龙服务器的成本在3500美元左右。至强服务器每小时每1美元的传输量为9.8MB,而皓龙服务器每小时每1美元的传输量为5.9美元,至强5500系列高出了66%。”

和以前一样,需要提醒的是综合性能测试结果可能与实际应用情况并不相符。Advanced Clustering Technologies的建议是,你使用你自己的编码来查看处理器和系统架构是否会给你提供最多的回报。

文章评论