蓝色巨人的怒吼 IBM Power 7处理器浅析

时间:2010-05-20   来源:   网友评论:0   人气: 1376 作者:

毫不夸张地说,Power 7处理器的问世,让IBM重新夺回了高性能计算领域的制高点,以恐怖的性能和突破性的规格将Intel、AMD远远甩开。究竟蓝色巨人给Power 7注入了什么样的魔法?现在就让我们一起探个究竟。

高性能计算再起风云

        短短几年时间,高性能计算领域就已经发生了翻天覆地的变化—先是SUN在SPARC处理器上开发不力,逐步淡出。然后是Intel至强和AMD皓龙处理器的低价渗透。

20100511172835345.jpg 
 

        就在2009年,NVIDIA甚至试图借助GPU架构的Tesla进军高性能计算领域—就在我们以为高性能计算领域也会像台式机、服务器领域那样回归Intel、AMD、NVIDIA三家斗法之时,盟主IBM终于按耐不住,在2010年2月8日拿出了密谋许久的Power 7处理器。

冲击千万亿次计算

        你可别以为Power 7处理器会像其他几家的CPU和GPU那样,一年就能够换代,事实上关于Power 7的研发从2006年就开始了。2006年11月,IBM赢得了美国国防高级研究计划署(DARPA)研发每秒千万亿次计算(Petascale)超级电脑的研发合同。合同中规定,在2010年底IBM必须拿出达到千万亿次运算规模的超级计算机供DARPA使用。在合同中还规定,这样的计算机架构,必须能在日后实现商业化和规模量产化。其中IBM还提出,新的架构要完全符合PERCS(Productive,Easy-to-use,Reliable Computer System)—即高效易用可靠运算架构。在这个价值2.4亿美元的项目中,IBM当时就预计交付美国国防高级研究计划署的电脑将会使用Power 7处理器、AIX操作系统以及通用并行文件存储系统。从2006年11月开始,IBM就和美国国防高级研究计划署就新的处理器架构进行合作研发,目标很简单—让千万亿次计算触手可及。

        如果你经常看到Intel和NVIDIA的宣传,应该还记得Intel的80核处理器计划,目标是实现单芯片上万亿次计算(Terascale)级别的计算。事实上在高性能计算领域,几乎所有厂商都在为万亿次计算努力。而2008年IBM为美国国家核能安全管理部设计的Roadrunner(走鹃)超级计算机,才首次达到1.026PetaFLOPS(每秒千万亿次浮点运算),成为人类首部达到千万亿次计算级别的电脑。在当时,IBM Roadrunner动用了6912颗AMD双内核Opteron处理器和12960颗IBM PowerXCell 8i处理器,并且配备了51.8TB内存,耗资1.33亿美元。而Roadrunner之所以如此庞大,究其原因就在于单个处理器所提供的运算能力相当有限—双内核Opteron处理器只有5.2GFLOPS浮点运算能力,IBM PowerXcell 8i处理器的浮点运算能力为102.4GFLOPS。而NVIDIA的高性能运算卡Tesla C2070 也只能提供630GFLOPS浮点运算能力。

20100511173129450.jpg 

IBM Roadrunner超级计算机

        毫无疑问,要降低超级电脑跨入Petascale的门槛,提升CPU的峰值浮点运算能力是不二的法门。NVIDIA、AMD等图形卡制造商力挺的异构计算,虽然能够达到更高的峰值浮点运算,但在交付使用后往往需要改写大量的代码,才能完全发挥异构体系的力量。而用传统CPU架构堆砌起来的超级计算机,显然更符合IBM PERCS结构。

20100511173214115.jpg 

Power 7 CPU

        根据IBM的数据,Power 7将会提供最大264.96GFlops的峰值浮点运算能力,将当今市场上的一切CPU都远远的抛在身后。Power 7即便面对NVIDIA/AMD的GPU架构处理器也不遑多让。更让人惊讶的是,IBM在Power 7上引入了智能核心、智能线程、智能缓存、智能功耗和智能内存技术,解决了困扰当今PC许久的运行效率与功耗等至关重要的问题。

打造史上最大CPU

        如今热卖的Intel Core i7 处理器采用了45nm制程工艺,芯片面积为270mm2。而同样采用45nm工艺的Power 7处理器,芯片面积却高达567mm2—是Intel Core i7的两倍。究竟IBM用567mm2的核心和12亿个晶体管干了些什么?Power 7处理器将会有4、6、8内核三种规格。其中每个内核都能实现4路同步并发线程。这意味着在8内核Power 7中,可以并行执行32条线程!而我们熟悉的Core i7处理器每个内核通过超线程技术只能提供两个并发线程。


 

文章评论