图形工作站、集群应用方案
  • 网站首页
  • 商城
  • 产品
  • 行业计算
  • 科学工程计算
  • 化学&生物
  • 图形设计
  • 图像处理
  • 视景仿真
  • 人工智能
  • 影视后期
全球领先的高端图形工作站供应商

免费测试 热线 : 400-7056-800 【 为任何应用提供 最快计算设备 如不符,退货】【最新报价】【选购指南】【京东商城】



企业通用模版网站

  • 科研团队全能超算平台25v1
  • 超高分拼接 数字孪生
  • 科学计算MatLAB工作站24
  • 地质建模 油藏模拟工作站
  • 工业CT扫描 机器视觉计算
  • 电力系统关键应用配置24
  • 网站首页
  • 商城
  • 产品
  • 行业计算
  • 科学工程计算
  • 化学&生物
  • 图形设计
  • 图像处理
  • 视景仿真
  • 人工智能
  • 影视后期
  • 送无人机啦 8核6.4GHz  96核4.8GHz 加速改装 

  • 高性能集群 虚拟并行计算 芯片设计 光学仿真 

  • 蛋白质预测 生物信息 冷冻电镜 材料模拟

  • RSS订阅
  • 理科计算推荐
  • 仿真计算最快最完美25v1
  • 电磁仿真单机与集群25v1
  • 航拍实景建模单机集群
  • 遥感图像处理工作站集群
  • 4K/8K剪辑特效调色24v1
  • AI大模型工作站集群25v1
  • Abaqus硬件配置大全24v3
  • CST电磁仿真工作站25v1
  • 多物理场仿真单机与集群
  • 流体/空气动力学仿真25v1
  • 量子化学 分子动力模拟
  • 三维设计24v2  3D打印

 

您的位置:UltraLAB图形工作站方案网站 > 超级计算机 > 蓝色巨人的怒吼 IBM Power 7处理器浅析

蓝色巨人的怒吼 IBM Power 7处理器浅析

时间:2010-05-20 20:50:00   来源:UltraLAB图形工作站方案网站   人气:15507 作者:admin

毫不夸张地说,Power 7处理器的问世,让IBM重新夺回了高性能计算领域的制高点,以恐怖的性能和突破性的规格将Intel、AMD远远甩开。究竟蓝色巨人给Power 7注入了什么样的魔法?现在就让我们一起探个究竟。

高性能计算再起风云

        短短几年时间,高性能计算领域就已经发生了翻天覆地的变化—先是SUN在SPARC处理器上开发不力,逐步淡出。然后是Intel至强和AMD皓龙处理器的低价渗透。

20100511172835345.jpg 
 

        就在2009年,NVIDIA甚至试图借助GPU架构的Tesla进军高性能计算领域—就在我们以为高性能计算领域也会像台式机、服务器领域那样回归Intel、AMD、NVIDIA三家斗法之时,盟主IBM终于按耐不住,在2010年2月8日拿出了密谋许久的Power 7处理器。

冲击千万亿次计算

        你可别以为Power 7处理器会像其他几家的CPU和GPU那样,一年就能够换代,事实上关于Power 7的研发从2006年就开始了。2006年11月,IBM赢得了美国国防高级研究计划署(DARPA)研发每秒千万亿次计算(Petascale)超级电脑的研发合同。合同中规定,在2010年底IBM必须拿出达到千万亿次运算规模的超级计算机供DARPA使用。在合同中还规定,这样的计算机架构,必须能在日后实现商业化和规模量产化。其中IBM还提出,新的架构要完全符合PERCS(Productive,Easy-to-use,Reliable Computer System)—即高效易用可靠运算架构。在这个价值2.4亿美元的项目中,IBM当时就预计交付美国国防高级研究计划署的电脑将会使用Power 7处理器、AIX操作系统以及通用并行文件存储系统。从2006年11月开始,IBM就和美国国防高级研究计划署就新的处理器架构进行合作研发,目标很简单—让千万亿次计算触手可及。

        如果你经常看到Intel和NVIDIA的宣传,应该还记得Intel的80核处理器计划,目标是实现单芯片上万亿次计算(Terascale)级别的计算。事实上在高性能计算领域,几乎所有厂商都在为万亿次计算努力。而2008年IBM为美国国家核能安全管理部设计的Roadrunner(走鹃)超级计算机,才首次达到1.026PetaFLOPS(每秒千万亿次浮点运算),成为人类首部达到千万亿次计算级别的电脑。在当时,IBM Roadrunner动用了6912颗AMD双内核Opteron处理器和12960颗IBM PowerXCell 8i处理器,并且配备了51.8TB内存,耗资1.33亿美元。而Roadrunner之所以如此庞大,究其原因就在于单个处理器所提供的运算能力相当有限—双内核Opteron处理器只有5.2GFLOPS浮点运算能力,IBM PowerXcell 8i处理器的浮点运算能力为102.4GFLOPS。而NVIDIA的高性能运算卡Tesla C2070 也只能提供630GFLOPS浮点运算能力。

20100511173129450.jpg 

IBM Roadrunner超级计算机

        毫无疑问,要降低超级电脑跨入Petascale的门槛,提升CPU的峰值浮点运算能力是不二的法门。NVIDIA、AMD等图形卡制造商力挺的异构计算,虽然能够达到更高的峰值浮点运算,但在交付使用后往往需要改写大量的代码,才能完全发挥异构体系的力量。而用传统CPU架构堆砌起来的超级计算机,显然更符合IBM PERCS结构。

20100511173214115.jpg 

Power 7 CPU

        根据IBM的数据,Power 7将会提供最大264.96GFlops的峰值浮点运算能力,将当今市场上的一切CPU都远远的抛在身后。Power 7即便面对NVIDIA/AMD的GPU架构处理器也不遑多让。更让人惊讶的是,IBM在Power 7上引入了智能核心、智能线程、智能缓存、智能功耗和智能内存技术,解决了困扰当今PC许久的运行效率与功耗等至关重要的问题。

打造史上最大CPU

        如今热卖的Intel Core i7 处理器采用了45nm制程工艺,芯片面积为270mm2。而同样采用45nm工艺的Power 7处理器,芯片面积却高达567mm2—是Intel Core i7的两倍。究竟IBM用567mm2的核心和12亿个晶体管干了些什么?Power 7处理器将会有4、6、8内核三种规格。其中每个内核都能实现4路同步并发线程。这意味着在8内核Power 7中,可以并行执行32条线程!而我们熟悉的Core i7处理器每个内核通过超线程技术只能提供两个并发线程。 #p#page_title#e#

20100511173325134.jpg 

Power 7 CPU内核

        除此之外,在Power 7每个内核中都拥有12个执行单元。每个执行单元包含2个整数运算单元、2个存储/读取单元、4个双精度浮点运算单元、1个支持VSX的矢量执行单元、1个十进制浮点运算单元、1个分支单元、1个寄存器单元。在Power 7 CPU中每个内核都有32KB一级指令和数据缓存、256KB二级缓存。所有核心共享32MB eDRAM三级缓存。Power 7初期频率就能达到3GHz~4.14GHz,并内置了两个4通道DDR3内存控制器,以提供最大100GB/s的内存带宽。值得一提的是,IBM Power 7中三级缓存是用eDRAM实现的,而非传统CPU中的SRAM。和SRAM相比,eDRAM能极大的节省晶体管数量和降低芯片面积,并且提供直逼SRAM的传输带宽—在微软XBox 360游戏机的GPU上,eDRAM就轻松提供了256GB/s的传输率。由于eDRAM的引入,Power 7在搭载32MB三级缓存时芯片面积也没有过度增长。和前辈Power 6相比,Power 7的主频已经从5GHz降低到了4.14GHz。但由于Power 7拥有更多的内核、更强的并发多线程能力,所以在性能上Power 7可以实现倍数的跨越。

智能为王 更聪明的Power 7

        Power 7是一颗聪明的处理器,IBM工程师为它赋予了更多的智能技术,在性能、功耗上取得更大的突破。

能自动优化核心

        在Intel推出Core i7 CPU的时候,TurboBoost功能成了产品重要卖点不断宣传。Intel的TurboBoost技术可以让CPU根据负载,在不同的内核负载下,自动提升单核频率以及整体频率以实现更快的运行速度。在Power 7上,IBM更进一步,提出了智能核心的概念。Power 7处理器拥有最多8个内核,因此IBM为Power 7设计了TurboCore和MaxCore两大运行模式。TurboCore模式可以对数据库或工作负载进行高度优化,同时采用4个内核运行,并把芯片中所有8个内核大部分资源放到4个运行的内核中,以提供更大的缓存和内存带宽,提升时钟频率,提高单核性能。

20100511173614993.jpg 

Power 7 CPU内核架构

        当不采用TurboCore模式时,所有Power 7处理器在MaxCore模式下,拥有多达8内核、每内核4线程,共计32线程的并行处理能力。你千万别以为智能内核只是简单的超频、关闭打开内核那么容易。在TurboCore模式下,虽然有4个内核会被关闭,但这些内核所占据的缓存和各种执行资源都会被释放,由工作中的4个内核统一调度,以实现资源利用的最大化。

夸张的8核32线程并行处理能力

        在Power 7中,IBM引入的SMT4技术可以在单一内核上实现4路同步多线程功能。这样一次就能吃下4条线程,极大地提升并行能力。但是所谓的SMT同步多线程,并不是真正的多内核多线程。

        只是通过不断的状态切换,以提升内核利用率的一种方式。这样的设计在并行度很高的应用中能获得立竿见影的效果。但在数据库等应用中往往会出现性能下降。过去我们大多采用手动打开、关闭SMT同步多线程的方法“因地制宜”。

20100511173656762.jpg 

Power 7提供4路同步多线程功能

        在Power 7上,IBM引入了智能线程(Intelligent Threads),可以根据工作负载要求进行设置不同的多线程模式,系统可以自动选择,也可以由管理员进行手动设置。这样就能在并发线程和执行效率中获得良好的平衡。必须指出的是,智能线程功能是需要操作系统支持的。只有在2010年4月问世的IBM AIX 6.1 TL05操作系统支持此功能—在现阶段的Linux等操作系统中,Power 7的SMT功能将完全无法使用。这些操作系统会把Power 7当作8内核普通处理器进行管理。

更智能的缓存和内存控制器

        从自动控制内核开关,到自动判断SMT功能是否打开,打开多少。在处理器运算能力调度方面,Power 7已经技压群雄。不过,IBM似乎还不满足于运算能力的灵活调度,他们想让缓存和内存系统也变得更为智能高效。 #p#page_title#e#

        Power 7处理器的L3缓存和Intel Core i7有许多相似之处— 例如每个内核都在L3 缓存中有自己的高速本地L3缓存区(Fast Local Region of L3 Cache,FLR-L3)。但每个内核之间,却依然能通过L3 缓存共享数据。根据IBM的说法,Power 7 32MB L3 Cache中,有4MB缓存的速度快和延迟低,提供的性能介乎于L1和L2之间,由此来确保处理器在众多内核并行工作时仍然有较好的性能。

20100511173749873.jpg 

Power 7内存访问机制

        为了压倒Intel在Core i7中集成的3通道DDR3内存控制器,Power 7干脆直接集成了两个4通道DDR3内存控制器,这意味着每个Power 7处理器最多能支持256GB的DDR3内存。在内存控制器内部,Power 7专门设计了芯片内DDR3 内存缓冲区。这样的设计极大地增加了每个Power 7内核所能管理的内存容量,并且实现了更高级别的冗余扩展和电源管理。由于采用了4通道内存设计,所以Power 7已经取消了对单根低容量DDR3 内存的支持。在Power 7上用户最少需要安装两条4GB DDR3 内存才能正常启动。

20100511173858463.jpg 

Power 7内存控制器

        值得一提的是,IBM Power 7中引入了新的低电压差分信号传输方式,这样让Power 7在支持海量内存和8个以上DIMM内存插槽时,主板布线不至于太过复杂。

强大的智能功耗管理功能

        几乎所有新的CPU都在电源管理上狠下功夫。Power 7也不例外。在Power 7上,IBM提出了智能功耗(Intelligent Energy)的概念,并在Power 7中延续了Power 6 CPU上大获好评的EnergyScale功能。Power 7处理器内部构建的EnergyScale单元能不断地搜集整个电脑的功耗数据,然后将其汇报给IBM Systems Director Active Energy Manager功耗管理软件。在Power 7运行的时候,IBM的功耗管理软件就能即时提供功耗数据和运行状态。用户甚至可以直接设定整部Power 7电脑最多能使用的功耗,以及最少能使用的功耗,以调整机房的耗电量。在智能功耗功能的帮助下,我们甚至可以让Power 7在夜晚以50%的功耗工作,在白天繁忙时段才满负荷工作。而Power 7处理器在空闲时,也将会自动进入“Nap”状态,关闭执行单元的供电、降低频率和电压以实现更低的功耗。

20100511174007214.jpg 

IBM电源管理工具IBM Systems Director Active Energy Manager

        根据IBM的测试,Power 7在引入一系列“智能”技术后,每瓦性能大幅提高,Power 7比相似的Intel x86系统提升2倍,比Sun SPARC服务器和相似的HP安腾服务器分别高出4倍和8倍

无限虚拟 内存倍增 Power 7独门秘籍

内存倍增术—Active Memory Expansion

        无需操作系统支持,无需做任何硬件改动。可用内存容量就能多50%?这可不是什么内存清理软件的广告词,而是IBM在Power 7上引入的Active Memory Expansion内存实时压缩技术的魔力。Active Memory Expansion功能可以通过Power 7电脑管理程序打开或者关闭。在打开Active Memory Expansion功能后,CPU将会实时压缩内存中的数据,以获得更大的可用内存空间。在IBM的测试数据中,Power 7打开Active Memory Expansion功能后,将会在SAP程序里面多出50%的可用内存空间,从而极大的提升系统性能。

20100511174102804.jpg 

打开AME功能后,内存会被分成压缩数据和非压缩数据两大区域

        Power 7将会自动压缩不被反复调用的数据,以实现可用内存空间加大。数据被压缩之后,将无法由程序实时调用,因此Active Memory Expansion内存压缩功能并无法适应所有类型的程序。

20100511174124542.jpg 

AME打开和关闭后的性能对比

        由于Active Memory Expansion功能完全由硬件实现,因此该功能对性能的影响微乎其微。由于打开内存压缩之后,可用内存有所增加,所以在高负载情况下,Active Memory Expansion对性能提升有明显的帮助。Active Memory Expansion可以针对每个内存逻辑分区打开或者关闭,操作系统将会自动分析哪些数据能被压缩后放入压缩数据池,哪些数据无法压缩。现阶段,要打开Power 7的AME功能,必须使用IBM AIX 6.1 TL4 SP2或更高版本的操作系统。 #p#page_title#e#

PowerVM—1000个虚拟机的威力

        在服务器和高性能计算领域,虚拟化已经成了标准配备。AMD和Intel CPU大多只能提供不到10个虚拟机同时运行的硬件虚拟化支持。而在Power 7上,IBM祭出的PowerVM虚拟化技术能让Power 7 CPU每个内核都能硬件支持10个虚拟机镜像。目前的8路64核系统可支持单系统最高640个虚拟机同时运行。今年年内,他们还将推出32路256核Power 7系统,最高同时运行1000个虚拟机—这个数量足足比Power 6提升了4倍。

结语:高性能计算硝烟再起

        就在Power 7问世以前,许多人都认为Roadrunner使用了Opteron+PowerXCell这样的异构设计,绝对是未来高性能计算的主流。而NVIDIA、AMD凭借GPU提供的海量并行能力,也有希望在其中分一杯羹。在IBM Power 7问世以后,我们才猛然发现,在高性能计算领域,循规蹈矩的提升CPU性能并非绝无可能。Power 7以强横的处理能力和突破性的功能似乎在向世界证明—传统CPU的生命力依然旺盛。在可以遇见的未来,高性能计算领域仍将是CPU集群主导、异构架构竞争的时代。

关闭此页
上一篇:IBM公布首款采用Nv GPU芯片超级计算机
下一篇:第34届超级计算机排行:Cray首次登顶、中国天河第五

相关文章

  • 05/09Xeon6代+4块GPU--图灵超算工作站GT450M介绍
  • 05/09汽车风阻测试模拟分析、算法,及服务器/工作站计算设备硬件配置推荐
  • 04/26高频交易(HFT)应用分析、算法,服务器/工作站硬件配置推荐
  • 04/25衍生品定价与风险对冲应用分析、算法,及服务器工作站硬件配置
  • 04/25量化交易策略应用算法分析、服务器工作站硬件配置
  • 04/24金融风险管理应用算法分析、服务器/工作站硬件配置推荐
  • 04/19油藏模拟软件的算法分析以及图形工作站/服务器硬件配置推荐25v2
  • 04/17大型3D设计软件CATIA-算法分析与图形工作站硬件配置
  • 04/17Cadence EDA主要软件计算特点分析,服务器/工作站硬件配置推荐
  • 04/16Synopsys EDA主要软件计算特点分析,服务器/工作站硬件配置推荐

工程技术(工科)专业工作站/服务器硬件配置选型

    左侧广告图2

新闻排行榜

  • 114万3千枚CPU:探访中国首台自主超级计算机
  • 2图形工作站和服务器有什么区别/差异对比
  • 3《华尔街日报》:超级计算机需求猛增
  • 4引领行业发展 NVIDIA谈GPU与高性能计算
  • 5超级电脑 500 强出炉:Titan 登顶、英特尔 Xeon Phi 协同处理器表现抢眼
  • 6IBM Power7 和Intel Xeon E7究竟谁更快?
  • 7CRAY 克雷超级计算机介绍
  • 8中国超级计算行业现状与未来发展访谈
  • 9192颗GT200+1068颗Nehalem: 295TFlops超级计算机现身
  • 10蓝色巨人的怒吼 IBM Power 7处理器浅析

最新信息

  • 结构、电磁、多物理场仿真计算相关的CPU指令集、硬件配置推荐
  • 图形工作站和服务器有什么区别/差异对比
  • 《华尔街日报》:超级计算机需求猛增
  • 14万3千枚CPU:探访中国首台自主超级计算机
  • 引领行业发展 NVIDIA谈GPU与高性能计算
  • 超级电脑 500 强出炉:Titan 登顶、英特尔 Xeon Phi 协同处理器表现抢眼
  • 中国超级计算行业现状与未来发展访谈
  • IBM Power7 和Intel Xeon E7究竟谁更快?

应用导航:

工作站产品中心 京东商城 中关村商城 淘宝商城 超高分可视化商城 便携工作站商城 ANSYS CATIA Microsoft INTEL NVIDIA 网站统计

公司简介-业务咨询-招聘英才-资料下载-UM-

本网站所有原创文字和图片内容归西安坤隆计算机科技有限公司版权所有,未经许可不得转载
陕ICP备16019335号 陕公网安备61010302001314号
Copyright © 2008-2023 , All Rights Reserved

首页
热线
商城
分类
联系
顶部