英特尔:至强+MIC,我们为HPC做好两手准备!

时间:2010-08-15   来源:   网友评论:0   人气: 279 作者:

在一年一度的中国教育科研网格ChinaGrid 大会以(今年是ChinaGrid 2010)召开的前夕,作为大会主要赞助商的英特公司,也专门召开记者会介绍了英特尔在高性能计算(HPC)领域所取得的成绩,以及未来的发展方向。在当前越来越多的超大规模的HPC系统在向CPU+GPU混合计算模式迈进时,英特尔在这方面的态度的确引人瞩目,因此也增加了本次会议的含金量。

 

现在:至强生命力旺盛 GPU计算效率仍是瓶颈

本次参加会议的英特尔嘉宾包括英特尔公司高性能计算业务总经理 Richard Dracott,英特尔公司新任高性能计算业务总经理Rajeeb Hazra和英特尔数据中心事业部中国及亚太区业务总监Jason Fedder。 Richard Dracott是我们的老朋友了,而这次记者见面会也由他主讲。

英特尔公司高性能计算业务总经理 Richard Dracott做主讲,介绍英特尔当前在HPC领域的态势与未来的HPC发展战略

与会的英特尔嘉宾(左起):英特尔公司新任高性能计算业务总经理Rajeeb Hazra,英特尔公司高性能计算业务总经理 Richard Dracott, 英特尔数据中心事业部中国及亚太区业务总监Jason Fedder

英特尔处理器平台在当前HPC TOP500中的占有比例已经超过了80%

Richard Dracott首先秀出几个数据:第一,最新TOP500中基于英特尔架构的上榜系统为406套,基于至强5500的上榜系统为184套,排名前十的上榜系统中有4套是基于英特尔处理器。全新的产品今年发布的新产品,5600七套,7500两套,Nehalem架构的5500有182套。第二,每年TOP500都会更新,今年所有的更新系统里93%都是I/A架构,中国24套系统入围TOP500,23套都是英特尔的。第三,中国的快速进展,在Total里排名第二,仅次于美国。

虽然目前TOP500中的TOP10中还有6套不是基于英特尔的,比如AMD或是IBM的Cell系统,但Richard Dracott对此并不担心,他表示,TOP500有一个特点,排名前十的系统项目周期都是4-5年,任何新产品最终显示到TOP10里面的系统需要一个周期,随着Nehalem架构的出现,首先看到的是底下的这些系统大规模的都在采用Nehalem,越来越多看到排名靠前的系统采用Nehalem,是因为这个项目4-5年时间周期的原因。Rajeeb Hazra则补充到,因为现在排名靠前的系统趋势都是从过去只跑一个应用,负载一个应用,到现在越来越多负载多种应用。我认为I/A架构的核心优势未来会呈上升趋势在TOP的系统里,因为I/A系统跨多个应用程序的能力非常强,服务于多个不同应用特征程序能力非常强。随着越大的系统服务于越多的应用程序,I/A系统会成长得越来越快。而Jason Fedder则认为,这两年的趋势,中国在整个TOP500里成长很快,中国一定是TOP500里面的后续力量。政府在这几年的投入也很大,未来也会看到政府的这些大项目里,会采用I/A的技术越来越多,服务于中国高性能计算领域的成长。

在顶级系统中,英特尔平台的表现依然不俗

如果按去年6月、11月以及今年6月TOP500榜单会看到英特尔的新架构在榜单里接受程度增长非常快,从7%-19%到现在的39%。如果你去看TOP500的高端,能看到哪个厂商领先的位置。今天在整个TOP500里面,前十名当中有四套是英特尔的,同时其中两套都采用了5600,目前在TOP500里排第二名的深圳超算中心就是其中一台。在前30里面一共有七套新的系统,今年更新的系统,6套都是英特尔的。同时在整个中国的TOP100里面,去年11月份发布,英特尔占77%,对比2007年,英特尔只占有50%多,这是巨大的跨越。

不过在HPC领域,目前不能回避的一个话题就是GPU的应用,随着相关GPU的编程环境不断改善,GPU的大规模数量核心的优势也在不断显现,也因此给英特尔造成了很大的压力,对此英特尔如何应对呢?

英特尔强调,在当前HPC系统中,基于全CPU架构的系统仍然保持着最高的效率,而GPU即使是采用互联效率最高的Infiniband,综合效率也不及采用千兆网的系统,这是因为GPU+CPU系统是一个异构平台,异构的平台客户一定要付出,因为是两套完全不同的编程模型

从整个TOP500来看,Richard Dracott强调,除了看理论峰值之外都会看Linpack的效率,Linpack效率来说其实是把英特尔排在外面,英特尔在套装里,数量在下降,尤其是高端系统都是以及其他的专有架构。从上面的数据来看,基于Nehalem架构的效率是接近88%甚至达到90%,是整个系统里最高的,采用GPGPU一下下滑到42%。如果要达到同样FLOPS,用GPGPU的系统付出两倍才追上I/A的系统。抛除GPGPU和Nehalem其他系统,效率最高的达到78%,I/A架构从效率角度来说最高,除了Linpack之外,对应用也是同样的道理。

总结英特尔当前在HPC的现状与挑战,Richard Dracott指出了英特尔的核心追求,那就是以真实的应用性能为先。“我认为首先Nehalem的架构已经有几代产品,同时Nehalem架构根本没有在Linpack上有一个很大的性能提升,这我是不能的追求目标,我们追求的真实应用程序性能提升。真实的应用程序翻了两到三倍,因为Linpack在几代CPU之间没有很大的提升,因为那不是我们的目标。核数增加不是性能增加的唯一途径,HPC应用程序性能提升非常多,2-3倍。今天整个微架构里面已经在40%的预测里。第一,核数不是左右性能的唯一途径。第二,并不是所有的核都是一样的,英特尔也有众核的架构。第三,GPGPU今天市场中的很多比较是没有意义的,拿GPGPU跟英特尔的12核里面的1个核比较没有任何意义,拿系统级的比较才是真正有意义的!”

而在至强新品方面,Nehalem家族给出了满意的答卷。Richard Dracott表示,上半年我们很繁忙发布了很多产品,7500和5600对HPC是最重要的。大家都知道我们发布7500之后非常适合超级节点。在高性能计算里面,7项领域里面的数据集,包括生命科学里的基因比对,包括能源行业里的油层模拟都有一个共同特点,数据集比较大,处理这些数据集比较大的高性能计算时7500是最佳的选择,因为内存带宽和内存容量。包括浪潮在内的很多厂商都发布了超级节点机,浪潮有8路的,SGI甚至可以做到256路。5600对比5500不是非常大的性能跨越,采用了同样架构,制程工艺往前走了,有非常合理的性能提升,从20%-60%不等。


 

文章评论