Nehalem:改变千万亿次高性能计算的未来

时间:2009-03-29   来源:   网友评论:0   人气: 1650 作者:

Nehalem的出现几乎是一种必然:传统的FSB已经越来越捉襟见肘,无论是内存带宽还是内核之间的通信,如果Nehalem新的微架构不出现,我们几乎难以再看到处理器的性能能够往前迈出如此一大步。

隶属于至强系列之下的Nehalem,是未来1~2年英特尔公司在服务器及企业关键型运算平台上最强有力的武器,这项武器的出现被许多媒体解读为跨时代或是“具有突破性”的,毕竟,在目前所能见到的各种关于Nehalem的评测数据中心,它已经给了我们太多的惊喜。

不过,既然Nehalem已经出现,我们不免想到一个至强必然会进入且会深度切入的市场——高性能计算,而当人们对Nehalem的发布一直都关注在直连架构上的时候,我们是否应该考虑一下Nehalem对高性能计算市场会造成什么影响呢?

尤其是在现在我们谈起千万亿次的时候,我们是否能够从Nehalem身上看到哪些千万亿次的影子呢?

千万亿次与Nehalem的亲密接触:为未来设计处理器

在此之前与英特尔公司顾凡的采访文章中,我曾提到顾凡对于目前高性能计算市场的一些看法和对千万亿次计算的前瞻性讨论,顾凡在谈起千万亿次计算的硬件准备时曾谈到,单从处理器性能上来说,处理器的硬件储备几乎已经完成,换句话说,如果用简单的堆积方法的话,制造一台千万亿次计算机并非是难事,但问题是,如何让硬件架构,让今天的架构能够成为明天的架构,甚至为明天的计算在今天就构建处理器架构。

顾凡的话并没有错,现在TOP500的冠军Roadrunner已经可以达到千万亿次,但问题是,最根基和大众化的非金字塔尖上的高性能计算如何能够保证从百万亿次到千万亿次的过度,用户能够保证在合理的拥有成本和架构延续性下,完成未来的千万亿次。

我们可以试想一下,如果我们今天单纯为了今日的百万亿次计算就构建一套难以在未来迁移到千万亿次计算的系统,我们将会在每一次高性能计算发展的阶段,进行一次几乎全新的架构升级与系统解构,这样的工作量恐怕不是一件简单的事情——而最可怕的是,但我们的硬件架构不断改变的同时,我们的应用程序则将会更加频繁的跑来跑去,最终的结果,必然会导致应用程序与高性能计算集群架构的脱节。

之所以说Nehalem是“为未来设计的处理器”,其来源可以追溯到英特尔公司2008年的IDF大会上,当时,英特尔高级副总裁兼数字企业事业部总经理帕特基辛格在《从千万亿次运算到毫瓦》的演讲中曾经提到,Nehalem是英特尔可动态扩展的全新处理器微架构+这就是重中之重:借助高达 8MB 的三级缓存、7.31 亿个晶体管、Quickpath 互连技术(数据传输率最高达每秒 25.6GB)、集成内存控制器和可选的集成图形处理功能,采用 Nehalem 微架构的处理器将彻底从笔记本电脑一直扩展到高性能服务器领域。

在采访顾凡时,他曾经提到,高性能计算对处理器的要求,或者说对整体平台的要求之一,就是可以“由小变大”——我们认为,由于Nehalem将会是一种注重Scalability可伸缩性的架构,一方面它可以根据需要动态地管理核心、线程,另一方面它的架构可以根据需要变得很复杂,可以满足高性能计算的要求。Nehalem还增强了缓存的共享性以及能源管理特性,并再次提供了超线程技术。Nehalem最令人印象深刻的就是其可扩展性了,这个特性由两部分组成:Intel QuickPath Architecture快速路径架构和Integrated Memory Controller集成内存控制器。

因此,Nehalem完成了我们对千万亿次计算的一个最主要的要求:可以动态的扩展,可以从很小的节点数增加到很多的节点数。

Nehalem影响千万亿次的关键点:QPI与IMC

未来,Nehalem可从双核扩展到八核,并通过同时多线程(SMT)技术实现 4 到 16 个线程的并行处理,而Nehalem 微架构产品的内存带宽将是当前性能最高的英特尔至强处理器系统的4倍。

这只是Nehalem的性能和指标的一小部分:它的其他特性包括支持 DDR3-800、1066 和 1333 内存,SSE4.2 指令集,每个内核拥 32KB 指令缓存、32KB 数据缓存、256KB 二级数据和指令低延迟缓存,以及全新的二级 TLB(旁路转换缓冲)层级。


 

文章评论