14万3千枚CPU:探访中国首台自主超级计算机

时间:2012-12-09   来源:   网友评论:0   人气: 1361 作者:

拥有为14万3千枚16核CPU;

存储容量高达2PB(1PB等于100万GB)

最高带宽达到69.6TB/s(1TB等于1000GB);

每秒峰值运算达1.07千万亿次,相当于20万台普通笔记本同时运算能力;
……

 显然,这不是一台普通的电脑,这是中国首台自主研发CPU和底层系统的千万亿次超级计算机神威蓝光
sw02.jpg 
 
在监控室中就能随时查看超级计算机的各个状态参数

 

 

10月13日,带着几分好奇,电脑报记者来到济南超级计算机中心,第一次了解到神威蓝光的诸多细节,也见到了与这台国产超级计算机朝夕相处的一群科学家。

走进超级计算机的心脏

没有想象中巨大,神威蓝光就是一个放大的“0”躺在机房里,走进它,如果不是旁边一排商业服务器的噪声提醒,从外面封闭的外壳难以察觉它的运行。

国家超级计算济南中心陈德训研究员像魔法师为记者打开了三扇门。

第一扇“0”型头部的一扇门,映入记者眼帘的是晶莹透明、手指粗细的水管,有序地排列在两排机架上,与地板下的制冷系统相连,用手摸一下这些水管,都是冰凉的感觉。

第二扇门打开,是配列整齐的CPU,每排8颗CPU,128个核,一个机架上是一万亿次的计算能力。

第三扇门打开的时候,就是一个空的椭圆形小房间,“这里有什么宝贝?”

“进来吧,感受一下安静。”陈德训邀请记者走进蓝光超级计算机的内部,“环形墙”原来是9个计算机仓和2个网络机仓,除了网络连线上的指示灯闪烁,这里简直可以当着是静修的空间。

“这就是神威蓝光的主机部分”,总工程师周明忠研究员说包含14万3千个核的主机只占用60平米的机房,与其庞大的计算能力相比,确实是小巧玲珑

神威蓝光从2011年9月整个系统安装加电测试以来,一直就是保持24小时的开机运行状态。

“关键是主机的CPU和底层软件系统全部是国内自主研发生产的,使中国成为继美国、日本之后,世界上第三个具有独立研发千万亿次超级计算机的能力的国家。”陈德训和所有研究员都倍感自豪。

最神秘的神威蓝光的CPU,是全球第一颗16核CPU,比AMD的要早6个月,并行操作系统、虚拟机管理器、多核编译器、并行编译器、海量并行文件系统、多核数学库则是自主研发的软件成果

此时是10月13日中午12:08,从主机房外监控室的屏幕上,看到此刻正忙着的CPU是7760个,系统为正在运行的项目配置了8704颗CPU,屏幕上绿色显示闲着的CPU主要分布在第3号机仓。

“正在运行的是什么计算?”

“我们并不清楚每个计算项目的具体运行内容,监控主要是看机器性能配置,发现有问题会及时自动处理。”

“通常一次运算要多少时间?”

“一天的计算时间是最短的项目,项目一周左右的计算时间比较普遍。”

“怎么知道在这里跑的运算项目没有暗藏恶意代码?”

“运行前有一套安全检测程序会保证机器安全”研究员对记者的疑问一一耐心解答。

超级计算应用每一天

 

还有什么比超级计算机的应用最接近人们的生活?每天我们要看的天气预报就是最广泛的应用。

“如果需要,我们可以推算1000年后的气候情况。”周总工说,人类自1850年有天气记录以后,就产生了一些列气象数据,专家们可以根据历史数据建立数学模型,推演过去1000年或者未来1000年的天气变化。

现在天气预报的数据实际上是每小时都会有一个新的计算结果,气象部门还要参考其他气象因素,然后才定时播报。

类似的应用还有海洋数据分析,可以了解海底地貌几千年前的形状,其他的成熟应用还有石油勘探、金融分析、农业上基因育种筛选、动漫产业等等。

济南超算中心的定位在为黄河三角洲及半岛经济服务上,全国一半以上海洋研究机构都在山东省,为海洋数据研究服务就是济南超算的主要任务。


 

文章评论