峰值10万亿次的集群服务器系统挑战计算化学苛刻应用

时间:2010-03-15   来源:   网友评论:0   人气: 506 作者:

不久前,基于刀片集群的浪潮天梭TS10000高性能服务器成功中标山西师范大学的计算化学应用项目。这套国内计算化学领域单台计算能力最强的集群系统,峰值达10.98万亿次每秒,是国内计算化学领域单台计算性能最强的高性能计算机,进入2009年国内高性能计算TOP100排名。这套系统的全面投入使用,使学校各个实验室的科研效率来了一次“大提速”。许多极具挑战性的计算课题,从耗时几个月的“持久战”变成了几天之内解决战斗的快速“闪电战”。而对于山西师大这所具有50多年历史的重点高校而言,在与兄弟院校的综合实力比拼中,科学计算能力和科研效率的跳跃式提升。

计算瓶颈凸显科研创新受制

山西师范大学创建于1958年,1984年更名为山西师范大学。建校以来,学校立足山西、服务全国、面向世界,秉承育人为本、崇尚学术的办学理念,坚持创新教育、实践教育的教育教学理念,现已发展成为学科门类比较齐全、培养体系比较完备、办学特色比较鲜明、向社会全面开放的省属重点师范大学。

山西师范大学在化学、材料领域拥有非常雄厚的实力,2005—2006年化学学科发表在世界化学类最高影响因子的论文在全国高校同类专业排名第16位。山西师范大学此次高性能系统主要用来做计算化学、材料科学方面的高性能计算工作,另外也为全校师生提供计算服务,主要应用软件是GaussianMaterials Studio等量子化学软件和一些其他计算软件。

但随着山西师大科研创新步伐的加快,海量的计算任务开始让学校现有的计算平台“喘不过气来”。为此,学校曾采购过一些小规模的计算集群,但随着各院系、实验室计算任务的不断增加,新平台又很快达到满负荷状态。许多大的计算任务由于排队等待和计算速度的原因,经常需要几个星期甚至一两个月的计算时间,由此造成的项目进度的滞后长期困扰着广大师生和科研人员。构建一套高性能、高可靠、高效率的大型计算平台也随之被提上了日程。

算例测试,看谁在铃响前“交卷”?

作为国内高性能计算领域的领导厂商,浪潮从一开始便参与到山西师大高性能系统的建设中。通过前期沟通,浪潮了解到,客户的主要应用软件是Materials StudioGaussian 03等计算化学软件包。计算化学类软件包,计算化学软件种类众多,不同软件对于高性能服务器有个不同的要求,这就需要HPC厂商根据客户的需要来搭建适合应用的HPC系统。

项目前期,客户提出要以3Gaussian软件为测试算例,根据测试算例的分析和计算结果来决定方案。据了解,这三个算例是Gaussian软件中最常用的三个算法,计算对象的化学结构非常复杂,其中一个测试任务便包括20960个基函数(计算化学中一般体系的大小用总基组函数数量表示,基函数数目越多,表示计算的体系越大),要完成这个计算任务,初步估计就需要1687.08GB的内存容量和17947.78TB的存储容量!如此大规模的计算任务对所有参测厂商的方案解决和硬件实现能力都是一次严峻的考验。

浪潮高性能应用工程师凭借多年来在科学计算领域的深厚积累,对Gaussian算法的应用特点进行了深入钻研,并从计算性能、效率、成本等多角度着眼,寻找最佳的解决方案。最终,经过缜密的软硬件选型和反复的调整优化,浪潮应用测试报告率先完成,而这竟是唯一一份在在测试截止时间之前完成的报告。浪潮也凭借对客户应用的深入理解和天梭TS10000高性能服务器的整体方案优势在本次招标中最后胜出。

对症下药量身定制

经过前期对客户算例的大量测试比较,浪潮摸清了山西师大本次计算平台建设的应用需求,并以此为依据明确了天梭TS10000高性能系统的设计思路。

鉴于计算化学应用需要强大的浮点运算能力,并对计算节点有着大内存、低功耗和协作程度高的要求,根据客户的应用特点和前期测试结果,浪潮将计算模块分为三类,即普通计算节点、厚节点和胖节点,分层次解决不同任务的计算需求。


 

文章评论