并行文件系统构筑高性能计算数据基石

时间:2009-10-23   来源:   网友评论:0   人气: 344 作者:

长期以来,磁盘带宽的增长速度都远小于计算能力的增长速度,而双核、四核乃至多核服务器的普及与发展让这种不匹配的差距进一步拉大。包括RAID阵列等,我们目前有多种技术可提高I/O性能,并行文件系统也是其中之一。它可以把多个结点上的磁盘组织成为一个大的存储系统,提供更大的存储容量和聚集的I/O 带宽,并随系统规模的扩大而扩展,在多种存储环境下发挥着重要的作用,尤其是集群结构的高性能计算领域。

高性能计算的存储基石
    随着网络的高速发展,如何管理高速网络上互联的计算机的集群系统,建立一种性能优越的并行文件系统是一件非常重要的事情,这样可以使整个集群系统可以具备高可用性、可扩展性和高可靠性,从而构建出上千节点的超大规模集群计算机,为整个网络提供性价比高的集群服务器和超强的网格节点。
目前各个研究机构和商业团体对并行文件系统的研究比较看重,取得了不少的技术进步和相关的商业产品,我们对整个分布式并行文件系统研究情况大致可以分为三类:商业用途的并行文件系统;公开的分布式并行文件系统;供研究的并行文件系统。
 
并行文件系统工作原理
    其中较为成熟的商用并行文件系统,像 IBM GPFSIntel PFS 等在性能,可用性上均有良好表现,但都价格昂贵,且需要特殊的存储设备的支持,给普通用户构建集群服务器带来困难。对于公开源码的并行文件系统,声誉最好的是 Clemson 大学和 NASA 实验室联合开发的 PVFS,它相对与传统的集中存储 NFS 具有良好的性能。由于它采用单一元数据服务器的集中管理方式和存储节点的静态配置,因而不具备容错性和动态可扩展性。
    另外,由 HPIntel 赞助,Cluster File System 公司开发的面向对象存储的并行文件系统 Lustre 吸收了很多文件系统(Code InterMezzo)的优点。它采用智能化的对象存储设备(Object Storage Device),在性能方面具有很大优势,在可用行和动态可扩展性上的表现仍然有待研究和完善。而 XFS是作为最早的 Serverlesss分布式文件系统,主要侧重于通过合作式缓存来提高读写性能,不具备系统的在线动态扩展功能,并没能真正实用起来。
    我们对这些系统分别做出分析,让我们可以更深入的了解并行文件系统的构成和功能。
xFS:走入象牙塔的学院派
   
    xFS
作为一种采用无服务方式以提供可扩展的文件服务的机群文件系统。它同 zebra 一样,xFS 集成了存储分组结构和日志结构,并且也实现了数据存储于元数据管理的彼此分离。
    xFS 通过全部分布数据存储于元数据管理的功能减少了集中的瓶颈。为了获得更高的性能,xFS 采用了合作缓存,一种通过各客户缓存的协调合作来替代传统的集中的服务端缓存。在 xFS 中,任何机器都可以缓存、存储或则控制任意的数据块,这种方式可以提供比传统文件系统结构更好的性能和可扩展性
xFS并行文件系统存取原理
    xFS 的一个主要的特点是它的合作缓存的算法,即是“N-Chance”算法。这种算法动态地把每个客户端的缓存分开成块,以提供给当地的和那些存储在合作缓存的应用程序的应用。算法的置换机制是综合应用了当地“LRU”信息和重复避免(duplicate avoidance)以决定所最应该置换的块。
    实际上,xFS 所应用的缓存结构与远端缓存结构以及“Feeley”描述的全局存储服务(GMS)具有相类似的构想。GMS “N-Chance”算法更具有通用性,但它没有提供一致性机制并且依靠一种集中式的算法来决定块的置换。Sarkar andHartman 提出了一种基于提示(hint-based)的合作缓存方式,这种方式可以减少客户机在通过提示调用和置换块是对管理者的依靠性。实验表明这种方式可以在


 

文章评论