存储技术概述——集群存储(2)

时间:2009-07-10   来源:   网友评论:0   人气: 359 作者:

与传统的NAS文件服务器或集群存储系统相比,集群文件服务器的不同之处在于硬件与软件结合起来的方式。集群文件系统可以安装在应用服务器上,或者专门的设备或服务器上,将它们转化成为存储服务器(本质上变成一个集群文件服务器)。有的集群文件服务器,如惠普的PolyServe和IBRIX的Fusion,都是混合的系统,从而能够使集群式或者平行文件系统在符合业界标准的服务器上部署。

有的厂商拥有双重或多重存储控制器、存储引擎、NAS或者网关,使用主动/主动模式(两个控制器同时工作)还是主动/被动模式( 其中一个控制器是备用的)。他们声称具有集群存储系统。我想说的是,如果你将一对存储处理器或是控制器等同于一个集群,你就将不得不考虑每一个具有两个节点以上的存储系统是一个集群……这样的话,几乎包括了市场上所有的中档存储区域网络(SAN)、直连式存储(DAS)以及NAS存储系统。

还有更多的厂商能够提供集群NAS存储(换言之,超过基本的故障接管),更为重要的是,他们还可以提供集群文件服务器。NAS,就本质上来说,是一种安装在硬件之上的文件服务器的解决方案。有某些情况下,它具有能够将硬件转化成为集群文件服务器的能力。能够提供NAS硬件/软件的解决方案,同时支持集群文件系统和底层硬件的产品包括NetApp的GX,BlueArc的Titan以及Isilon和Panasas的集群存储产品.

Isilon和Panasas运用的是专有的处理器和存储器。BlueArc使用的是优化处理器,这些处理器附属于由多个厂商提供的底层RAID控制器,并且可以共享访问。还有的产品利用安装在符合业界标准服务器上的集群文件系统,将服务器转化为存储服务器,例如惠普的PolyServe和IBRIX的Fusion。

SAN文件系统

随着文件大小和数据规模逐步达到TB和PB,用户也开始寻找一种新的方法,以便在不同的主机之间存储、访问和共享文件。集群和存储区域网(SAN)文件系统也因此应运而生。

厂商们已经制造了一些软件和硬件设备,它们可以把不相干的文件系统融合成只使用一个命名空间的文件系统。用户可以访问并共享其他用户的数据,而无需考虑是什么介质或其所处的是哪台主机。

这些设备和软件所使用的技术就是人们所熟知的集群和SAN文件系统。与分布式文件系统相比,此类文件系统有如下几大优势:因为数据不需要从一个文件系统拷贝或复制到另一个文件系统,通过集群系统共享应用和数据的任务执行起来要比在单独的设备上执行快得多;集群可以为文件和文件系统提供更多的空间;因为只需要管理一个文件系统,而不再是每个存储设备或主机都需要一个文件系统,管理也更容易了;如果集群内的某台服务器出现了故障,另一台服务器就可以把它的工作接手过来,故障恢复也成为了现实;用户也可以同时对位于其网络上的存储设备里的所有文件进行访问。

尽管集群文件系统具有上述优势,但是,它仍有一些地方需要改进。

有用户评价说,集群文件系统非常复杂,此外,它们还需要技术人员很好的支持和专业技能来对其进行体系结构的设计,并使其运行起来。

与之相比,SAN文件系统能够把服务器与存储进行连接,并对文件系统环境进行“虚拟化”。

另一用户拥有的50TB数据是由ADIC公司的StorNext FS负责管理的。它正在进行科学镜像数据收集。

该用户的文件相对来说比较大,最大可达1GB,因此,使用分级存储格式来存储。其IT主管Terry Duncan说,“我们的大型系统里有数百万份文件。我们希望多个系统能够以非常快的速度同时查看相同的数据。”

Duncan说,使用SAN文件系统之后,管理更容易了。如果我们不能把文件编写到一个公用空间,以便让数个系统同时访问这些文件的话,就很难以我们需要的速度来处理这些数据;如果不能拥有单一的命名空间的话,就得花大量的时间来回移动500GB的数据并对其进行分析。


 

文章评论