随着IT技术的发展,存储数据的爆炸式增加,存储的地位变得越来越重要;存储部分逐渐地从应用系统中分离出来,形成了专门的存储系统,进而形成了专门的存储网络(SAN)。IT技术在经历了以处理器为核心和以传输技术为核心的阶段以后,目前已进入了以存储技术为核心的发展阶段。考核一个存储系统的性能指标有很多,如容量、可扩展性、可伸缩性、可管理性、高可用性等,最重要是存储系统的容量。而通常增加存储系统容量的方法有两种:
①增加存储设备;
②提高存储系统的容量利用率。
显然,提高存储系统的容量利用率是一种既不增加成本又可以增加容最的好方法。研究表明,在目前的存储系统中,容量的利用率都很低,以传统磁盘存储为例,考虑到用户数据的不断增长,实际上平均40%-50%的磁盘容量从未被利用过,大量的、宝贵的存储资源被浪费掉了,没有发挥应有的作用。同时为满足系统性能和以后升级扩容等方面的要求,客户一般购买超过实际数据容量需求3-4倍的磁盘,用于磁盘镜像等附加功能,从而造成了存储空间资源的极大浪费。
这种现状的主要原因是:目前对存储资源的分配方法是静态的,即按照用户的估计(往往有很大余量),预先把存储资源划分成分区或卷,而后以分区或卷为单位将存储资源分配给用户。在以后的使用过程中,分配给用户的存储资源中会有很大一部分长期处于闲置状态。更糟糕的是这些闲置的资源无法被其它用户使用,从而造成了存储容量利用率低下的现象。如果能够采用动态的方法按需分配存储资源,毫无疑问,将会极大地提高存储资源的利用率,从而在不增加成本的情况下增加存储系统的容量。而要采用动态的、按需分配的方法就必须将存储系统虚拟化,即采用存储虚拟化技术。
1 存储虚拟化技术
1.1存储虚拟化技术概念
传统的存储虚拟化就是将存储网络(sAN)中各种分散的、异构的存储设备映射成一个单一的连续编址的逻辑存储空间或一个虚拟存储池(virtual storagep00l),并将虚拟存储池的访问接口提供给应用系统。
该映射操作是由存储虚拟化中问件SVM(storage virtuali—zation middleware)来实施的,SVM屏蔽了所有存储设备的物理特性,由此,存储网络(SAN)中所有存储设备对主机透明,主机只与分配给它的逻辑卷打交道,就像访问本地逻辑存储单元LUN(logical unit number)样访问虚拟存储池,其结构如图1所示。
图1 存储虚拟化结构
1.2存储虚拟化的实现方法和方式
存储虚拟化主要涉及3个基础性的问题:
①虚拟的对象;
②进行虚拟的位置;
③虚拟的实现机制,如图2所示。在存储系统中,虚拟的对象主要有磁盘、磁带、文件系统、数据块、数据记录等,我们则集中考虑物理存储设备(如磁盘、磁带等)的虚拟化问题。
图2 虚拟对象位置及机制
目前虚拟存储的发展尚无统一标准,从系统的观点来讲,有3种主要的存储虚拟化的方法枷:基于主机的虚拟存储;基于存储设备的虚拟存储;基于网络的虚拟存储。由于基于不同的实现层次,3种存储虚拟化方法各有特色:基于主机的虚拟化软件提供独立于存储网络的互连能力和存储资源,但必须一个服务器范围内进行管理;基于存储设备的虚拟化能够利用厂家存储的特定功能和特点,但缺乏异构存储环境的互操作能力;采用应用形式或居留于交换机中的基于存储网络的虚拟化提供虚拟功能的集中,但为了防止出现元件失效需要采用冗余来提供高可用性。从发展趋势看,基于主机的和基于存储的虚拟化技术目前已经相对成熟,而网络虚拟化是一种新的技术,它独立于主机和存储设备,给用户带来了很大的灵活性,其未来的发展空间最大。
从存储虚拟化的拓扑结构来讲,有对称式和非对称式两种,根据实现机制又分为带内和带外两种基本类型。两种方式的主要区别在于存储网络中数据FO与控制信息是否使用同一通道。对称式结构存储虚拟化(又称带内存储虚拟化),是指存储虚拟化控制设备,交换设备与存储软件系统集成在一台专用的服务器中;非对称式结构存储虚拟化(又叫做带外存储虚拟化),数据和命令信息使用不同的通路,就是在存储区域网络中(或主机系统以太网)设置专用于存储控制的服务器作为元数据控制器。