/ 中存储网

存储下一步进化将是自动化效用存储

2010-07-28 13:13:03 来源:中国存储网

目前的趋势是存储的硬件成本在下降,但是管理成本上,由于存储量上升,管理成本也在上升,因此,作为整个存储的管理费用还是非常之高。当然,管理的成本是可以运用新技术进行控制和调整的。

信息分层

通过一个分析可以看出,在我们管理的大量数据中,有80%在30天中没有被访问过,这些数据被视为非活动的数据。而活动的有效数据只有20%,80%的非活动数据会消耗大量资源,影响整体效率,这是我们适度提高效率降低成本的一个点。由此,引出层次存储的概念。

存储的容量和速度有这样一个关系,速度越快,整体的存储越小。在所有介质中,磁带机的成本最便宜,但是它的速度是最慢的。反过来,成本也一样,速度越快的,价格越高,速度越慢,价格越低。那么,可以考虑是否把80%的数据转到速度慢,但价格低的地方。这就是层次存储的概念。

我们可以把存储分成一级存储、二级存储,一级存储无论从速度还是价格都要比二级存储高,由此而产生的:数据服务怎么解决,数据和应用在不同的层次生成,如何分配?依据什么样的条件或何时在不同的层次之间迁移数据?文件以何种方式移动?资源如何解决归档,保持一致性?等等。这些问题都值得探讨。

业务驱动

信息生命周期管理(简称ILM)的价值就是希望能够降低成本系统的总体拥有成本。总的来说,数据信息生命周期是数据根据不同的阶段分成一级存储二级存储的迁移,这并不是简单的迁移,需要通过业务驱动。

数据可以分为几种类型,一类是文件型的数据,属非结构化数据;一类是数据库的数据,属结构化的数据;而像邮件和短信等,属半结构化的数据。不同类型的数据有相应的迁移策略。文件级的数据可以用分离软件,可以直接在不同的存储之间穿越,但是像数据库等结构化数据,作为第三方不太容易迁移,需要在内部增加迁移的模块,像邮件和短信这种半结构化的数据可以通过接口来迁移。

核心是分类和策略服务

在整个迁移的过程中,真正的核心是分类和策略服务。

以学校举例,学生要查课的信息,这一层的服务,要求查询响应的时间非常短,可能在一秒钟之内,信息的时间应该是储存处理,可能是30天,或者更短一些,这部分信息需要备份保存。一旦出现故障,整个业务就停下来了。这一层级是服务层的,不仅仅是存储反应时间快不快的问题。第二层的数据是一些文档,这些文档的数据反应不会以秒计。第三层的数据则是归档数据。因此,要根据单位的需求确定不同的服务层次,通过不同的存储设备、软件和架构使用户得到服务。

信息生命周期管理的目标就是效用存储,根据服务的分层,用户的分级,业务的优先级,把整个数据放到不同的管理层次,从某种层面上,它就是一个服务层次分类的概念。

三阶段实现存储策略

分级存储是一个比较好的技术选择,可以充分利用现有资源,不需要一次从无到有大规模的投资。比如5TB的空间存储,大概需要20万元,但是由于80%的数据是非活动,迁移4TB 数据到低端存储系统,每TB投入20,000元,将节省70,000元;如果迁移到磁带上,每TB投入2,000元,将节省142,000元,这样,七八万元就可提供需要的服务水平。并且,80%的非活动数据迁移之后,整个数据的备份和恢复需要的时间也会大大缩短。

存储策略的实现也是分几个阶段。第一阶段是静态的数据,可以将存储系统划分为多个层次,将应用关联到相应的层次;第二,进行阶段化数据迁移,可以为同一应用构建多级存储架构,实现在各层之间定时批量迁移数据,例如: 归档离线;第三,是进行动态数据迁移,动态迁移是更高的一个层次,通过自动化软件把不同类别的存储层次迁移。可以为同一应用构建多级存储架构,在各层之间批量迁移数据,而针对不同的数据有不同策略。比如文件的存储,非结构化数据存储可以通过迁移软件一级二级进行迁移。又如邮件系统,由于有一级存储,二级存储,通过第三方的引擎分析邮件的类型,根据时间变化的规律,把邮件分到一级或者二级处理。半结构化数据的邮件存储,也可以直接把数据保存归档。