如今是数据量爆炸性增长的时代,上百GB甚至TB、PB的数据资料量已不稀奇。特别是视频、音频、图片等大量非结构化数据的指数级增涨,使得如何有效解决企业资料的存储与安全成为企业管理者所必须重视的问题:
非结构化数据的存储困境
首先就要了解我们需要存储的数据对象。就目前而言,企业需要存储的数据主要分为两个部分:一是基于数据块的结构化数据,二是基于文件型的非结构化数据。
据IDC数据统计显示:在过去三年中,企业部署的应用类型发生了很大的变化。基于更以文件为中心的存储基础架构而运行的一组新型应用(例如Web服务器、电子邮件、电子记录和数字媒体)在公司的企业数据中正占据越来越高的比例。
对于爆炸性增涨的非结构化数据,如何有效地存储管理数据,如何有效地节省存储成本,这成为非常重要的问题。
我们可以从一个具体的例子可以看出,在国内一家移动通讯公司的通信业务里,每打一个电话会有四个文件的存储,这样一个月会出现200亿个新的文件。另外,中国政府的规定是所有的文件必须保存三年,如果这些数据都被存储在一级存储中太贵了,企业负担不起,而最终导致的结果可能是谁都不能再打电话了。
在这种情况下,我们应该怎么办?针对这个问题,F5中国北方区技术经理杨明非给出了这样的解决办法:将文件三个月之后会被自动的存储到二级文件存储里,实现一级存储与二级存储的组合应用,这样,就可以有效的解决存储高成本问题。
文件存储虚拟化:有效的非结构化数据解决办法
其实,针对非结构化数据,有专门的解决办法,这就是文件存储虚拟化解决方案,安全不同于传统数据存储管理产品的方案。
在NAS存储环境下,前端应用服务器与后端存储介质的存储访问关系非常复杂,管理效率低,容易出错。应用服务器直接访问存储介质,不能对存储介质进行有效管理。
在NAS模式下,如果我们当前的NAS存储容量不够了,需要增加新的NAS,那只能是配置好新的NAS,然后再通知所有的客户端,添加一个新的网络存储节点,然后把新的文件放到新的NAS上。这中间可能还会存在很多问题,比如目录的完整性需要保持,用户需要在不同的存储节点中去找数据等。
在这种情况下,我们就可以在前端应用服务器与后端存储介质之间,虚拟化一个文件管理系统出来,这就是"文件存储虚拟化"。
通过文件存储虚拟化平台,将后端存储介质虚拟化成一个存储池,此时,只需要在ARX上通过配置添加一个新的NAS文件系统,ARX就可以自动的将所有用户的新文件都存放到新的NAS上,但对于客户端来说,他看到的目录仍然是完整的一个目录下的多个文件,但实际上这些文件是物理存储在不同的NAS上,从而实现对存储的有效访问。