/ 中存储网

简化数据中心的迁移和整合工作

2013-09-18 00:00:00 来源:中存储

企业数据的迁移工作是相当费时且造价昂贵的。但是,当一家企业正面临着需要迁移到新的存储平台或整合多个环境时,他们其实是可以通过废弃过时的老旧数据来避免某些不必要的迁移工作的。

这些毫无价值的数据可以很容易地占到总容量的30%-50%。现在,新的数据分析技术使得数据中心的管理人员们能够在迁移和整合之前删除那些没有商业价值的数据。数据分析是针对非结构化的用户文件的元数据分析。数据分析通过从关键元数据中进行提取,提供高效和具有成本效益的指标(通过NFS/CIFS/NDMP协议)。最后,相关的修改/访问日期、所有者、位置、尺寸大小甚至是重复的内容都可以通过自定义设置进行查询。

此外,将数据分析软件与ActiveDirectory/LDAP进行整合,可以使得报告和分析按照用户群体和部门来归纳,区分有效与无效(已离职雇员)员工信息。

数据分析软件与现有的分析解决方案大大不同。现有的分析解决方案只是通过存储资源管理(SRM)工具分析访问日志、网络元数据来对功能进行分析,而不是数据。数据分析能够深入文件内部,甚至如果有需要的话进行对全文资料进行分析,并提供全面的信息访问文件。管理文件时,这是唯一能够通过提供相关知识、以及分析工具和处置能力的解决方案,需要有效地进行数据迁移。

自定义分析

数据分析提供了灵活的过滤器、查询和动态汇总报告,为需要做出适当决定的企业数据中心提供相关知识背景。

过滤器可以应用到特定的位置/目录、文件类型、用户等等情况。一旦这一焦点被定义了,动态的总结报告可用来提供数据分析。例如,在共享的服务器上执行人力资源数据分析,过滤器可以应用于集中在人力资源使用的目录,然后根据数据产生的年限总结生成报告。

使用这些报告的动态功能,可以进一步筛选年限超过三年以上,且未被访问的数据,进而生成一个新的关于数据业主和文件类型的总结报告。这种方法会根据数据年限的详细信息产生一套人力资源数据分析,帮助企业掌握谁持有这些相关的数据,以及数据是什么类型的相关细节。

这种分析是相当灵活的,可以让用户了解数据的当前状态,以及它是如何发生改变的。通过查找并管理已经失去其商业价值的数据,以了解哪些数据必须进行保存归档,数据分析所提供的工具,可以把数据的报告和处置工作做得相当的好。

分类处理

分类有助于从那已经失去了了其业务价值的数据中区分并找出仍具有业务或法律价值的数据。同时也可以将诸如iTunes资料库里的东西和其他浪费数据中心存储容量的个人文件都整理出来。

需要废弃的数据:此类数据包括:三年或三年以上的离职员工且未在被访问过的数据信息。以部门的基础分析是否还有价值或应当被审查。例如,如果这些数据信息是属于企业的研发部门的,并具有潜在的研究价值,那么这些数据则可能需要针对元数据进行额外的调查报告。而如果数据信息是属于行政部门的,且已经没有长期的商业价值或合法持有的要求,这样,这些数据就可以删除了。

老旧数据:非结构化的网络数据占到相当重要的一个部分。这些数据是企业现有员工的,但这些数据有超过三年的时间并没有被访问过了。老旧的数据并不一定意味着它们没有商业价值,但如果员工目前不使用它们,那么这些数据很可能需要被清除或作进一步的离线处理以待以后的分析。以部门或个人为基础对这些数据进行归类,以便实现长期的保留。

冗余数据:在部门之间或者多次被员工共享的文件,会在企业网络中创造散布的副本。数据分析可以为每个文件生成一个唯一的文件签名,已决定其是否已经存在一个完全相同的副本。重复数据往往容易造成服务器的堵塞。如果数据是冗余的,并且没有被访问,其完全可以被列为可以删除之列。

私人数据:企业员工有时会在他们的台式机上甚至网络文件共享中存储个人内容。例如照片、或者从iTunes资料库购买的多媒体文件、或者是下载的电影,这些内容会占用宝贵的空间。以具有真正的商业价值的企业数据的方式管理这些个人内容无疑是相当大的资源浪费。所以请务必识别这些个人数据内容的拥有者,并通知其部门经理。

需要存档的数据:需要存档的数据往往是那些具有长期的商业价值的数据,并需要根据企业的相关政策和监管要求,予以妥善保留,而不是将其从服务器转到另一台服务器。例如“X项目”团队成员自项目组成立直到项目结束的所有文档和电子表格均可以被迁移到归档中,以支持监管的要求。

活跃数据:活跃数据是企业在过去三年内创建的内容。它们具有最高的被再次访问的可能性,应该做迁移整合期间将这些数据进行整体迁移。

数据配置选项

利用动态报告和缩小数据集的分析,可以更容易的管理内容配置。使用内置的工具来进行数据的删除,迁移,存档,或导出CSV文本文件,您可以很容易地实现对现有内容的管理。

内容的删除应该以及其审慎的方式执行。一旦某一个子集的内容以获得相关法务或合规部门的可以被清除的确认之后,这些数据就可以被删除了。这一过程必须是审慎做出的,包括工作日志中所涉及到的员工信息,时间和特定的文件均需要存储在一个数据库中,以备将来参考。

数据的迁移也可以进行管理,包括将内容移动到一个更合适的平台,对现有的数据进行归档保存,或把它们转移到一个云存储库。这一策略使数据可以按照价值和访问需求进行分层,让昂贵的存储空间只存储更重要的内容。

流线型的迁移和整合

企业不断的迁移和整合数据中心。而在那些已经失去了商业价值的数据资源上过多的投资无疑是一种巨大的浪费。一台典型的40TB的服务器可能容纳了22%需要被废弃的数据,14%的老旧过时和失去了商业价值的数据,24%的重复内容,以及6%的员工私人数据,如度假的照片和电影等。这可以解释为什么企业的数据中心浪费了超过50%的容量。

迁移或整合管理可以帮助您的企业减少一半的容量,必将释放巨大的资源,削减开支。而随着时间的推移,这笔费用的累计无疑是相当可观的。