定义:
数据生命周期管理(DLM)是一种在数据的整个生命周期中管理数据的方法,从数据输入到数据销毁。数据根据不同的标准被分为几个阶段,当它完成不同的任务或满足某些要求时,它会在这些阶段中移动。一个好的DLM流程为业务数据提供了结构和组织,这反过来又实现了流程中的关键目标,如数据安全性和数据可用性。
这些目标对于业务成功至关重要,并且随着时间的推移,其重要性也会增加。DLM策略和流程使企业能够为组织遭遇数据泄露、数据丢失或系统故障时的毁灭性后果做好准备。一个好的DLM策略优先考虑数据保护和灾难恢复,尤其是随着数据的快速增长,越来越多的恶意行为者进入市场。这样,在发生灾难时,一个有效的数据恢复计划已经到位,减少了对品牌底线和整体声誉的一些破坏性影响。
数据生命周期的5个阶段
图片来源:splunk官网
数据生命周期由其使用寿命期间的一系列阶段组成。每个阶段都由一组策略管理,这些策略在生命周期的每个阶段最大化数据的价值。随着合并到业务工作流中的数据量的增长,DLM 变得越来越重要。
阶段 1:数据创建
新的数据生命周期从数据收集开始,但数据源是丰富的。它们可能因 Web 和移动应用程序、物联网 (IoT) 设备、表单、调查等而异。虽然可以通过多种方式生成数据,但收集所有可用数据对于您的业务成功并不是必需的。应始终根据新数据的质量和与您的业务的相关性来评估新数据的合并。
第 2 阶段:数据存储
数据的结构方式也可能不同,这对公司使用的数据存储类型有影响。结构化数据倾向于利用关系数据库,而非结构化数据通常使用NoSQL或非关系数据库。一旦确定了数据集的存储类型,就可以评估基础架构是否存在任何安全漏洞,并且可以对数据进行不同类型的数据处理,例如数据加密和数据转换,以保护业务免受恶意行为者的侵害。这种类型的数据修改还可以确保敏感数据符合政府政策(如GDPR)的隐私和政府要求,从而使企业能够避免因这些类型的法规而受到任何代价高昂的罚款。
数据保护的另一个方面是关注数据冗余。任何存储数据的副本都可以在数据删除或数据损坏等情况下充当备份,防止数据意外更改和更故意的更改,例如恶意软件攻击。
第 3 阶段:数据共享和使用
在此阶段,数据可供业务用户使用。DLM 使组织能够定义谁可以使用数据以及可以使用数据的目的。一旦数据可用,就可以将其用于一系列分析——从基本的探索性数据分析和数据可视化到更高级的数据挖掘和机器学习技术。所有这些方法在业务决策和与各种利益相关者的沟通中都发挥着作用。
此外,数据使用不一定仅限于内部使用。例如,外部服务提供商可以将数据用于营销分析和广告等目的。内部用途包括日常业务流程和工作流,例如仪表板和演示文稿。
第 4 阶段:数据存档
一段时间后,数据不再用于日常操作。但是,维护组织数据的副本非常重要,这些数据不经常访问,以满足潜在的诉讼和调查需求。然后,如果需要,可以将存档数据还原到活动生产环境。
组织的 DLM 策略应明确定义应存档数据的时间、位置和时间。在此阶段,数据将经历确保冗余的存档过程。
第 5 阶段:数据删除
在生命周期的最后阶段,数据将从记录中清除并安全销毁。企业将删除不再需要的数据,以便为活动数据创建更多存储空间。在此阶段,当数据超过所需的保留期或不再为组织提供有意义的目的时,将从存档中删除数据。
延伸讨论:
另有多种说法,有称数据生命周期分4个还有6个阶段,但是以IBM为首的很多公司是按照以上的5个阶段管理数据生命周期的,ChinaStor也是认同数据生命首期管理的5个阶段划分更合理。
数据生命周期的6个阶段 包括:
1.信息的采集;2.信息的存储;3.信息的传输;4.信息的加工;5.信息的利用;6.信息的销毁。
参考资料:
1.https://www.ibm.com/topics/data-lifecycle-management
2.https://www.splunk.com/en_us/blog/learn/dlm-data-lifecycle-management.html
3.https://www.chinastor.cn/baike/bigdata/169105307230267.html