目前,多数企业已建成一体化企业级数据中心Data Center平台,能够满足日常业务的需求,但大数据时代对传统数据中心Data Center的数据存储能力、数据处理能力、数据交换能力、数据展现能力以及数据挖掘能力都提出了更高的要求,大数据对传统数据中心Data Center提出了新的挑战。
1、非结构化数据的重要性越来越大
传统数据中心Data Center的数据一般来源于用户通过个人电脑、移动终端、POS机等常规渠道生成的结构化数据。而大数据时代数据类型多样化,半结构化数据和非结构化数据呈现爆发式增长,且增长速度远远超过结构化数据。这些通过传感器、监测仪、机读仪器等机器设备产生的天气、位置、音频、文本等海量复杂数据越来越多,企业开始使用这些数据来改进产品、提高效率、寻找缺陷,其数据的重要性将会越来越大。
2、数据的时效性要求越来越高
传统数据中心Data Center的数据更新周期基本为日、周、月,辅以少量的实时数据更新,商务智能也基本以日、周、月、季度和年为时间维度的静态数据分析。大数据时代,对数据的处理速度和数据的时效性提出了更高要求,而当今社会日益加剧的商业竞争让每个企业都希望能通过实时分析报表和结果数据来随时掌握企业运营状况,并迅速作出决策和判断。以电力电量平衡测算为例,需要实时采集电网数据、实时分析、实时计算,快速测算结果,并反馈至电力调度部门进行有序用电执行预案的实时决策,假设相关数据获取不及时则会大大影响调度部门对有序用电的分析和决策。
3、大数据改变数据分析模式
传统数据分析以结构化数据分析为主,业务分析更是以被动式信息接受为主。大数据时代下,随着数据的累积和增加,可做的分析和对比也越来越多。通过对大量的数据进行分析,从而揭示数据之间隐藏的关系、模式和趋势;通过结构化数据、半结构化数据、非结构化数据的融合关联分析,实现文本分析、数据挖掘、图形分析、空间分析等数据分析模式,为决策者提供不一样角度不一样形式的分析判断依据。
4、大数据影响信息基础架构
目前电力企业数据中心Data Center主要以Unix为代表的操作系统服务器硬件平台、以Oracle关系型数据库为代表的企业级数据存储平台和以BW(数据仓库,Business Warehouse) ,BO(业务对象,Business Object)为代表的企业级商务智能分析平台组成。随着智能电网的发展,半结构化和非结构化数据呈现出快速增长的势头,大量部署的传感器、监视器、智能交互终端等设备都可以成为数据来源,并且其数据量大大超过了结构化数据。大数据时代下,分布式处理的软件框架使得XgG服务器开始大行其道,列存储、内存数据库、NOSQL存储、流计算等技术将成为数据存储和处理的主流技术。
传统数据中心Data Center商务智能专注单一数据集的分析处理,这造成了不一样类型数据之间的割裂。而大数据分析聚合多个数据集,注重不一样类型数据的融合集成与关联分析,是一种综合关联性分析。因此,传统数据中心Data Center分析处理架构已无法适应大数据时代的分析要求。