大数据业务有多大?这取决于你如何“切块和切片”(利用)它。
IDC想出了一个非常精确和正式的大数据定义,将保持一切来自被抛出的(信息)进入到大数据集。对于某些方面的思维,大数据不过是网络化世界新的ERP,对其他人来说,仅仅是过去的四十年间在各种不同的系统上,已经创建的后端办公系统的下一个逻辑延伸。
IDC认为,有3种大数据系统的指标,对于它用于分析市场。
•首先是,该系统具有收集超过100TB的数据,“收集”这个词,在许多情况下表示公司存储在内存中并处理的数据,而没有将它们推送到磁盘,就像发生在联机事务处理(OLTP)和数据仓库系统中的。大数据也包括运动中的数据,不只是静止的数据(不论是在磁盘上或在主内存中),IDC把系统中由公司创建的采集和实时处理、数据流,如用于配合交易系统使用的系统,针对原始数据和分析来推动商业,或者针对强大分布式网络的智能测量系统。
•IDC也没有要求数据集达到一定大小,才能称为“大数据”,但确实需要这些被认为是大数据的数据集增长率达到每年60%或更高。大的数据是不只是对数据集,而且是带有爆炸性质的数据集。
•最后,IDC要求大数据系统被部署为“向外扩展(Scale-out)架构”,这意味着服务器和存储的集群,并且大数据系统至少要有两种不同的数据格式。
当你查看由IDC定义的服务器、存储、网络、软件,以及服务组成的这个大数据市场,你会得到一个在2010年价值32亿美元市场,并预计将以39.4%的年复合增长率增长五年以上,达到2015年的169亿美元。IDC表示这一增长速度,在同一五年跨度为整体IT市场的7倍之高。
IDC存储系统方案副总裁Benjamin Woo,在一个声明副随的大数据市场分析中表示:“到2015年,由于软件和服务制造了大量的市场机会,大数据部署的基础设施技术,预计增长略快达到44%的复合年增长率”。特别是存储,显示了强劲的增长机会,到2015年61.4%的复合年增长率。收入的显着增长速度背后是推动基础设施投资的大量新的开源项目。”
IDC估计,相比软件的34.2%和存储的61.4%,大数据市场的服务器部分增长慢一点,超过五年的复合增长率为27.3%。