根据最新的Forrest报告,有很多公司都在努力挖掘他们拥有的大量数据,包括结构化、非结构化、半结构化以及二进制数据等,探索对大数据的深入利用。下面是报告结论的其中一点:
大多数公司估计他们只分析了已有数据的12%,剩余88%还没有被充分利用。大量的数据孤岛和分析能力的缺乏是造成这种局面的主要原因。另外一个难题是如何判断数据是否有价值。尤其是在大数据时代,你必须采集并存储这些数据。一些看起来与业务无关的数据,如手机GPS数据,将来也可能是座金矿。
所以,大量公司都寄希望于使用Hadoop解决如下难题:
采集并存储与公司业务职能相关的所有数据。支撑先进的分析功能,包括商业智能,采用现代方式对数据进行先进的可视化和预测性分析。将数据快速分享给所需之人。整合多个数据孤岛帮助组织解答以前根本没人提过,甚至是未知的复杂问题。容纳持续增长的数据量和新数据源。Hadoop支持解决方案规模的快速、有效扩大,使不断增长的容量、速度以及多样的数据尽在公司的把控之中。
根据报告的内容,Hadoop的购买周期正处于上升阶段,因此在该领域催生了越来越多的厂商。尽管Hadoop是Apache的开源项目,任何人都可以免费下载,但大多数消费者还是倾向于采用厂商的打包方案。除了将所有的Hadoop组件打包并保证其能正常使用(兼容版本)之外,厂商一般还会提供企业级支持和扩展:以Apache Hadoop(Common,HDFS,MapReduce )作为方案的核心组件,搭配额外实现增强Hadoop的功能,并增加差异化功能使其解决方案更具吸引力。
Forrester的报告详细介绍了9家厂商:Amazon Web Services、Cloudera、Hortonworks、IBM、Intel、MapR科技、Microsoft、Pivotal软件和Teradata,并根据以下指标对这些厂商进行了评测:
现有产品,包括解决方案架构、数据和处理功能、安装、管理、监控工具、兼容性和社区成熟度等方面。战略,包括厂商在满足当前客户需求和弥补企业部署方面的计划。对战略的评测包括股权并购、内部战略的执行能力、产品路线图以及对客户的支持能力等。市场占有率,包括公司的财务,全球占有率,安装基数,与其他软件厂商、专业服务厂商以及软件即服务(Saas)/云/托管提供商之间的战略合作关系等。
报告的主要研究结果如下:
厂商众多,但是并没有占主导地位的厂商。
在此次大数据Hadoop解决方案评测中,领导厂商有Amazon Web Services、Cloudera、Hortonworks、IBM、MapR科技、Pivotal软件和Teradata。这些厂商都是基于Apache开源项目,然后增加打包、支持、集成等特性以及自己的创新等内容以弥补Hadoop在企业中的短板。所有厂商都实现了这些功能,尽管方式略有不同——从各厂商的评测得分和厂商资料可见一斑。
新晋厂商的解决方案也有不俗的表现。
在此次大数据Hadoop解决方案评测中,表现强劲的厂商有Intel和Microsoft。Microsoft为HDInsight产品制定了强劲的路线图,使其竞争力不亚于其他领导厂商。Microsoft HDInsight为Azure进行了特殊优化,所以对于那些想要在Azure上实现Hadoop的Microsoft客户来说,它是最好的解决方案。而Intel将其创新能力聚焦于芯片级,如果它想将其产品打造成企业级解决方案,还需要加强其战略和企业工具。
根据该报告,虽然此次对大数据Hadoop解决方案市场的评测只是一个开始,但是对于那些努力摆脱复杂的Hadoop厂商局面的公司而言,该报告提供了很好的参考信息。