/ 中存储网

Teradata:Hadoop虽大有裨益 开源市场仍欠稳

2014-04-10 00:00:00 来源:中存储

Teradata,Hadoop

一些金融分析师们对Teradata公司在IT市场上的持续发展能力提出了质疑。虽然这部分客户确实将Hadoop提上了议事日程,但如果拥有数十年历史的数据仓库供应商都认为难度很大、客户们往往只会选择放弃。

“更重要的是破除炒作带来的误解而非在现实层面作出妥协,”Teradata Labs总裁Scott Gnau在最近的一次采访当中指出——此次采访的重点在于探讨开源Hadoop从历史角度看给Teradata的软件、设备乃至相关价格带来了怎样的影响。由于管理、安全以及性能等方面所存在的问题,他表示目前要求利用Hadoop作为Teradata系统有效替代品的建议“相当愚蠢”。

平心而论,Gnau认为Hadoop与Teradata两种技术之间应该是相辅相成的关系。“我们双方的成果结合起来要比任何单方面的效果都更突出,”他解释道。

至少就目前来看,这样的结论在立场上确实比较公平。本周一,Teradata公布了一系列新产品及新功能,其中一项名为QueryGrid的功能允许用户在Teradata环境下编写SQL查询并利用其自动对Hadoop或者Teradata Aster系统中的数据进行分析。该公司还表示将支持半结构化JSON文件格式,这意味着Teradata用户将有能力把自己的部署范围扩展到传感器、GPS追踪装置、网络日志乃至其它流行的、由机器产生的数据源当中。

这意味着一直以为需要由Hadoop(对于JSON来说则主要是MongoDB等NoSQL数据库)负责存储并分析的数据类型,现在已经可以将分析工作交给Teradata方案来打理、Hadoop仅仅继续处理存储需求即可。在Teradata看来,企业用户所保留的数据规模越庞大——包括在Hadoop当中——其中存在有价值信息的可能性也就越高。更重要的是,企业用户也就越可能希望利用Teradata这类成熟的关键性任务系统对其加以分析。

“用锤子也能把螺丝砸进墙里去,”Gnau在谈到针对Hadoop建立SQL查询引擎时举了这样一个例子,“但这很明显不是最理想的解决方式。”

事实上,目前大多数Hadoop供应商可能都会对此表示赞同。作为一家与Teradata保持密切合作关系的厂商,Hadoop新兴企业Hortonworks就从来没有考虑过让自家方案充当数据平台、从而帮助用户将自己的大数据保存进去并加以处理。Hortonworks的产品在设计思路上专注于同更为复杂的分析软件相对接——其协作对象当然包括Teradata。

“我们不会强迫客户作出‘必须放弃一套方案、转而选择另一套方案并希望一切顺利’这样的艰难抉择,”Hortonworks公司CEO Rob Bearden在最近接受采访时表示。

作为另一家Hadoop供应商,MapR则正在着手开发其开源SQL-on-Hadoop工具,不过他们同时也在软件当中提供对惠普Vertica分析数据库的支持能力。甚至是Hadoop厂商阵营中最激进、自称将给Teradata等企业级数据仓库供应商带来毁灭性打击的Cloudera公司,也仍然在很大程度上依赖于其软件合作伙伴——其中也包括那些数据仓库方案厂商,而这并不会损害其业务价值。

  存在并不意味着增长

不过这并不代表着Teradata或者其它与之情况相似的企业(事实上Teradata原先的大部分竞争对手都被其它技术巨头所收购,例如IBM、惠普以及EMC)能够继续在这轮大数据技术风暴中保证自身营收毫发无损——情况恰恰相反,而且即使是在其各大客户疯狂扩张订单规模的前提下、负面影响也仍然存在。Hadoop的出现意味着客户能够在一套相对便宜的方案中容纳更多数据,而且无需为了理想的每TB传输速率而支付费用。从SQL向Hadoop的演变过程意味着客户能够将一部分分析工作负载迁移到成本更低的系统当中。

英特尔预计Hadoop最终将成为运行在其服务器处理器上的主力工作负载。如果这一论断最终证明属实,那么覆盖到企业方方面面的Hadoop解决方案将迫使CIO们为有能力提供产品的厂商带来更为迫切的市场需求。就目前来看,EMC-VMware已经合力创建Pivotal公司,这明显是押下重注、希望客户能够通过单一渠道购买他们的Hadoop方案、数据库以及数据仓库产品。目前他们还在对定价政策进行调整,旨在进一步将理想转化为现实。

作为能够运行在Hadoop文件系统之上的下一代内存内处理框架,Spark所引发的广泛关注将进一步推动Hadoop的全面铺开。Spark当中包含一个名为Shark的子项目,其设计目的在于实现交互式内存内SQL查询。甚至连ClearStory Data以及Platfora等商务智能新兴企业——这两家公司也肯定会从Teradata手中夺取一部分市场份额——也参与其中,一家负责Spark创建、另一家也表示愿意为其提供支持。

抛开Hadoop不谈,MemSQL以及Citus Data等数据库新兴企业也在努力打造速度出色、分布式、成本相对较低且支持SQL的分析数据库——这些方案还能够对不同格式以及跨越多个不同存储体系的数据加以分析。

Teradata可能是世界上规模最大、表现最为出色的纯分析技术方案供应商,不过正所谓“王权没有永恒。”大家不妨回顾IBM的发展历史:虽然仍然在销售大型机并为其提供服务,蓝色巨人如今显然不会再把未来押在这类业务身上。这家技术巨头甚至彻底放弃了服务器市场。随着开源业界(以及以此为基础创建自家软件方案的新兴企业)的不断扩张,Teradata的统治领土正持续遭受蚕食;这家公司也许必须做出点惊人之举以重新巩固自己的霸主地位,否则其未来前景将如IBM的大型机业务一般岌岌可危。