大数据技术作为新一代技术和体系架构,将能利用较低的成本,通过高速捕获,发现并对超大量、众多类型的数据进行分析,以获得信息的价值。也就是说,大数据在通过技术手段之后能够创造巨大价值,在这些巨大价值面前,吸引的不仅仅是你追我赶的怦然心动,更是产业谋篇布局的跃跃欲试。
根据IDC调研机构发布的数据显示,2012年至2016年,全球大数据技术及服务市场复合年增长率(CAGR) 将达到31.7%,2016年收入将达238亿美元,其增速约为信息通信技术市场整体增速的7倍。从这些数据我们不难看出,大数据已经成为继云计算、移动互联网、社交之后的又一大热点,而且大数据还将会与移动、社交和云计算深度融合,从端到端产生的海量数据中带来价值挖掘的发展空间,而这些空间不仅对传统的IT设备和服务厂商带来新机,同时也给广大商业智能、数据挖掘和数据分析以及相关配套服务产业链带来巨大商机。
中关村见证了中国IT信息技术发展的历程,在这里建立起了中国首个国家级高新技术产业开发区和国家自主创新示范区。近年来,随时代发展中关村纷纷建立起云计算、大数据相关产业优势资源整合联盟(中关村云计算产业基地、中关村云计算产业联盟中关村大数据日),不仅突出以中关村为代表的中国本土在迎接第三次IT技术革命浪潮中的优势和实力,也强调了本地区资源在新形势下的技术创新和发展规划。
太平洋的另一端——位于美国加州旧金山湾以南的硅谷(Silicon Valley),凝聚了全美乃至全球在微电子行业的领袖企业,它们也和中关村类似,依托有当代教学资源和高新中小企业,并发展成拥有英特尔、惠普、思科、苹果等超大型IT科技企业的阵地。
中关村涌现了一大批高科技企业,尤其是在云计算、大数据领域都有不少IT企业纷纷推出自己的创新产品。去年,中关村管委会指导、北京云基地共同在中关村软件园举办了“中关村大数据日”活动,并宣布成立中关村大数据产业联盟。
此次活动宣告着中关村将在今后每年的12月13日确定为中关村的大数据日,集中开展以大数据为主题的各项交流活动。目前,大数据产业已经纳入《中关村战略性新兴产业集群创新引领工程(2013-2015年)》,将开展云运营和大数据示范应用,建设云计算应用支撑平台、虚拟化平台,支持开展海量数据存储、数据挖掘和分析等技术的行业应用,以及大规模云运营服务和大数据挖掘服务。
具体在企业打造的大数据产品和解决方案,也形成一股强大的影响力昭示着中关村在大数据时代的光辉。#p#副标题#e#
曙光集团总部研发基地于去年3月入驻中关村软件园,其涵盖品牌体验中心、数据中心、技术支持中心、解决方案中心等办公大楼体现了曙光在未来战略转型方面迈出关键一步。与之前更换新标识一样,透露着曙光公司正在积极由一家服务器硬件提供商向‘信息服务与解决方案供应商’转型。
曙光公司新办公大楼
在云计算方面,曙光公司成立了云计算子公司,以现有的云计算中心为依托,加快在二、三线城市云计算中心的建设,强化曙光“城市云”的行业差异和特色优势。而在大数据方面,曙光公司拥有互联网大数据平台解决方案。该方案采用ParaStor分布式文件系统、Hadoop大数据处理平台于一体,并可以根据所需资源进行横向扩展,以插件的形式扩展各种应用的检索系统。同时大数据平台还提供通过分析,不断改进业务水平的能力;也可以对系统进行升级、维护提出预警等。
曙光互联网大数据平台逻辑结构示意图
曙光在中关村树立起三大旗帜“高性能计算、国家自主创新和大数据成功应用”,中关村管委会副主任周国林曾经在曙光大数据战略发布会强调“我们还是一如既往地支持曙光的大数据处理。”
曙光揭晓大数据战略
随着社交应用的不断推进和深入,微博在大数据领域的价值也逐渐得以体现。微博获得迅猛发展使得新浪不得不考虑利用海量用户所带来的数据创造价值,并更好地服务于用户。上个月,新浪微博在2013全球移动互联网大会(GMIC)展示了移动端全新产品“Page页面”,该产品是新浪微博基于大数据时代的最新战略布局,展现出其“重新定义移动互联”的实力。
从Facebook、Twitter的经验来看,社交化平台商业化的成功与用户数据挖掘的深度有直接关系。去年年底,新浪微博启动信息流广告测试,根据兴趣爱好和社交关系向网友推荐相关信息;今年4月,新浪微博宣布与阿里进行战略合作(前者拥有基于社交的用户数据,后者拥有基于“交易型”用户数据。)明确表示将在大数据业务层面展开持续深入的合作探索,为微博的商业化前景带来了更大空间。
中关村软件园
在中关村类似曙光、新浪微博的企业在应对大数据方面所采取的产业布局不在少数,云天使基金、中云融汇基金、大数据实验室孵化基金等三支产业投资基金,更是从大数据产业的“种子期”就开始关注并推动。通过设立示范区和软件园,中关村在IT产业包括大数据产业链发展方面拥有后发优势。通过现有的技术和革新,有望在第三次IT信息技术革命浪潮面前抓住机遇实现跨越式发展。但由于基础较为薄弱,在大数据软硬应用层面存在更大挑战同时也面临更多机遇。大数据强调的是App以及由此带来的高价值,而不是停留在传统的基础设施或者硬件开发的水平上。因此,中关村在大数据产业发展更多应该注重一体化、尤其是软件应用层面的数据挖掘、BI、分析呈现的打造。#p#副标题#e# 中关村是中国的“硅谷”,班加罗尔是印度的“硅谷”。这些无疑都说明了硅谷的地位之重——全球高新技术产业孵化和扩展源泉。大家现在所熟知的很多IT科技企业包括英特尔、惠普、Adobe、谷歌、思科、苹果、朗讯、AMD、甲骨文、Ebay、雅虎等公司其实都在硅谷。
硅谷拥有众多此类企业,它们都在各自领域拥有绝对性影响力。比如半导体领导企业英特尔,其根植于大数据底层的芯片架构和基础设施,将直接为大数据挖掘和分析提供基础性平台。而目前最为流行的大数据分布式系统Hadoop,早先就有来自硅谷的雅虎在代码等方面的卓越贡献。
硅谷遍布无数高新技术企业
美国硅谷在大数据领域的科技企业,主要有三大类——传统惠普、英特尔等软硬一体解决方案提供商,亚马逊、谷歌和Facebook等互联网巨头、社交巨头以及面向大数据挖掘、分析与服务等某种特定应用的解决方案提供商。
英特尔、惠普、甲骨文等企业,由于拥有成熟而又丰富的IT产品线和解决方案,在大数据应用领域可通过结合软件或者打造的生态圈来扩展其在大数据软硬一体解决方案方面的影响力。比如英特尔发布的Hadoop发行版,在原有Hadoop框架内从软硬件层面分别进行了深度优化。包括HDFS、MapReduce以及 HBase都有重新改写,同时并支持SQL查询指令语言Hive,对于SQL指令的查询速度提升了8.5倍。
英特尔Hadoop发行版与开源版本功能对比
另外,它还可以直接支持Xeon进阶运算加密指令集AES-NI,来提高数据运算速度,还能让数据收集、储存到HBase的过程,可以被芯片原生的加密功能保护,而性能又不会因为加密受到影响。在成熟且广阔开放的x86平台上,基于英特尔发行版Hadoop可以实现深度融合,其免费版Hadoop也有助于化解Hadoop开源版本部署技术门槛高的问题。
谷歌搜索
而作为网络搜索巨头,也被人称为“互联网入口”的谷歌,其本身在大数据平台上就具备了初步的方案和服务模型。谷歌搜索,谷歌广告,谷歌翻译,Play 音乐,谷歌趋势,以及谷歌更多的其他产品,都无法离开海量数据的支撑而存在。谷歌本身拥有强大的基础设施平台(包括定制化服务设施),比如为了提高用户图片搜索服务质量,谷歌在搜索系统中构建并“训练”神经网络系统模拟。
Cloudera提供企业级Hadoop部署一站式方案
新兴的创业公司则通过提供服务和咨询更有针对性地提供特定解决方案。这些公司更接近于将大数据实现商业化。例如,Cloudera公司和Hortonworks公司提供企业信息化系统和商务智能系统等产品,将Hadoop开源平台实现商业化经营,帮助企业用户降低数据操作的难度。另外还有不少企业则针对企业或者商家提供基于海量数据(消费者行为、市场等数据)的精准营销、个性化营销等服务。#p#副标题#e# 中关村-硅谷在大数据领域既存在竞争更存在合作。和前两次IT信息技术革命浪潮不同的是,大数据时代的中关村产业并不是沿着“模仿”的路径走在后面,而是在几乎相同的起跑线上角逐。当然,这种角逐主要针对的是大数据商业价值和解决方案的部署与创新方面,并不是指大数据基础架构下的某些半导体或者分布式数据库系统。
“大数据”正成为一股热潮。不仅蕴示着IT领域的技术变革,还标志着进入各行各业开启全新的商业模式。中关村大数据产业联盟的成立,以及和“大数据”相关的三只产业投资基金的启动,更是中国在大数据领域谋篇布局的新里程碑。
中关村大数据产业与创新联盟成立
大数据联盟将在中关村管委会的指导下,遵循“联合、自律、维权、协调、服务”的方针,推进中关村在大数据等领域的产业建设和技术创新,并在全国扮演领导者角色。该联盟成员包括来自中国厂商、用户、投资机构、院校与研究机构、政府部门等强大力量和资源平台,有助于推动大数据等相关产业在宣传教育、研讨交流、数据共享、联合开发、推广应用、产业标准方面制定与推行、联合人才培养、业务与投资合作,推进实现数据开发共享,并形成相关技术与产品的突破性创新,产业的跨越式发展,推动培植世界领先的大数据技术、产品、产业和市场。
相比之下,硅谷在大数据领域则没有如此“高规格”、“旗帜鲜明”地成立由多方成员组成的大数据同盟,而更多的是“单兵作战”。这种发展格局一方面与硅谷各自企业在自己所在领域的成熟经验和技术有关,也有其独特创新模式有关。中国在产业生态链发展方面,更多的是依托于某个平台——由多方组织和科研学术机构甚至政府政策引导来推进,这种方式的好处是更具有目的性,在资源整合和利用率方面很大裨益。#p#副标题#e#
Hadoop在企业中的应用
而在硅谷大数据发展态势方面,比如在硅谷的雅虎,就曾经为大数据数据挖掘“利器”Hadoop做出了卓越贡献,为其应用在大数据商业价值挖掘和推动产业发展提供重要支持。而英特尔利用不断创新的技术使得“摩尔定律”焕然一新,通过制程和架构的不断升级,在实现更高性能的同时降低能耗,满足大数据适应冷数据处理和在线数据分析等不同应用场景的大数据处理需求。当然还有甲骨文在大数据一体机(主要借助其数据库技术)方面为打造大数据一站式解决方案作出的创新等等。这些都说明其不同组织机构分别在大数据的某些具体需求方面拥有自身独特的方案能力。
大数据未来产业趋势方面,中关村将能发挥更大作用,一方面得益于中国在大数据市场的更大潜力和更多价值落地,人口众多带来的交通、教育、生活、工作、移动互联等多种问题,都对大数据的应用前景带来更大成长空间。另一方面,中国借鉴了很多国外成熟的技术和产品来推动大数据商业价值的尽快落地,比如来自底层基础设施的数据中心和分布式处理系统。
从上面我们不难看出,未来中国在大数据领域将有更多创新方案和面向这些方案的初创企业。大数据产业所蕴含的的商业价值正在全球范围内显现,在美国每年为健康产业带来3000亿美元的潜在价值,相当于西班牙年度医疗保健开支两倍。而在中国市场中,未来的大数据所蕴含的价值将更大。在这种背景下,“中关村”所透露出来的大数据战略和市场布局也就显得更为高瞻远瞩和坚定务实。'
前面提到,中关村-硅谷在大数据也同样存在合作。这种合作其实我们也可以看做是两方面——一方面源自大数据出现之前涵盖基础设施、数据存储处理分析等应用的技术合作与市场推广;另一方面则直接体现当今大数据框架内的解决方案和定制化服务。随着大数据市场的不断扩展,后者在太平洋两岸的合作中会更突出。
根据联合国发布的《大数据促发展:挑战与机遇》报告,大数据产业将为位置服务产业带来6000亿美元的潜在年收入、零售商利用大数据可实现运营利润增长60%、制造业设备装配成本可减少50%。就中国而言大数据产业不仅自身产业规模巨大,对于其他产业辐射和带动的效用也非常明显。这其中包括对海量存储设备、高性能服务器等产品和应用的发展,有助于加速基于芯片、存储、内存计算等技术的不断进步,同时推动云计算、物联网和移动互联网等产业的融合,以及包括数据挖掘,商业分析等新兴应用的业态的发展。
这些推动作用,将会给硬件、软件、解决方案等企业带来巨大商机,更会促进“中关村-硅谷”双方更紧密合作。总部坐落在硅谷的英特尔,推出了适用于大数据应用的芯片(比如至强处理器E5产品可用于大数据应用中的分布式处理和高性能计算,E7产品则可以服务关系型数据库和商业智能技术及应用。另外还有高速闪存、网络芯片等等。)
英特尔大数据论坛
在芯片之上的数据组织与管理层,英特尔针对大数据的分发和管理需求提供针对x86平台优化的Hadoop产品和服务;在分析与发现层,提供针对客户端与服务器端算法开发的支持,以满足大数据计算所需的性能与规模要求;在决策支持与IT服务层,则将联合生态系统内的合作伙伴,提供更为优化的可视化应用体验。
中国联通研究院副院长 黄文良
英特尔与坐落于中关村的中国联通在大数据展开了一系列合作。去年举办的主题为“芯动大数据 智领大机遇”的英特尔大数据论坛上,中国联通研究院副院长黄文良先生与大家分享了中国联通是如何利用英特尔Hadoop发行版解决业务发展中遇到的大数据问题。中国联通采用了178台英特尔至强服务器的刀片服务器,每一台配14TB的存储,还加上其他的Name节点,并且应用英特尔Hadoop发行版,从而全面打造起基于大数据应用的数据处理和检索平台,满足移动互联网时代的用户个性化需求。
当然,除了采用这种合作的方式打造基于双方业务来满足市场需求的做法之外,也有通过建立合作来创建全新大数据服务平台的解决方案。不过“市场需求”为导向的大数据产业格局,未来这种合作更多的会以基于本土市场的业务决策、精准营销、个性化服务和智能城市(智能交通等)来展开。可以预见,中关村-硅谷在大数据时代将会上演“‘中关村’这边风景独好”的新版“双城记”。