中存储网6月6日消息,据路透社报道,亚马逊与谷歌在人类DNA数据云存储市场展开了激烈竞赛,目的是在基因医学研究领域获得炫耀资本和市场份额。目前全球云基因市场规模约为1亿至3亿美元,到2018年这一数字将增长到10亿美元。
业内顾问、分析师在接受采访时称,学术机构和医疗公司正在谷歌的Google Genomics和亚马逊云服务AWS之间选边站队,为了赢得备受瞩目的基因组研究业务,亚马逊与谷歌展开了白热化竞争。
基于患者DNA信息的个性化治疗,正在推动人类DNA数据存储服务市场增长。个性化治疗需要大量DNA数据,从而发现如何在具体基因信息下帮助患者采用不同的治疗方法。一些大学和药品制造商正在展开数十万人的基因组排序项目。
业内客户认为,谷歌和亚马逊的基因数据存储业务,在数据处理、安全、成本控制以及数据共享等方面已超出了它们自己的电脑运输。除存储服务外,两家云计算公司还提供数据分析服务,从而使科学家利用DNA数据。微软和IBM同时也在该市场展开竞争,旨在分得一杯羹。
投资银行FBR Capital分析师丹尼尔·艾维斯(Daniel Ives)称,当前全球基因组云存储市场规模约为1亿到3亿美元,预计到2018年该数字将增长到10亿美元。届时,整个云计算市场年营收将从现在的300亿美元增长到500亿至750亿美元。
位于圣地亚哥的人类长寿公司(Human Longevity Inc)主管克雷格·文特尔(Craig Venter)表示:“云计算是这一领域未来的全部。”早在上世纪90年代,文特尔曾在致力于人类基因组序列研究。文特尔称,“当时由于数据传输非常慢,科学家不得不求助于联邦快递和专人、或者亲自步行去运送磁盘和U盘。”现在,文特尔的公司已经在使用亚马逊AWS云服务了。
制药公司Regeneron Pharmaceuticals与宾夕法尼亚州的Geisinger卫生系统展开合作,对25万个基因组进行排序。它们将这些原始的DNA数据上传到了亚马逊云服务上。
免费托管
为了展现对该业务的重视程度,同时表达希望利用现有客户吸引未来客户的愿望,谷歌和亚马逊为知名基因组项目提供了免费存储服务。
截至目前,谷歌和亚马逊均未公布自己的基因组信息存储量。但据分析师、基因科学家和公司提供的数据显示,亚马逊云服务可能占到上风。
作为“千人基因组计划”项目赞助商之一,美国国立卫生研究院(NIH)的凯西·克莱文迪(Kathy Cravedi)表示,“千人基因组计划”项目的数据,同时存储于谷歌和亚马逊的免费服务上。
但其他的付费客户往往选择其中一款存储作为重点存储对象。比如,谷歌赢得了“自闭症之声”(Autism Speaks)的一个基因组项目,该项目旨在收集和分析1万名自闭症儿童及其父母的基因信息。谷歌的另一付费客户为基因组数据创业公司Tute Genomics。
而亚马逊为“多发性骨髓瘤基金会”(Multiple Myeloma Foundation)的基因项目提供看存储服务。此外,亚马逊还赢得了“阿尔茨海默病测序项目”(Alzheimer's Disease Sequencing Project)的数据存储。
针对每个完整的人类基因组存储服务,亚马逊每月收取大约4至5美元费用,谷歌每月费用约为3至5美元。当科学家利用分析软件处理存储数据时,两家公司还按照数据传输量或计算时间收费。亚马逊的数据库分析工具——Redshif的收费标准为:25美分/小时或1000美元/TB、年。1 TB存储容量,即1000 GB,足以存储300个小时的高清视频。
基因黄金
对于客户来说,云存储服务还可以提供另一个“淘金”场地:即使用云存储服务上的分析工具,可以在基因组数据中淘出“基因黄金”——药物靶标,或者DNA变异信息。而任何通过诸如搜索发现的“基因黄金”,都属于数据拥有者。
“阿尔茨海默病测序项目”负责人杰拉德·舍伦贝格(Gerard Schellenberg)表示,在本地大学服务器上,执行一次数据分析可能需要数月时间。而在亚马逊服务器上,你需要多快就有多快,因而他们都选择了亚马逊。”
云服务的另一大卖点是其安全性。计算器安全公司Cylance首席科学家瑞安·帕玛(Ryan Permeh)表示,大学服务器“一般都存在许多漏洞,而联邦政府电脑的安全等级并非“顶级”。
谷歌基因组工程总监大卫·格雷泽(David Glazer)认为,目前学术和药物研究项目是基因云存储服务的最大客户,但在未来10年,临床应用的规模将超过它们。个体医生会定期访问云服务,来了解病人基因信息引起各类疾病的风险,或者选择合适的治疗方案。
“我们现在正处在这一过渡点上。”格雷泽说。
亚马逊云服务数据科学部门经理马特·伍德(Matt Wood)认为,由于建立了庞大的基因组数据库,加之业内协同研究,以及基因组进入临床治疗的速度也在加速,当前基因组云存储服务需求特别旺盛。
DNA及数据研究专家表示,如果没有云服务,现代基因组学将会止步不前。
加州大学生物信息学专家阿图尔·巴特(Atul Butte)博士指出,现在,当身居不同大学的研究人员在美国国立卫生研究院(National Institutes of Health,NIH)或者其他基因组数据库上展开共同研究时,他们不需要计算怎样才能在他们的电脑上进行会话。今年3月,NIH开始允许科学家上传重要的基因数据,这为科学家们在云端进行重大基因研究扫清了障碍。巴特表示,将基因组研究转移至云端,只是时间问题而已。