医疗在整个民生体系中占有的位置不言而喻,同人们生命相关的绝无小事。医疗的信息化的重要,同治疗速度和救治效果息息相关。
随着生活水平的进步,人们在攻破一个个医疗难点的同时,所关注的焦点渐渐扩展到了癌症。我们身边的医疗水平不断提升。是否能够攻破癌症这一生命杀手?人们为之奋斗并努力突破着这一难关。美国一家研究型医院就是在这个时候,提出希望通过优化基因组信息的处理及分析流程,加速癌症的诊断及治疗。而就在这家公司为之努力之时,遇到了前所未有的挑战和瓶颈。
存储应用数据分析遇阻
该医院在推进癌症的诊断及治疗过程中,面临的主要瓶颈在于现有的文件存储环境。据该医院的存储经理、架构师介绍,该医院面临的挑战主要集中在:“基因研究活动会产生大量需要在线、近线及档案存储的文件。若使用我们内部设计的现有文件存储基础构架,随着需求的不断攀升,我们将越来越难以提供足够的容量和访问速度。解决方案的管理不仅难度大而且非常耗时,再加上我们缺乏经济型的层级用于存储‘冷’数据,即数周、数月或数年前的文件,但我们的研究人员也可能需要访问此类文件。我们需要的是一个企业级解决方案,能够提供一种灵活可变的方式来应对未来的容量和性能需求。”
显然,要解决这样的问题,一定是需要一套全面又能够对数据进行分析、挖掘的系统,在甄选了众多存储解决方案之后,该医院发现,其技术和流程必须要非常符合医疗信息化本身的特点而整合,为了建设一套真正适合医疗体系的存储解决方案,IBMGeneral Parallel File System (GPFS)成为了该医院破冰的重要手段。
快速灵活的文件存储为医院破冰
该医院部署了 IBM General Parallel File System (GPFS),并结合使用了IBM Tivoli Storage Manager for Hierarchical Storage Management,以通过磁盘和磁带存储3.5 PB 的文件。将数据从磁盘移动到磁带,使得存储成本至少减少了一个数量级。一些基因组处理任务的完成时间从几天缩短到几小时,从而可以更快地为临床医护人员提供关键性的信息。
为了向基因研究数据的存储提供一个可扩展且灵活的高性能环境,医院部署了IBM General Parallel File System (GPFS)。最初,该系统采用的是IBM Scale Out Network Attached Storage (SONAS) 解决方案的形式,该解决方案基于GPFS,分配磁盘容量约为2 PB。为防止数据丢失,第二代SONAS 系统仍旧沿用了第一代的设计。该医院使用IBM Tivoli Storage Manager for Hierarchical Storage Management,用以对磁盘和磁带内共计3.5 PB 的数据(组成约16 亿个文件)进行管理。同时还部署了2 个使用IBM System Storage DCS3700 硬件的GPFS 缓存,以确保为研究小组提供持续高效的性能。就块存储而言,该医院配有1 PB 的磁盘容量,并通过IBM System Storage SAN Volume Controller 进行了虚拟化和托管。除了其他功能,该解决方案还可为研究团队使用的多个IBM System x iDataPlex HPC 群集存储OS 图片,该功能基于IBM Platform LSF,实现了策略驱动的智能工作安排。
存储架构师对医院实施了这样的解决方案,非常满意,他表示:“通过对我们计算团队的观察来看,我认为Platform LSF 不仅帮助我们实现了对HPC 群集的高度可视性,还使得我们可以高效地管理工作。与此同时,它还能与GPFS 完美整合,使决策智能化,避免何处写入临时文件产生的性能方面的问题。”
他补充道,“GPFS 可与我们已有的IBM Tivoli Storage Manager 以及磁带环境紧密结合,从而为我们的“冷”数据储存提供低成本的层级系统。将数据从磁盘移动到磁带,使得存储成本至少减少了一个数量级,与此同时释放了占地面积。”
性能更高、诊断更快
如今,借助带有GPFS 功能的IBM Active Cloud Engine,医院便可创建专供团队或项目使用的数据缓存。这些数据会被拷贝返回至主集群,所以无需进行额外的备份或空间管理。存储架构师对今天实施了这样的方案,也非常满意,他说:“有了缓存,我们的处理效率得到了大幅度提升,而且会作为独立的故障域运行。如果某个团队的存储量超出了缓存上的I/O 上限,或缓存出现故障,将不会对其他用户造成任何影响。尽管Active Cloud Engine 的亮点在于协作,但也可以对工作量进行优化。”
在他看来,IBM GPFS 是其所用过的最高效的存储软件,由于效率的大幅度提升,绩效的预见性就更强,这与用户的真正需求完全契合。除此之外,其容量和性能的扩展也非常轻松。 正如存储架构师所言,GPFS(以及计算和LSF 基础构架)的性能表现对于提升癌症治疗水平有着巨大的贡献。对一些用户而言,处理时间可缩短一个数量级,同样的工作量以前需要耗费几天,现在只需几小时便可解决。基因组处理/分析的速度越快,医生确定最佳治疗方案的时间也就越短,患者也将因此获得更好的治疗结果。