近年来,医院的医疗PACS影像数据生产量在快速增长,对医疗影像存储的快速扩容能力和高并发调阅能力提出了挑战。目前医院采用的集中式阵列存储普遍存在影像调阅性能瓶颈,三级存储架构复杂,扩容和运维困难,数据无法全部在线,难以支持大数据、人工智能等科研需求。
基于分布式架构的下一代存储系统——碧海分布式存储,不仅具有高并发数据吞吐性能,还具备大规模快速扩容能力,可将三级数据统一存储于一套存储系统上,打破传统三级存储造成的数据隔离,同时简化了扩容和运维的难度,还能有效支持AI辅助诊疗、影像数据分析与影像智能诊断等科研工作。
一、医疗PACS影像存储现状
随着医疗影像设备的广泛使用、拍片设备单次拍片量的增加,以及拍片设备分辨率的不断提高,医院的医疗PACS数据量预计每年增长15%,五年翻一番,并呈加速增长的态势,三甲综合性医院或胸科、肺科、骨科等三甲专科医院,一年的新增拍片量在50TB ~ 60TB。并且,根据国家电子病历保存相关规定,医疗机构保管保存医疗影像数据时间要求不少于15年。无论从业务发展还是合规要求,医疗影像数据的存储都对存储系统提出了需求。
目前医院对医疗PACS数据普遍采用传统阵列存储FC SAN或NAS,并采用在线、近线、离线的三级存储架构。这种PACS存储架构普遍面临以下问题:
- 性能/容量扩展困难
PACS影像的典型特征是大部分文件都是小文件,其中MR文件平均大小为60KB左右;CT文件平均大小为300KB左右,也是小文件。长期以来,小文件存储都是存储系统面临的挑战:小文件读写性能低;当存储的文件数量增多时性能会不断下降。
目前在线存储使用传统阵列存储时,PACS图像调阅的速度最快仅为每秒80幅左右。典型的MR检查,平均每次检查产生约3000~5000张小图片,调阅图片需要数十秒以上;
在大型医院的业务高峰期,数百位门诊、临床医生同时阅片时,对存储系统产生高并发访问,阅片等待时间更长。
- 系统架构复杂、数据访问不便
三级存储架构下,PACS影像数据分散保存在三套不同的存储系统中。这会导致以下问题:
在患者进行复查时,医生需要调阅半年前或一年前的检查影像,这些影像位于近线存储中,需要将这些影像先迁移到在线存储中再调阅,不仅操作繁琐,难以让医生立即调阅;
三级架构导致的数据隔离,难以将积累的大量PACS数据用于如AI辅助诊疗、影像数据分析与影像智能诊断等科研活动,使数据价值难以充分发挥;
不同存储系统之间的数据难以统一管理,数据迁移工作繁重。
- 总体拥有成本较高
传统中高端阵列存储设备的购置成本较高,尤其是后期扩容成本难以控制。此外,分级存储带来的数据迁移工作量巨大;三套存储的运维也增加了医院信息中心的运维成本。
二、碧海分布式存储在医疗PACS上的应用优势
上海霄云信息科技历时十年自主研发的碧海分布式存储,相对于传统阵列存储,在大规模在线扩展、百亿级小文件管理、高性能数据吞吐、敏捷化运维管理、TCO成本优化等方面具有明显的技术优势,可以有效解决医疗PACS目前在存储上遇到的性能、数据孤岛、运维困难、成本较高等问题,在医联体或大型医疗机构PACS系统这样超大数据量且高并发调取、运维管理要求敏捷化的领域,成为存储架构的最佳选择。
- 性能提升
碧海分布式存储进一步对PACS影像存储进行了针对性优化,如采用小文件合并技术和高并发FTP网关,使得其性能要显著高于传统存储和同类分布式存储。在医院门诊高峰期的高并发环境下(ftp峰值连接数达到10000),PACS系统依然能稳定保持较高的调阅速度。
- 架构精简
碧海分布式存储采用基于NoSQL技术的分布式元数据管理,可管理文件数量达到100亿规模,性能随存储节点数线性提升,完全可存储大型医疗机构6年以上的PACS影像文件。
使用碧海分布式存储后,原来在线、近线、离线三层架构简化为一套存储,所有PACS影像都可在线调阅,并且调阅性能无差异,消除了PACS数据孤岛,有效支撑影像大数据分析、AI辅助诊疗等科研和新兴业务需求。
- 运维简化
碧海分布式存储的平滑在线扩容能力,使随需扩容成为可能。存储硬件的升级换代,只需要将新节点上线、旧节点下线、数据自动迁移就能实现,再也无需人工数据迁移。
- 成本节省
由于PACS影像年数据量在快速增长,并且PACS影像按合规要求保存时间更长,PACS影像数据的存储成本问题逐渐显现出来。采用性能和扩展性更高,TCO成本更经济的分布式存储成为越来越多医联体或大型医疗机构的考虑方案。
三、客户案例
在上海市某三甲医院的大力支持下,碧海分布式存储经过长达一年的验证和试运行后,成功上线。通过对比医院现有中高端阵列存储的影像调阅速度,验证了碧海分布式存储在PACS影像调阅速度上有了2倍以上的提升。业务高峰时500多台工作站并发调阅,调阅性能依然相当稳定,显著提升患者就医体验,提高医生诊断效率,一直困扰医院的PACS影像存储性能瓶颈由此迎刃而解。
随着时间的推移,一套碧海分布式存储就能将在线、近线、离线PACS影像文件全部接管,繁琐而耗时的数据迁移工作将成为历史。
在海量数据的时代,碧海分布式存储带给医院的,不仅是下一代的医疗PACS影像存储解决方案,还将为海量非结构化电子化病历提供更高效、更灵活、更便捷的存储解决方案