2月17日,由开放数据中心委员会浸没液冷智算产业发展论坛主办的“2023年浸没液冷智算产业发展高峰论坛”在衢州成功举办,论坛首届执行主任、阿里云基础设施服务器研发总监文芳志受邀发表了“液冷铸基-智算未来”主题演讲,重点介绍了“算力经济”时代下智能计算中心的特点以及阿里云积极应对能耗挑战、持续探索浸没液冷解决方案的发展历程。
文芳志表示,阿里一直致力于液冷等先进技术的大规模应用,与合作伙伴共建液冷数据中心生态圈,协力打造绿色数字经济。自2015年起,阿里巴巴就开始了针对液冷技术方案的探索实践,此后持续发力液冷实践研究,2018年在张北实现了浸没式液冷集群的规模部署,2020年在杭州部署了国内规模最大的全浸没液冷数据中心及首座绿色等级达5A级的液冷数据中心,同时也取得了一系列技术创新成果,累积发布了众多产品规范和实践数据。
论坛轮值主任、OPPO基础设施总监唐虎受邀发表了“智算中心新选择-浸没液冷智算中心”主题演讲,介绍了当前智能计算需求、智能计算中心的挑战与选择以及浸没液冷智算中心的展望,并分享了OPPO在浸没液冷智算领域的实践经验。
国际数据公司 IDC 的报告指出,中国智能算力持续保持高速增长,预计到2026年,智能算力规模将达到1271.4EFLOPS,是通用计算算力的十倍以上。作为全球领先的智能终端科技企业,一直以来,OPPO均致力于为用户打造更好的服务体验,对智能算力的需求也与日俱增。
面对智能算力基础设施日益增长的算力需求、不断增长的功耗密度以及“3060”双碳目标的挑战,传统风冷架构散热瓶颈日益明显。相较于冷板式液冷,浸没式液冷所有器件均浸没在液体中,能够有效控制核温,实现100%的热回收,同时取消风扇振动源,整体降低了设备故障率。
唐虎介绍到,当前浸没液冷技术已经在OPPO智能云(大湾区)数据中心落地。经实际测算,浸没液冷的GPU集群的单柜密度提升了逾400%,机房噪音降低了近40%。在计算性能方面,TFLOPS算力相较风冷环境提升约8%,跑Bert模型时间缩短8%。
受液冷的基础设施架构调整的影响,为更好地提升液冷数据中心的利用效率及使用体验,OPPO自研便捷运维车,并进行了热回收的探索研究,相关研究成果也在本次论坛进行了发布,分别是《浸没式液冷数据中心热回收白皮书》及《浸没式液冷数据中心运维车白皮书》。
最后,唐虎表示,OPPO始终坚持创新与开放,为智能计算需求普及高效绿色安全浸没液冷智算中心方案。未来,OPPO将持续通过“浸没液冷智算产业发展论坛”集合产业力量,助力浸没液冷智能计算中心进一步标准化,为浸没液冷智能计算中心的加速普及贡献自己的力量。
展示演讲人PPT: