/ 中国存储网

Meta 使用 CXL 进行内存扩展来“替代”DDR4

2026-07-02 20:40:39 来源:中国存储网

随着DRAM价格飙升和行业内交付时间延长,Meta披露了一项内存再利用策略,将从退役服务器中提取的DDR4模块重新利用,而非送往处置。Meta 研究人员详细介绍了这一方法,使公司能够在不购买新 DRAM 的情况下扩展服务器内存容量,规避了业内观察者所称的“内存税”——即超大规模企业在内存供应紧张中面临的高成本负担。

该扩展通过CXL技术实现,该技术将旧DDR4模块与更新的DDR5内存池连接在同一台机器内。Meta 不会在服务器退役时退役 DDR4 DIMM,而是将这些容量集中起来,并通过 CXL 连接到更新的服务器群中,作为扩展内存可寻址。Meta将这一成果描述为实现近乎零成本的内存扩展,同时减少电子废弃物并降低基础设施的排放足迹。这一时间点与持续影响全球云环境中服务器部署计划的内存供应限制相符。

Meta的研究人员明确指出,之前的CXL内存扩展方法在超大规模下存在技术障碍,使其不可行。现有的CXL实现提供的带宽大约是本地直接连接内存的十倍。扩展内存的延迟比直接放在处理器插槽旁边的内存高出约60%。市售的CXL产品通常将控制器与DRAM模块捆绑在一起,这阻止了大规模重复利用现有DDR4库存的任何实用方式,你不能简单地把旧的无控制器DIMM插入别人的CXL扩展卡。

这三个限制——带宽、延迟,以及商品CXL产品中的DRAM与控制器耦合,实际上是为什么在Meta之前,“直接用CXL接旧内存”还没有成为标准做法。

为此,Meta不得不设计一套定制的ASIC和软件调度器。Vistara是一款内部设计的CXL ASIC,专为低延迟、功耗效率和回收内存的重复利用而设计,将控制器与DIMM分离,使退役的DDR4模块可以连接而无需绑定特定厂商的配对内存。第二个组件是基于TPP(透明页面布局)构建的软件层,自动确定每个工作负载的本地内存与扩展内存比例,并自动配置每个工作负载,包括对无法承受额外延迟的工作负载完全关闭扩展内存。

在工作负载方面,公司部署了该模型用于分解机器学习推理,服务器数量显著减少,并实现分布式缓存,这在以Memcache闻名的Meta中是一个热门话题。对于Meta及这些应用来说,总内存容量似乎比内存速度更重要。换句话说,是缓存未命中导致的。