MaxLinear是一家高性能连接和数据移动解决方案提供商,在戴尔科技世界展 2026 上展示了其最新一代存储加速器平台 Panther V。Panther V 解决了大型人工智能推理数据中心中日益突出的限制之一:数据在存储、内存和计算间流动的成本、延迟和低效。随着AI工作负载从实验试点转向持久的生产规模推断,系统性能越来越受限于数据的分阶段、准备和推断激活效率。

针对AI推理和首次令牌时间(TTFT)优化的Panther V
通过紧密耦合CPU、加速器和GPU资源,降低端到端延迟,提升现代AI推理的响应速度和吞吐量,确保数据在系统中高效流动。数据转换、压缩、加密和完整性操作的内联执行消除了不必要的CPU介入和内存往返,减少了GPU的空闲时间,加快了首次令牌的时间,同时释放了主机CPU专注于模型的执行和协调。
随着智能推理的增长和工作负载对延迟的敏感性日益提高,基于Panther的加速器使相同的CPU和GPU能够支持更多的同时推理代理。这提升了交互式实时AI服务的利用率、可扩展性以及整体系统效率。
专为当今推理主导工作负载而打造
随着 AI 推理成为生产型 AI 部署的主要驱动力,Panther V 专为支持最具挑战性的推理场景而设计,包括:
- 低延迟推断,快速TTFT对于对话式AI和实时应用至关重要
- 检索增强生成(RAG),加速从企业数据存储中的文档检索和准备
- KV缓存密集型推理,使用户和代理间能够重复使用填充前阶段的关键值数据,同时不影响GPU热路径性能
通过加速硅片中的压缩、解压、加密和完整性验证,Panther V 使得更小且经过验证的数据能够更快地通过存储、内存和网络结构传输,从而提升推理经济性,同时增加功耗或基础设施成本。
Panther V 的关键功能
Panther V 结合了可扩展性能、深度 CPU 卸载以及先进的安全和完整性加速,实现大规模高效、高并发的 AI 推理。
- 可扩展性能:支持超过6Tbps的系统架构,每个加速器最高可达450Gbps
- CPU卸载:专用硬件引擎在硅片中完全执行单遍压缩、加密和校验和处理,避免多次PCIe直通
- 高级加速度:GZIP、Zlib、Deflate、XP10、AES 加密(ECB、CBC、CTR、XTS、GCM)以及 SHA-1/2 哈希和校验和
- 数据完整性:实时端到端验证,支持CRC验证和NVMe T10 DIF/DIX支持
- 软件灵活性:支持同步和异步API、内核和用户空间、NUMA识别队列以及点对点DMA
- OpenZFS 的 ZFlush:一种硬件加速的OpenZFS实现,与Panther V无缝集成,以提升文件系统性能
- 行业标准形态:提供PCIe和OCP NIC 3.0配置
推动人工智能数据中心
经济发展 人工智能推理市场正在迅速扩张,预计将持续实现两位数增长,直至2030年代初。随着推断变得持续且变现,基础设施采购者开始将系统效率、功耗优化和价值实现时间优先考虑,而非单纯的峰值计算指标。Panther V 使数据中心运营者能够扩展推理并发性,支持更长的上下文窗口,并在不线性增加成本或功耗的情况下提供更快的用户体验。
MaxLinear连接与存储业务高级副总裁兼总经理Vikas Choudhary表示:“AI推理正迅速成为实时、创收的工作负载,数据流动而非计算成为主要系统瓶颈。”“通过加速节点加载速度、增加上下文规模和KV缓存压缩,Panther V实现了更高效、低延迟的推理流水线,以及可扩展的AI推理经济性。我们认为,专用硅加速器解决方案(如Panther V)的可用市场规模约为5美元。