戴尔科技世界2026：MaxLinear展示Panther加速数据中心AI推理和数据流动效率-中国存储网

2026-05-31 02:22:56 来源：中国存储网

MaxLinear是一家高性能连接和数据移动解决方案提供商，在戴尔科技世界展 2026 上展示了其最新一代存储加速器平台 Panther V。Panther V 解决了大型人工智能推理数据中心中日益突出的限制之一：数据在存储、内存和计算间流动的成本、延迟和低效。随着AI工作负载从实验试点转向持久的生产规模推断，系统性能越来越受限于数据的分阶段、准备和推断激活效率。

戴尔科技世界2026：MaxLinear展示Panther加速数据中心AI推理和数据流动效率

针对AI推理和首次令牌时间（TTFT）优化的Panther V

通过紧密耦合CPU、加速器和GPU资源，降低端到端延迟，提升现代AI推理的响应速度和吞吐量，确保数据在系统中高效流动。数据转换、压缩、加密和完整性操作的内联执行消除了不必要的CPU介入和内存往返，减少了GPU的空闲时间，加快了首次令牌的时间，同时释放了主机CPU专注于模型的执行和协调。

随着智能推理的增长和工作负载对延迟的敏感性日益提高，基于Panther的加速器使相同的CPU和GPU能够支持更多的同时推理代理。这提升了交互式实时AI服务的利用率、可扩展性以及整体系统效率。

专为当今推理主导工作负载而打造

随着 AI 推理成为生产型 AI 部署的主要驱动力，Panther V 专为支持最具挑战性的推理场景而设计，包括：

低延迟推断，快速TTFT对于对话式AI和实时应用至关重要
检索增强生成（RAG），加速从企业数据存储中的文档检索和准备
KV缓存密集型推理，使用户和代理间能够重复使用填充前阶段的关键值数据，同时不影响GPU热路径性能

通过加速硅片中的压缩、解压、加密和完整性验证，Panther V 使得更小且经过验证的数据能够更快地通过存储、内存和网络结构传输，从而提升推理经济性，同时增加功耗或基础设施成本。

Panther V 的关键功能

Panther V 结合了可扩展性能、深度 CPU 卸载以及先进的安全和完整性加速，实现大规模高效、高并发的 AI 推理。

可扩展性能：支持超过6Tbps的系统架构，每个加速器最高可达450Gbps
CPU卸载：专用硬件引擎在硅片中完全执行单遍压缩、加密和校验和处理，避免多次PCIe直通
高级加速度：GZIP、Zlib、Deflate、XP10、AES 加密（ECB、CBC、CTR、XTS、GCM）以及 SHA-1/2 哈希和校验和
数据完整性：实时端到端验证，支持CRC验证和NVMe T10 DIF/DIX支持
软件灵活性：支持同步和异步API、内核和用户空间、NUMA识别队列以及点对点DMA
OpenZFS 的 ZFlush：一种硬件加速的OpenZFS实现，与Panther V无缝集成，以提升文件系统性能
行业标准形态：提供PCIe和OCP NIC 3.0配置

推动人工智能数据中心

经济发展人工智能推理市场正在迅速扩张，预计将持续实现两位数增长，直至2030年代初。随着推断变得持续且变现，基础设施采购者开始将系统效率、功耗优化和价值实现时间优先考虑，而非单纯的峰值计算指标。Panther V 使数据中心运营者能够扩展推理并发性，支持更长的上下文窗口，并在不线性增加成本或功耗的情况下提供更快的用户体验。

MaxLinear连接与存储业务高级副总裁兼总经理Vikas Choudhary表示：“AI推理正迅速成为实时、创收的工作负载，数据流动而非计算成为主要系统瓶颈。”“通过加速节点加载速度、增加上下文规模和KV缓存压缩，Panther V实现了更高效、低延迟的推理流水线，以及可扩展的AI推理经济性。我们认为，专用硅加速器解决方案（如Panther V）的可用市场规模约为5美元。

继续阅读戴尔科技 AI存储 MaxLinear AI推理