/ 中存储网

Broadcom开始交付 Tomahawk Ultra 以太网交换机,用于 HPC 和 AI 规模化

2025-07-17 23:04:05 来源:中国存储网

中国存储网消息,近日,博通公司宣布其 Tomahawk Ultra 以太网交换机发货。

Broadcom开始交付 Tomahawk Ultra 以太网交换机,用于 HPC 和 AI 规模化

Tomahawk Ultra 专为 HPC 和 AI 工作负载的以太网交换机而设计,可提供超低延迟、高吞吐量和无损网络。

Tomahawk Ultra 是创新的证明,数百名工程师经过多年的努力,他们重新构想了以太网交换机的各个方面,”Broadcom 核心交换组高级副总裁兼总经理 Ram Velaga 说。这凸显了 Broadcom 致力于投资推进以太网以实现高性能网络和 AI 扩展的承诺。

打破神话,重新定义性能
Tomahawk Ultra 专为满足 HPC 环境和紧密耦合的 AI 集群的极端需求而从头开始构建,重新定义了以太网交换机可以提供的功能。长期以来,以太网一直被认为具有更高的延迟和损耗,现在它承担了新的角色:

  • 超低延迟:在 51.2 Tb/s 的吞吐量下实现 250ns 的交换机延迟。
  • 高性能:即使在最小数据包大小为 64 字节的情况下也能提供线速交换性能,支持高达 770 亿个数据包/秒。
  • 适应性强、优化的以太网报头:将报头开销从 46 字节减少到 10 字节,同时保持完全的以太网合规性,从而提高网络效率并实现灵活的、特定于应用的优化。
  • 无损结构:实现链路层重试 (LLR) 和基于信用的流量控制 (CBFC),以消除丢包并确保可靠性。

Bloomberg Intelligence 首席半导体分析师 Kunjan Sobhani 表示:“AI 和 HPC 工作负载正在融合到紧密耦合的加速器集群中,这需要超级计算机级的延迟,这对于结构本身的推理、可靠性和网络内智能至关重要“证明开放标准以太网现在可以提供亚微秒级交换、无损传输和片上集合,这标志着朝着满足 AI 纵向扩展堆栈的需求迈出了关键一步——预计几年内将达到数亿亿个。”

Tomahawk Ultra 专为 HPC 和 AI 而构建纵向扩展,针对 HPC 系统和 AI 集群中的紧密耦合、低延迟通信模式进行了优化 。凭借超低延迟交换和适应性强的优化以太网接头,它为大规模模拟、科学计算以及同步 AI 模型训练和推理提供可预测的高效性能。

当使用纵向扩展以太网(此处向公众提供 SUE 规范)部署时,Tomahawk Ultra 可实现低于 400ns 的 XPU 到 XPU 通信延迟,包括交换机传输时间,为大规模紧密同步的 AI 计算树立了新基准。

通过将以太网报头开销从 46 字节减少到仅 10 字节,同时保持完全的以太网合规性,Tomahawk Ultra 提高了网络效率。此优化的标头可针对每个应用程序进行调整,从而在各种 HPC 和 AI 工作负载中提供灵活性和性能提升。

Tomahawk Ultra 采用无损结构技术,可消除大容量数据传输期间的丢包现象。该交换机集成了 LLR,使用前向纠错功能检测链路错误,并自动重新传输数据包,避免在线路级别出现丢包。同时,CBFC 可以防止传统上导致数据包丢失的缓冲区溢出。这些机制共同创建了真正的无损以太网结构,提供了当今数据密集型工作负载所需的可靠性级别。

Tomahawk Ultra 还通过 In-Network Collectives 加速性能,解决了 AI 和机器学习工作负载中最持久的瓶颈之一。Tomahawk Ultra 不是让 XPU 承担 AllReduce、Broadcast 或 AllGather 等集体作的负担,而是直接在交换芯片中执行这些作。这可以减少作业完成时间并提高昂贵计算资源的利用率。重要的是,此功能与端点无关,支持在各种系统架构和供应商生态系统中立即采用。

Tomahawk Ultra 采用拓扑感知路由创新设计,支持包括 Dragonfly、Mesh 和 Torus 在内的高级 HPC 拓扑,还符合 UEC 标准,并支持以太网网络的开放性和丰富的生态系统。

推出 SUE-Lite

作为 Broadcom 面向 AI 扩展的以太网前向战略的一部分,该公司推出了 SUE-Lite,这是专为电源和区域敏感型加速器应用量身定制的 SUE 规范的优化版本。SUE-Lite 保留了完整 SUE 的关键低延迟和无损特性,同时进一步减少了 AI XPU 和 CPU 上以太网接口的硅占用空间和功耗。

这种轻量级变体可以更轻松地将符合标准的以太网结构集成到 AI 平台中,从而促进以太网作为纵向扩展架构中的首选互连的广泛采用。

用于 AI 纵向扩展和 HPC 横向扩展的平台

Tomahawk Ultra 与 102.4Tb/s 的 Tomahawk 6 一起构成了统一以太网架构的基础:为 AI 启用纵向扩展以太网,为 HPC 和分布式工作负载启用横向扩展以太网。