中国存储网消息,Broadcom近日宣布将推出 Jericho4 Ethernet 交换矩阵路由器——一个专为下一代分布式 AI 基础设施构建的平台。
Jericho4 旨在跨多个数据中心互连超过 100 万个 XPU,以无与伦比的带宽、安全性和无损性能突破了传统的扩展限制。凭借 Tomahawk 6、Tomahawk Ultra 和 Jericho4,该公司为 HPC 和 AI 提供了完整的网络产品组合。
随着 AI 模型的规模和复杂性的增长,基础设施要求超出了单个数据中心的功率和物理限制。在多个设施(每个设施配置 10,000 兆瓦的功率)之间分配 XPU 需要一种新型路由器,该路由器针对跨区域距离的超高带宽、安全和无损传输进行了优化。
博通核心交换事业部高级副总裁兼总经理 Ram Velaga 表示:“Jericho4 系列旨在将 AI 规模的以太网结构扩展到单个数据中心之外,支持无拥塞的 RoCE 和 3.2 Tbps HyperPort,以实现前所未有的互连效率。纵向扩展以太网 (SUE)、Tomahawk Ultra、Tomahawk 6 和 Jericho4 在以开放和可互作的方式在机架内、机架和数据中心内实现大规模分布式计算系统方面都发挥着非常重要的作用。“
单个 Jericho4 系统可扩展到 36,000 个 HyperPort,每个 HyperPort 的运行速度为 3.2Tb/s,具有深度缓冲、线速 MACsec 和 RoCE 传输,距离超过 100km+ 。
Broadcom 的 3.2T HyperPort 技术将 4x800GE 链路整合到一个逻辑端口中,从而消除了负载平衡效率低下的问题,将利用率提高了 70%,并简化了大型结构之间的流量。
得益于深度缓冲和智能拥塞控制,Jericho4 可确保 100km+ 的无损 RoCE,从而在单个位置实现真正分布式的 AI 基础设施,不受电源和空间限制的限制。
Jericho4 支持每个端口全速的 MACsec 加密,以保护数据中心之间移动的数据,即使在最高流量负载下也能在不影响性能的情况下提供强大的安全性。
Jericho4 采用 3nm 工艺制造,采用该公司先进的 200G PAM4 SerDes,具有行业领先的覆盖范围。这消除了对重定时器等额外组件的需求,从而降低功耗、降低成本并提高系统可靠性。
Jericho4 完全符合超以太网联盟 (UEC) 制定的规范,确保开放的、基于标准的以太网 AI 结构之间的互作性。这允许与符合 UEC 标准的 NIC、交换机和软件堆栈的广泛生态系统集成。
可用性
Jericho4 正在向客户提供样品。
行业名言:
智邦科技研发高级副总裁Michael KT Lee表示:“智邦科技已成功向使用博通分布式分解机箱(DDC)预定结构解决方案的客户交付系统。随着 Jericho4 的推出,智邦期待与博通合作,设计进一步横向扩展 AI 网络的新平台,将 MACsec、长距离 200G SerDes 和 UEC 等功能作为构建块,以满足横向扩展 AI 集群不断变化的需求,同时提高超大规模 GPU 集群所需的能效和模块化灵活性。“
Arista Networks 杰出工程师 John Peach 表示:“Broadcom 的 Jericho4 为可扩展、无损以太网路由树立了新标准,完美补充了 Arista 的高性能 R 系列系统和 EOS 软件,使分布式 AI 数据中心能够以前所未有的规模和效率运行。“
Arrcus 首席执行官兼首席执行官 Shekar Ayyar 表示:“Broadcom 的 Jericho4 为规模、带宽和能效设定了新的基准,这对于跨训练和推理用例连接分布式 AI 工作负载至关重要。Arrcus 的 ArcOS 软件支持 Broadcom 的 Jericho4 产品,具有分解的运营商级软件堆栈,用于跨边缘、核心和多云环境的高性能、可编程网络。我们与博通一起,提供人工智能数据中心互连、5G 传输等所需的敏捷性和作简单性。“
DriveNets 首席执行官兼负责人 Ido Susan 表示:“DriveNets Network Cloud-AI 已经在基于以太网的 AI 网络中建立了行业领先的性能,在分布式分解模型中为基于 Jericho3 的白盒提供支持。凭借 Jericho4 的深度缓冲和低延迟功能,我们准备提供更高的 AI 网络可扩展性和性能,为 AI 后端结构和存储网络提供统一、高效的解决方案,以支持下一代 AI 基础设施需求。“
Micas Networks 首席执行官 Andrew Qu 表示:“Jericho4 的深度缓冲区、长距离 RoCE 和 HyperPort 创新正是我们的客户在数据中心和都会区域拼接大规模 AI 结构所需要的。与 Tomahawk 相结合,Broadcom 为我们提供了完整的工具箱,可以构建任何规模的高性能网络——从叶脊集群到区域范围的 AI 互连。
Nexthop AI 客户工程副总裁 Ariff Premji 表示:“现代超大规模 AI 集群的增长继续超出单个数据中心建筑的功能和物理占地面积。云提供商现在必须构建分布在多个位置和不同地理位置的更大集群。Broadcom 的 Jericho4 系列设备支持深度缓冲区、无损以太网、RoCE、MACsec 和长距离高级拥塞管理功能,现在使 Nexthop 能够提供从单个机架到千兆瓦级 AI 集群的可扩展网络架构选项。
诺基亚硬件副总裁 Jeff Jakab 表示:“博通的 Jericho4 系列芯片提供了我们将人工智能基础设施推向新水平所需的规模、性能和效率。随着 AI 工作负载跨数据中心和区域扩展,诺基亚的 7250 IXR 路由器(由 Jericho4 提供支持)可确保为要求最苛刻的分布式 AI 系统提供高吞吐量、无损连接。博通继续成为我们值得信赖的合作伙伴,帮助诺基亚满足人工智能时代不断变化的需求。“
UfiSpace 首席执行官 Vincent Ho 表示:“UfiSpace 的使命是提供性能、效率和客户选择的最佳组合的解决方案。随着人工智能的未来建立在跨数据中心的分布式计算之上,Jericho4 在这些元素之间取得了关键的平衡。其芯片是构建经济高效、可大规模扩展的人工智能网络的基准,最终使分布式人工智能成为现实。“