/ 中存储网

苹果发布 M1 Pro 和 M1 Max:具有全面性能的全新 Arm SoC

2021-10-19 22:04:18 来源:科技号

该公司宣布了新的 MacBook Pro 设备系列,由 Apple 的 Silicon 系列中的两种不同的新 SoC 提供支持:新的 M1 Pro 和 M1 Max。

M1 Pro 和 Max 都是去年 M1 的后续产品,M1 是 Apple 的第一代 Mac芯片,开启了 Apple 用自己的内部设计取代基于 x86 芯片的旅程的开始。M1 为 Apple 赢得了广泛的成功,在笔记本电脑市场上以前所未有的能效展示了出色的性能。尽管 M1 速度很快,但它仍然是一个较小的 SoC——仍然为 iPad Pro 等设备供电,并且相应的 TDP 较低,自然仍然输给了竞争中更大、更耗电的芯片。

今天的两款新芯片有望改变这种状况,Apple 全力以赴提高性能,拥有更多 CPU 内核、更多 GPU 内核、更多芯片投资,而且 Apple 现在还增加了远远超过他们以往任何时候的功率预算智能手机或平板电脑空间。

M1 Pro:10 核 CPU、16 核 GPU、245mm² 中的 337 亿个晶体管

宣布的两款芯片中的第一个是所谓的 M1 Pro——为苹果所谓的不妥协笔记本电脑 SoC 奠定了基础。

苹果发布 M1 Pro 和 M1 Max:具有全面性能的全新 Arm SoC

Apple 以展示包装开始展示,M1 Pro 被证明继续采用非常定制的包装,包括 Apple 将 SoC 芯片和内存芯片封装在单个有机 PCB 上的独特特征,与其他传统芯片形成对比,例如来自 AMD 或英特尔的其他传统芯片,这些芯片的 DRAM 芯片要么位于 DIMM 插槽中,要么焊接到主板上。苹果在这里的方法可能会显着提高电源效率。

该公司透露,与 M1 相比,他们在 M1 Pro 的内存总线上增加了一倍,从 128 位 LPDDR4X 接口转移到新的更宽、更快的 256 位 LPDDR5 接口,承诺高达 200GB 的系统带宽/秒。我们不知道这个数字是精确的还是四舍五入的,但是这个宽度的 LPDDR5-6400 接口将达到 204.8GB/s。

苹果发布 M1 Pro 和 M1 Max:具有全面性能的全新 Arm SoC

在一次备受赞赏的演示中,Apple 实际上展示了 M1 Pro 和 M1 Max 的裸片镜头,因此我们可以立即查看芯片的块布局以及事物的分区方式。让我们从内存接口开始,它们现在更加整合到 SoC 的两个角落,而不是像 M1 那样沿着两个边缘展开。由于接口宽度增加,我们看到 SoC 的很大一部分被内存控制器占用。然而,更有趣的是,Apple 现在显然在内存控制器后面直接使用了两个系统级缓存 (SLC) 块。

Apple 的系统级缓存块引人注目,因为它们服务于整个 SoC,能够放大带宽、减少延迟,或者只是通过避免芯片外的内存事务来节省功耗,从而大大提高了电源效率。这个新一代 SLC 块看起来与我们在 M1 上看到的有很大不同。SRAM 单元面积看起来比 M1 大,所以虽然我们现在不能完全确认这一点,但它可能意味着每个 SLC 块中有 16MB 的缓存——对于 M1 Pro 来说,这意味着总共 32MB SLC 缓存。

苹果发布 M1 Pro 和 M1 Max:具有全面性能的全新 Arm SoC

在 CPU 方面,苹果将效率核心的数量从 4 个缩减为 2 个。我们不知道这些核心是否会与 M1 代效率核心相似,或者苹果是否采用了更新一代的 IP A15 SoC——我们注意到新的 iPhone SoC 在这方面有一些更大的微架构变化。

在性能核心方面,Apple 现在已经翻倍,达到 8 个核心。Apple 的性能核心在 M1 上非常令人印象深刻,但在多线程性能方面落后于其他 8 核 SoC。内核的这种翻倍应该会展示出巨大的 MT 性能提升。

在测试中,我们看到 Apple 似乎镜像了两个 4 核块,L2 缓存也被镜像。虽然 Apple 在这里引用了 24MB 的 L2,但我认为它是一个 2x12MB 的设置,使用了类似 AMD 核心复杂的设置。这意味着两个性能集群的一致性将改为通过结构和 SLC。当然,这是目前的推测,但鉴于所呈现的布局,这是最有意义的。

苹果发布 M1 Pro 和 M1 Max:具有全面性能的全新 Arm SoC

在 CPU 性能指标方面,Apple 与竞争对手进行了一些比较——特别是这里比较的 SKU 是英特尔的酷睿 i7-1185G7,以及英特尔最新的 Tiger Lake 10nm 的酷睿 i7-11800H、4 核和 8 核变体'SuperFin' CPU。

苹果在这里声称,在多线程性能方面,新芯片的性能都大大优于英特尔提供的任何产品,而且功耗大大降低。所呈现的性能/功率曲线显示,在相同的 30W 功率使用下,新 M1 Pro 和 Max 在 CPU 吞吐量上比 11800H 快 1.7 倍,后者的功率曲线非常陡峭。而在相同的性能水平下——在这种情况下使用 11800H 的峰值性能——Apple 表示,新的 M1 Pro/Max 实现了相同的性能,功耗降低了 70%。这两个数字只是巨大的差异,并且远远领先于英特尔目前所取得的成就。

苹果发布 M1 Pro 和 M1 Max:具有全面性能的全新 Arm SoC

除了强大的 CPU 复合体之外,Apple 还加大了其定制 GPU 架构的规模。M1 Pro 现在配备 16 核 GPU,宣传的计算吞吐量性能为 5.2 TFLOP。有趣的是,这个新的更大的 GPU 将得到更宽的内存总线以及大概 32MB 的 SLC 的支持——后者的作用基本上类似于 AMD 现在通过其 GPU 无限缓存实现的目标。

苹果发布 M1 Pro 和 M1 Max:具有全面性能的全新 Arm SoC

据称,Apple 的 GPU 性能远远超过任何上一代竞争对手的集成显卡性能,因此该公司选择与中端独立笔记本电脑显卡进行直接比较。在这种情况下,将 M1 Pro 与 GeForce RTX 3050 Ti 4GB 进行对比,Apple 芯片在功耗降低 70% 的情况下实现了类似的性能。此处显示的功率水平约为 30W - 目前尚不清楚这是总 SoC 或系统功率,还是 Apple 仅比较 GPU 块本身。

苹果发布 M1 Pro 和 M1 Max:具有全面性能的全新 Arm SoC

除了 GPU 和 CPU 之外,Apple 还注意到他们大大改进的媒体引擎,现在可以处理 ProRes 和 ProRes RAW 的硬件加速解码和编码,这对内容创作者和专业摄像师来说非常有趣。Apple Macs 在视频编辑方面通常享有良好的声誉,但 RAW 格式的硬件加速引擎将是一个杀手级功能,它将成为这些观众的直接卖点,我相信我们会听到很多人谈论的东西。

M1 Max:570 亿晶体管和 432mm² 的 32 核 GPU 怪物

除了 M1 Pro,苹果还宣布了一个更大的兄弟——M1 Max。虽然 M1 Pro 在性能方面赶上并超过了笔记本电脑的竞争对手,但 M1 Max 的目标是提供前所未有的东西:将 GPU 增压到总共 32 个内核。从本质上讲,它不再是带有集成 GPU 的 SoC,而是带有 SoC 的 GPU。

苹果发布 M1 Pro 和 M1 Max:具有全面性能的全新 Arm SoC

M1 Max的封装略有变化,变大了——最明显的变化是DRAM芯片从2颗增加到4颗,这也对应着内存接口宽度从256位增加到512位。Apple 正在宣传 400GB/s 的巨大带宽,如果是 LPDDR5-6400,则可能更准确,为 409.6GB/s。这种带宽在 SoC 中是闻所未闻的,但在非常高端的 GPU 中却是常态。

苹果发布 M1 Pro 和 M1 Max:具有全面性能的全新 Arm SoC

在 M1 Max 的裸片上,事情看起来很奇怪——首先,GPU 上方的整个芯片顶部看起来与 M1 Pro 基本相同,指出 Apple 正在重用大部分设计,并且Max 变体只是在块布局中向下增长。

额外的两个 128 位 LPDDR5 块很明显,在这里再次有趣的是,它们还增加了 SLC 块的数量。如果确实是每块 16MB,这将代表 64MB 的片上通用缓存供整个 SoC 使用。除了明显的 GPU 用途之外,我确实想知道 CPU 能够使用如此巨大的内存带宽资源实现什么。

苹果发布 M1 Pro 和 M1 Max:具有全面性能的全新 Arm SoC

M1 Max 确实是巨大的——苹果透露 M1 Pro 的晶体管数量为 337 亿,而 M1 Max 的晶体管数量高达 570 亿。AMD 为 Navi 21 GPU 设计标榜 268 亿晶体管,尺寸为 520mm²,采用台积电 7nm 工艺;由于使用了台积电领先的 5nm 工艺,Apple 在这里以较小的芯片尺寸将晶体管增加了一倍以上。即使与 NVIDIA 最大的 7nm 芯片,540 亿晶体管专注于服务器的 GA100 相比,M1 Max 的晶体管数量仍然更多。

在芯片尺寸方面,Apple 展示了 M1、M1 Pro 和 M1 Max 并排的幻灯片,它们的比例似乎是 1:1。在这种情况下,我们已经知道 M1 为 120mm²,这将使 M1 Pro 为 245mm²,而 M1 Max 约为 432mm²。

苹果发布 M1 Pro 和 M1 Max:具有全面性能的全新 Arm SoC

大部分裸片尺寸被 32 核 GPU 占用,Apple 宣称其达到 10.4TFLOP。回过头来看,这里的 Apple 似乎基本上反映了他们的 16 核 GPU 布局。这里首先想到的是这将是 2 个 GPU 协同工作的想法,但 GPU 的两半之间似乎确实存在一些共享逻辑。一旦我们看到系统的软件行为,我们可能会更清楚地了解这一点。

苹果发布 M1 Pro 和 M1 Max:具有全面性能的全新 Arm SoC

在性能方面,Apple 正在与市场上最好的产品展开竞争,将 M1 Max 的性能与移动 GeForce RTX 3080 的性能进行比较,功耗降低 100W(60W 与 160W)。Apple 还包括 RTX 3080 的 100W TDP 变体以进行比较,在这里,它的性能优于 NVIDIA 独立 GPU,同时仍降低了 40% 的功耗。

苹果发布 M1 Pro 和 M1 Max:具有全面性能的全新 Arm SoC苹果发布 M1 Pro 和 M1 Max:具有全面性能的全新 Arm SoC