英伟达公司希望通过以十分之一的成本使数据中心的运行速度提高 10 倍,从而彻底改变企业计算。
英伟达首席执行官黄仁勋(如图)正在制定一项战略,以利用该公司在人工智能架构中的强大地位来重新构建当今的本地数据中心、公共云和边缘计算设施。这种端到端战略的关键包括清晰的愿景、大量的芯片设计技能、集成内存、处理器、I/O 和网络的基于 Arm 的新架构,以及引人注目的软件消费模型。
即使英伟达未能成功收购 Arm,我们相信它仍然能够通过积极参与 Arm 生态系统来执行这一战略。但是,如果其收购 Arm 的尝试成功,我们相信它将把英伟达从世界上最有价值的芯片公司转变为世界上最有价值的集成计算架构供应商。
在这份突破性分析中,我们将解释为什么我们认为 Nvidia 处于为全球计算中心提供动力的强大地位,以及它计划如何打破英特尔公司 x86 架构几十年来在数据中心市场上的控制。我们还将分享一些 企业技术研究 数据,这些数据将把人工智能支出和竞争动态放在背景中。
转型中的数据中心市场
超级云只有少数,但数据中心却很多。据 IDC 称,尽管全球数据中心的数量正在整合,但仍有超过 700 万个。云,就像宇宙一样,正在加速扩张,数以百万计的数据中心正在通过互联网互连——世界上新的(并非如此)专用网络。这种新的云正在变得超分布式并由软件运行。
开放的应用程序编程接口、外部应用程序、庞大的数字供应链和不断扩大的云增加了世界各地数据中心内最敏感信息的威胁面和脆弱性。零信任似乎在一夜之间从流行语变成了强制要求。
我们还看到 AI 被注入到每个应用程序中,这是我们看到的大流行带来的最大动力的技术领域。我们相信,为人工智能提供动力的架构将是英伟达强势进入数据中心市场的关键。
也就是说,我们相信这个新世界不会完全由通用 x86 中央处理器提供动力。相反,它将得到基于 Arm 的供应商生态系统的支持,这些供应商正在影响处理器性能的 空前提高。
在我们看来,英伟达处于领先地位,目前是主导全球数据中心、公共云以及近端和远端计算架构下一个时代的最爱。
黄仁勋的视野清晰
下图强调了英伟达首席执行官希望扩大市场的一些基本假设。首先是数据中心存在大量浪费。他声称,如今部署在数据中心的 CPU 内核中只有一半真正支持应用程序。另一半是围绕运行软件定义数据中心的应用程序处理基础设施。而且它们的利用严重不足。
分析师Zeus Kerravala在一篇博客文章中将 Nvidia 的 Bluefield-3 DPU 或数据处理单元描述 为卡上的完整迷你服务器,内置软件定义的网络、存储和安全加速。该产品具有带宽,据到 Nvidia,以替换 300 个通用 x86 内核。
Jensen 认为,每个网络芯片最终都将是智能的、可编程的,并且能够进行这种类型的加速,从而减轻传统 CPU 的计算负担。他相信每个服务器节点都将具有这种能力,并能够实时监控每个数据包和每个应用程序,以防止入侵。随着服务器迁移到边缘,Bluefield 将作为核心组件包含在内。他声称每年运送 2500 万台服务器,这就是他的目标。
在我们看来,詹森的最后一句话至关重要: “人工智能是我们这个时代最强大的力量。” 不管你是否同意,这都是相关的,因为人工智能无处不在,英伟达在人工智能领域的地位以及公司正在构建的架构是其数据中心和企业战略的基本关键。
人工智能在消费动力榜上名列前茅
让我们来看看 ETR 数据,看看 AI 在首席信息官优先级列表中的位置。下面是我们经常喜欢分享的一个视图中的一组数据。横轴是 ETR 数据中的市场份额或普遍性。但我们想提醒您注意垂直轴,即净分数或支出速度。
退出大流行后,我们已经看到人工智能在最近两次调查中占据了第一的位置。我们认为,随着人工智能成为数字化转型和自动化的主要内容,这种动态将持续很长一段时间。你在这张图表上看到的每一个点都将注入人工智能。
“啊哈”是英伟达的架构是为人工智能工作负载量身定制的,上图中的几乎每个部分都将使用英伟达的技术。
工作负载趋向于 Nvidia 的驾驶室
让我们量化这意味着什么,并阐述我们对 Nvidia 如何在 Arm 的帮助下进军企业市场的看法。
在上图中,我们展示了来自Wikibon Research 的预测, 这些预测 描绘了按工作负载类型划分的全球服务器基础设施支出百分比。以下是关键点:
去年的市场规模约为 780 亿美元,预计到本十年末将接近 1150 亿美元——这可能是一个保守的数字。 我们将市场分为三大工作负载类别。蓝色是我们在此处定义的AI 和其他数据密集型应用程序 。橙色是企业资源规划、供应链、人力资本管理、协作等通用应用程序——基本上想想来自甲骨文公司、SAP SE、微软公司的应用程序和数百个通用应用程序。灰色区域是 Huang 称之为浪费周期的区域,这些区域卸载了网络和存储以及世界各地数据中心中所有软件定义管理的工作。 我们的观点是,随着投资转向 AI+ 工作负载,并且卸载工作转向嵌入到存储和网络解决方案中的替代处理器,通用工作负载正在受到挤压。后一种趋势让我们想起了旋转磁盘驱动器。多年来,为了获得更好的性能,组织被迫购买更多的轴和未充分利用的存储。它既浪费又低效,最终出现了新技术来解决这个问题。
在我们看来,英伟达和 Arm 处于有利地位,可以攻击卸载市场,并且从逻辑上讲,基于人工智能的工作。但即使是橙色通用部分的一部分也可以用于基于 Arm 的系统。例如,正如我们所报道的,Amazon Web Services Inc. 和 Oracle 等公司使用基于 Arm 的设计来服务通用工作负载。
他们为什么这样做?成本。因为 x86 尤其是英特尔无法提供满足降低数据中心成本需求所需的性价比和效率。因此,这些公司正在与独立软件供应商合作,以确保通用应用程序在基于 Arm 的处理器上运行,而无需客户进行任何更改。
思考练习:如果英特尔不回应会怎样?
如果英特尔不应对这种明显的动态,我们认为到本十年末它将获得 50% 的通用工作负载。借助 Nvidia,它将主导蓝色 AI+ 和灰色卸载工作——占据 90% 的可用市场。
现在,英特尔不会袖手旁观让这种情况发生。英特尔首席执行官 Pat Gelsinger 非常清楚这一点,并正在推动英特尔采取新战略,以更好地管理内存资源并适应生态系统的卸载处理和更大的可编程性。但英伟达和 Arm 在这场比赛中遥遥领先。此外,英伟达越来越多地与存储领导者合作,如 NetApp Inc.、DataDirect Networks Inc.、VAST Data Inc.、WekaIO Inc.、Pure Storage Inc. 等,我们认为这将与其部分产品组合的战略保持一致.
英伟达不再是一家游戏公司
英伟达以一家游戏公司而闻名。即使在今天,其近一半的收入来自该细分市场。向任何游戏玩家询问他们对 Nvidia 的看法,他们会继续谈论 Nvidia 令人难以置信的性能、惊人的驱动程序、更流畅的着色、更清晰的图像呈现、卓越的资源分配以及屏幕录制功能等其他功能。他们唯一不完全喜欢的是价格——这是一个很好的问题。
但英伟达通过追求企业市场扩大了其可用市场。让我们快速浏览一下 Nvidia 正在如何处理我们认为与本次讨论相关的部分企业产品组合。
上面是英伟达投资者平台的一张幻灯片,突出了该公司的三芯片战略。重要的是,英伟达正在积极转向基于 Arm 的架构,我们将在后面详细介绍。幻灯片顶部显示了 Nvidia 的 Ampere 架构,不要与Ampere Computing公司混淆 。出于显而易见的原因,英伟达正在采用以图形处理单元为中心的方法——这就是它的驾驶室——但我们认为随着时间的推移,它可能会重新考虑这一点,并出于成本和灵活性的原因将更多的产品多样化到 NPU 等替代品中。但我们会把它留到另一天。
在中间线,Nvidia 宣布了其 Grace CPU,以向着名的计算机科学家Grace Hopper致敬 。Grace 是一种新架构,它不依赖于 x86,并且可以更有效地使用内存资源。
底线显示了 Nvidia 的 Bluefield DPU 的路线图,正如 Zeus Kerravala 所描述的,它本质上是一个完整的卡上服务器。
上图中的最后一点非常重要,但经常被忽视。转向 Arm 将从芯片设计到生产的时间减少 50%。我们正在谈论将剃须时间缩短到 18 个月或更短。这将使 Nvidia 在企业中获得显着的上市时间优势。
将 AI 工作负载加倍并设置优势
我们不会深入研究 Nvidia 的企业产品组合。如果你有兴趣,网上有很多信息。但是,我们认为下图突出了我们认为重要的一些事情,因为它与 Nvidia 的端到端战略有关。
上图显示了 Nvidia Jetson 架构的选定细节,该架构旨在加速我们之前在蓝色条形图中显示的那些 AI+ 工作负载。我们认为这很重要的原因是相同的软件支持小型到大型系统,包括边缘系统。我们认为这种架构非常适合边缘的 AI 推理以及使用 AI 的核心数据中心应用程序。所以这是一个很好的例子,它利用我们认为可以很好地为 Nvidia 服务的广泛性能和成本的架构。
特别是因为它与边缘工作负载有关,我们认为今天的传统服务器供应商正在错过更大的机会——主要是因为它目前规模很小,他们无法证明投资是合理的。这些参与者正确地贴近他们的客户并与工业巨头建立联系,以确定如何将现有的 x86 架构投资重新定向到他们认为的“边缘”。
我们相信他们在很大程度上将边缘机会视为小型数据中心或数据聚合点。他们希望大规模提供横向基础设施,以利用他们的运营杠杆。他们谨慎地谨慎,不要走到“边缘”,不要太深入专业应用程序。
我们相信 Nvidia 和 Arm 看到了更大的图景。当供应商抛出 TAM 数据,即边缘价值将达到数万亿美元时,我们相信真正的机会在于仪器边缘深处的实时 AI 推理。这将需要大量的处理,而且它看起来不像传统的 x86 服务器。这些服务器将节省空间、低功耗、紧密封装或嵌入式、高性能、可编程和超便宜。这就是我们相信 Nvidia 和 Arm 的发展方向。
英伟达转向 Arm 解决了其最大的技术瓶颈
我们想花点时间解释一下为什么我们认为转向基于 Arm 的架构对 Nvidia 如此重要。
今天英伟达面临的最大成本挑战之一是保持 GPU 的利用率。GPU 的典型利用率远低于 20%。上图试图解释原因。
想象一下,图表的左侧显示了传统计算的机架。它强调了英伟达面临的瓶颈。处理器和 DRAM 在不同的块中捆绑在一起。想象一下,一个机架中有数千个内核。每次系统需要存在于另一个处理器中的数据时,它都必须发送请求并检索它,这是开销密集的。技术如ROCE旨在帮助,但这并不解决根本的架构瓶颈。
因为每个 GPU,如底部左侧所示,也有自己的 DRAM,它必须与处理器通信才能获得所需的数据——也就是说,它们不能有效地相互通信。
未来的架构
右侧显示了英伟达的发展方向。从片上系统或 SoC 中间开始。CPU 中装有 NPU、IPU(图像处理单元)和 XPU(其他替代处理器)。这些都与SRAM相连,SRAM是一个高速层,例如L1缓存。SoC 的操作系统位于内部,这就是 Nvidia 拥有杀手级新定价模型的地方。
该公司正在许可运行系统的操作系统的消费,并实施一种新的、真正引人注目的软件订阅模式,该模式与企业买家越来越多地购买软件的方式保持一致。理论上,英伟达可以免费赠送芯片,只对软件收费,就像剃须刀模型一样。
右侧的外层是 DPU 和共享 DRAM 和其他资源(例如 Ampere Computing——这次是公司——以及 CPU、固态设备和其他资源)。这些是将一起管理 SoC 的处理器。
此设计基于 Nvidia 使用 Bluefield DPU 的三芯片方法,利用 Mellanox(即网络)。该网络支持跨 CPU 共享 DRAM,最终将全部基于 Arm。Grace 位于 SoC 内部,也位于外部层。当然,GPU 以缩小版本(例如,渲染 GPU)的形式存在于 SoC 内,我们在外层展示了一些 GPU,以及用于 AI 工作负载的一些 GPU——至少在近期内是这样。最终我们认为它们可能只存在于 SoC 中,但只有时间会证明一切。
正如你所看到的,英伟达正在通过与 Arm 合作并倾向于 Arm 生态系统来采取一些重大举措。这就是它计划显着提高其解决方案效率、减少对 x86 的依赖并支持我们之前描述的那些基于 AI 的新兴工作负载的方式。
谁在竞争计算领先地位?
下面是同一张 XY 图表,显示了市场份额或普遍性跟踪净得分或支出势头。我们已经削减了 ETR 数据,以便为我们认为正在争夺计算数据中心领导地位的一些领先企业捕获计算、存储和网络细分市场。
AWS处于非常有利的地位。我们相信其收入的一半以上来自计算,所以我们谈论的是超过 250 亿美元的运行率。巨大的。该公司设计了自己的芯片,并与独立软件开发商合作,在基于 Arm 的 Graviton 芯片上运行通用工作负载。微软和谷歌有限责任公司是计算的大消费者,他们的销量很大。特别是微软可能会继续与原始设备制造合作伙伴合作,以抓住本地数据中心的机会,但实际上英特尔是惠普企业公司、戴尔技术公司、思科等公司的计算提供商Systems Inc. 和此处未显示的原始设计制造商。
HPE 一直以来都开发了架构。我们不想提起它,但还记得《机器》吗?我们意识到这是竞争对手的许多笑话,惠普值得大张旗鼓,然后悄悄地将机器 放牧。但 HPE 在人工智能和数据密集型的高性能计算领域拥有强大的地位。它在新的计算架构上所做的工作和实验室实验中的共享记忆可能仍在进行中,并且可能在我们在这里描述的未来某一天派上用场。HPE 也以设计自己的定制芯片而闻名,因此我们不会将他们视为这场竞赛中的创新者。
思科 很有趣,因为它不仅拥有定制的芯片设计,而且十年前凭借其统一计算系统进入计算业务的显着特点是它开创了一种新的方式来考虑整合数据中心资源。思科投资于架构,我们预计下一代 UCS 将标志着公司数据中心业务的另一个重要里程碑。此外,该公司还拥有严格的安全保障,并进行了大量收购以巩固其在数据中心的地位,例如 AppDynamics、ThousandEyes、Banzai、Meraki 等。
戴尔 刚刚有一份惊人的季度收益报告。该公司的总收入增长了约 12%,这不是因为与去年相比容易比较。尽管传统 EMC 存储业务持续疲软,但戴尔只是在执行。笔记本电脑需求持续飙升,戴尔的服务器业务再次增长。但我们并不认为戴尔是计算领域的架构创新者。相反,我们认为该公司将满足于与供应商合作,无论是英特尔、英伟达、基于 Arm 的合作伙伴还是上述所有合作伙伴。我们预测戴尔将依靠其庞大的产品组合、优秀的供应链和执行精神,通过整合其他公司开发的核心架构创新来挤压利润。然而,我们确实希望,特别是在存储方面,
IBM 因历史原因而著名。IBM 凭借其大型机创造了第一个巨大的计算垄断地位,然后不知不觉地将其与微软一起交给了英特尔。我们不认为 IBM 有志于重新夺回它曾经拥有的大型机的计算平台地幔。相反,红帽和向混合云进军是我们认为的道路。
房间里的大象:英特尔、英伟达和中国公司。
现在让我们谈谈大狗:英特尔、英伟达和中国公司。中国之所以重要,是因为阿里巴巴、华为技术有限公司等公司以及中国政府希望在半导体技术方面自给自足。
但我们的前提是,在上图中,趋势是有利于英伟达而不是英特尔,因此我们为徽标选择了相对定位。英伟达正在采取措施进一步为数据中心的新工作负载定位,并争夺英特尔的据点。英特尔将尝试重塑自己,但它本应在五到七年前发起 Pat Gelsinger 今天正在采取的举措。英特尔无法改变这一点,而且远远落后。公司需要数年时间才能赶上。
英伟达的数字
让我们暂时停留在英伟达与英特尔的比较上,并了解一下这些公司的财务状况。
上面是一个快速而肮脏的图表,我们将一些简单的关键绩效指标放在一起。其中一些数字是近似的或四舍五入的,所以不要过分强调它。但是你可以看到英特尔是一家价值 800 亿美元的公司——是英伟达的四倍。然而英伟达的市值远远超过英特尔。为什么?因为生长线。在我们看来,由于英伟达更强大的战略定位,这是合理的。
英特尔曾经是毛利率之王,但英伟达的利润率要高得多。在自由现金流方面,英特尔仍然占据主导地位。就资产负债表而言,英特尔,尤其是其新的代工战略,是一项比英伟达更资本密集型的业务。随着英特尔开始为其代工厂建设更多的制造能力,这将给公司的现金状况带来压力。
在第三列中,我们汇总了大约 2022 年底 Nvidia + Arm 的餐巾纸背面备考。我们认为它们的运行速度可以达到英特尔收入的一半左右。如果他们获得 Arm 的任何荣誉,这可能会推动该公司的市值超过 50 万亿美元。风险在于,由于 Arm 交易是基于现金加上大量股票,因此可能会在一段时间内对市值造成压力。
Arm 拥有 90% 的毛利率,因为它几乎拥有纯许可模式,因此它对毛利率有所帮助——但 Arm 的收入相对较小,只有 20 亿美元左右,因此它并没有太大的推动作用。资产负债表数据是赃物。Arm 曾表示不会通过债务来进行交易,但我们还没有时间弄清楚它如何在不承担一些债务的情况下做到这一点,所以我们猜测我们将如何处理它今天的超低资本成本。
关键是,鉴于英伟达的势头和增长、其在 AI 中的战略地位、针对所有正确领域的深度工程以及与 Arm 一起释放巨大价值的潜力,从理论上讲,如果可以的话,它看起来就像是匹敌马执行。
总结英伟达对企业的攻击
英伟达构建其主导 AI 业务的架构正在不断发展。在我们看来,工作负载组合和未来需求正朝着这些新架构发展。在我们看来,英伟达处于有利地位,可以在整个企业中驾驶卡车。
权力已经从 Intel/x86 转移到 Arm 生态系统,而 Nvidia 正在倾斜,而 Intel 必须在重新创建自己的同时保留其当前业务。这需要时间。但英特尔有可能得到美国政府的强大支持。
未知数是:英伟达能否成功收购 Arm?英国和欧盟的某些派系正在反对这笔交易,因为他们不希望美国决定 Arm 可以向谁出售技术——例如对许多基于 Arm 的芯片供应商的华为施加限制。此外,英伟达的竞争对手,如博通公司和高通公司,担心如果英伟达获得 Arm,他们将处于竞争劣势。当然,出于显而易见的原因,中国不希望英伟达控制 Arm,它会尽其所能阻止这笔交易,或者为在中国开展业务的方式戴上手铐。
我们可以看到这样一种情况,即美国政府向英国/欧盟监管机构施压,要求让交易通过,以换取帮助资助欧洲工厂的承诺。人工智能和半导体:没有比这更具战略意义的了,我们认为美国军方有充分的理由支持这笔交易。作为促进交易的交换,政府向 Nvidia 施压,要求其提供英特尔的代工业务,以及我们 之前与 Apple 的情景。与此同时,政府可以强加条件,确保英伟达的竞争对手能够获得基于 Arm 的技术。
我们没有任何关于幕后发生的事情的内部信息,但在其财报电话会议上,英伟达表示正在与监管机构合作,并有望在 2022 年初完成交易。
很多人都处于危险之中,在这场国际象棋比赛中有多个组成部分可供选择。国家战略考虑与拆分或限制大型科技公司的呼吁发生冲突。与此同时,中国的行动清晰而确定。英伟达在数据中心市场获得大奖的大门是敞开的,即使没有拥有 Arm,我们认为该公司比任何其他公司都更有能力满足企业技术的未来需求。