未来的大模型，或许都是A卡来算的？

2024-10-21 09:54

Ai芯天下

关注

前言：

当前，算力中心领域正面临一个重要趋势，即随着部分大型模型制造商逐渐减少对预训练的依赖，对推理能力和模型微调的需求显著增加。

这一变化对下游大型模型和应用开发商产生了深远影响，进而促使上游芯片制造商迅速调整战略方向。

然而，仅仅依靠单一芯片的差异化竞争已难以满足市场需求。

作者 | 方文三

图片来源 | 网络

AMD新品直接对标英伟达Blackwell系列芯片

AMD公司在旧金山举办的Advancing AI 2024盛会上，其首席执行官苏姿丰推出了全新一代的Ryzen CPU、Instinct AI计算卡以及EPYC AI芯片等系列产品。

这些产品全面覆盖了AI计算领域，并明确针对英伟达公司的Blackwell系列芯片展开竞争。

据国际媒体报道，过去几年中，英伟达在数据中心GPU市场中占据了显著的领导地位，近乎形成垄断态势，而AMD则长期稳居市场份额的第二位。

今年初，英伟达又发布了其性能巅峰之作B200，其运算能力相较于上一代H200芯片实现了近30倍的提升。

根据规划，B200将于今年第四季度实现量产并投放市场，预计将进一步拉大与竞争对手的差距。

然而，随着MI325X的发布，AMD旨在与英伟达的Blackwell芯片展开有力竞争。

AMD在其Instinct MI325X GPU中集成了8个MI325X单元，该配置能够支持最高达2TB的HBM3E内存；

其FP8精度下的理论峰值性能可达20.8 PFLOPs，而在FP16精度下则可达10.4 PFLOPs。

在系统架构方面，AMD采用了Infinity Fabric互连技术，实现了高达896 GB/s的带宽，并且总内存带宽达到了48 TB/s。

此外，每个GPU的功耗也从原先的750W提升至了1000W。

与英伟达H200 HGX相比，Instinct MI325X在内存量、内存带宽及算力水平方面分别展现出1.8倍和1.3倍的优势。

在推理性能上，其相较H200 HGX也实现了约1.4倍的提升。

在Meta Llama-2等主流模型中，MI325X的单GPU训练效率已超越H200，但在集群环境中，两者则保持相当水平。

此外，AMD还着重介绍了其下一代MI300系列GPU加速器——MI355X。

该型号基于下一代CDNA 4架构，并采用3nm制程工艺，其内存容量已升级至288GB HBM3E。

MI355X能够同时支持FP4和FP6数据类型，从而在保持计算精度的同时，进一步提升AI训练和推理性能。

AMD方面表示，下一代CDNA 4架构相较于CDNA 3架构，预计将有35倍的性能提升和7倍的AI算力提升，同时内存容量和带宽也将提升约50%。

因此，明年的Instinct MI355X AI GPU在性能上预计将实现巨大飞跃。

根据AMD目前公布的数据，Instinct MI355X AI GPU在FP16数据格式下的算力可达到2.3PF，相较于MI325X提高了1.8倍，并与英伟达B200的算力持平。

而在FP6和FP4格式下，其算力则能达到9.2PF，较B200在FP6格式下的算力提高近一倍，与B200在FP4格式下的算力相当。

因此，MI355X被视为AMD真正对标B200的GPU芯片。

Blackwell GPU的生产问题目前已解决

此前有报道称，Blackwell架构产品的生产过程中遭遇了一些问题，具体表现为良品率较低，进而影响了出货量。

英伟达Blackwell GPU作为首批采用台积电CoWoS-L封装技术的产品，该技术通过LSI桥接器构建高密度互联，能够无缝兼容各类高性能芯片。

然而，由于GPU芯片、RDL中间层、LSI桥接器及基板之间的热膨胀系数（CTE）存在差异，这在一定程度上给生产带来了挑战。

摩根士丹利指出，英伟达Blackwell GPU在生产过程中出现的良率下降问题主要发生在后封装阶段，这进一步加剧了原本就紧张的CoWoS封装及HBM3e内存的供应状况。

不过，该机构认为英伟达已内部解决了这些问题。

摩根士丹利预测，英伟达将在今年第四季度出货最多45万张Blackwell GPU，有望实现50亿美元至100亿美元的营收。

同时，该机构还表示，由于当前Blackwell GPU订单已排满至明年下半年，无法满足的订单将转而推动Hopper GPU的需求增长。

英伟达Blackwell GPU的生产问题曾被视为AMD公司的一个潜在机遇，然而，这一机遇并未如预期般兑现。

AMD的UDNA与英伟达CUDA竞争生态位

在ADVANCING AI 2024大会上，AMD进一步揭示了其AI芯片发展蓝图，宣布基于CDNA 4架构的MI350系列将于明年面世，而MI400系列则将采用更为先进的CDNA架构。

然而，要撼动英伟达CUDA生态的领先地位，AMD仍面临诸多挑战，需付出长期努力。

UDNA作为AMD的一项长远布局，其潜力尚需时间验证。

AMD在扩大市场份额的过程中，面临的主要挑战在于英伟达通过其CUDA平台在AI软件开发领域构建了坚固的壁垒，吸引了大量开发人员并深度绑定了他们与英伟达的生态系统。

CUDA生态系统，作为英伟达所独有的并行计算平台与编程模型，现已确立为AI领域及高性能计算任务中的基准标准。

AMD所面临的挑战，不仅聚焦于硬件性能的提升，更在于构建一个能够吸引开发人员与数据科学家关注的软件生态系统。

为此，AMD已加大对其ROCm（Radeon Open Compute）软件堆栈的投资力度，并在近期活动中宣布，已成功将AMD Instinct MI300X加速器在广泛应用的AI模型中的推理与训练性能提升一倍。

此外，该公司还指出，已有超过百万个模型能够在AMD Instinct平台上无缝运行，这一数字是MI300X推出之初的三倍。

退出高端显卡市场，专注AI市场

对于游戏玩家群体，主流大厂针对英伟达产品的专属优化策略展现出了难以抗拒的吸引力。

鉴于此，AMD目前暂时退出高端显卡市场的举措，被视为一项更为明智的商业抉择。

值得注意的是，这并非AMD首次在高端市场向英伟达让步。

回溯至2017至2019年间，AMD实际上已缺席高端显卡领域，彼时Vega 64与Radeon VII相继淡出市场，仅依赖RX580与RX590两款产品在中低端市场维持竞争力。

AMD当前的战略重心聚焦于中低端市场，旨在扩大用户基础，并通过庞大的用户群体引导开发者优化产品。

此外，AMD的战略性撤退或可视为其在AI领域[梭哈]的前奏。

鉴于AMD董事长兼首席执行官苏姿丰博士对AI超级周期刚刚启幕的坚定判断，公司将AI视为未来发展的关键方向，不惜重注投入。

面对AI芯片这一快速增长的市场，AMD无疑不愿错失良机。

尽管其CPU业务因ZEN架构的成功而持续繁荣，但独立显卡、尤其是高端游戏显卡的市场表现却难尽如人意。

因此，扬长避短、专注于AI产品的开发，成为了AMD当前最合理的选择。

尽管英伟达在AI训练性能领域依然保持显著优势，但AI领域的真正盈利点在于推理工作负载。

简而言之，训练是通过数据集来[教育]AI模型的过程，而推理则是训练后的模型对全新数据进行预测的过程。

但值得注意的是，AMD对其加速服务器产品的定价策略相当激进，这与净利润率超过50%的英伟达形成了鲜明对比。

这一策略与AMD在CPU市场上削弱英特尔地位所采用的方法如出一辙，鉴于性价比优势，该策略或将促使部分客户从英伟达转向AMD。

AMD当下的首要目标是争取更多的市场订单

TechInsights公司的研究报告指出，英伟达在2023年的数据中心GPU出货量达到了约376万台，占据了97.7%的市场份额，这一比例与2022年大致相当。

相比之下，AMD和英特尔分别以50万台和40万台的出货量位列其后，市场份额分别占据了1.3%和1%。

对于AMD而言，其当前的主要目标并非超越英伟达，而是积极争取更多的市场订单。

作为英伟达在市场上的少数竞争对手之一，AMD始终被科技巨头视为多元化的选择之一。

目前，AMD业务中AI芯片所占比重持续攀升。

依据AMD二季度财务报告，AMD Instinct MI300X GPU在当季度为AMD贡献了超过10亿美元的营业收入，并预计全年销售额将突破45亿美元大关，约占公司整体销售额的15%。

值得注意的是，包括微软、OpenAI、Meta、Cohere、Stability AI、Lepton AI及World Labs在内的多家企业，在其生成式AI解决方案中均选用了AMD Instinct MI300X GPU。

除了获得科技巨头的支持外，AMD产品的性价比优势也是其抢占市场的重要因素。

英伟达由于其技术领先和市场高占比，其产品溢价较高。

相比之下，AMD的MI300系列在性能上已经超越了英伟达的H100，且价格更为亲民。

这一性价比优势使得AMD在AI芯片市场上具有较大的发展潜力。

基于以上分析，苏姿丰对AMD在2024年的人工智能芯片收入预测进行了上调，预计将达到超过45亿美元的水平，这一数字高于其4月份的预估值40亿美元。

这进一步表明了AMD在AI芯片市场上的强劲增长势头和广阔发展前景。

与英伟达相似，AMD亦规划每年推出全新的AI芯片产品。

结尾：

对于AMD而言，虽然英伟达产能的恢复可能带来竞争压力，但幸运的是，AMD也已逐渐找到了适合自己的竞争节奏。

展望2025年，两大芯片巨头将在GPU领域再次正面交锋，这将是检验双方综合实力的关键一年。

随着技术的不断进步和GPU在更多领域的广泛应用，这两家公司将持续优化GPU架构、提高计算效率，共同推动智能互联时代的到来。

部分资料参考：潮外音：《AMD发布最强AI芯片，对标英伟达Blackwell，2025年上市》，至顶头条：《AMD发力GPU计算领域，现在压力来到英伟达这边》，机器之心：《AMD的GPU跑AI模型终于Yes了？PK英伟达H100不带怕的》，电子发烧友网：《AMD最强AI芯片，性能强过英伟达H200，但市场仍不买账，生态是最大短板？》，美股研究社：《AMD 即将夺得英伟达的 AI 领先地位》，报告财经：《OORT创始人：AMD在AI芯片市场对英伟达的挑战》， NO 易摸：《AMD最强AI芯片登场，性能或彻底超越英伟达》，三易生活：《放弃高端显卡市场，AMD或是选择了[梭哈]AI》，赛博汽车：《挑战英伟达，AMD正成为一家AI芯片公司》，大盛唐电子：《英伟达与AMD：GPU竞争的历史与未来》

原文标题 : AI芯天下丨分析丨未来的大模型，或许都是A卡来算的？