2026-06-12 拓墣产业研究院

AI Inference时代的新记忆体需求

焦点报告 AI关键软硬体

意见反映字体大小小中大

摘要

2026年1月NVIDIA发表由BlueField-4 DPU管理的CMX情境记忆储存平台(CMX Context Memory Storage Platform)，扩展Local SSD、Share Storage之间的记忆体阶层，以因应在AI Inference时代庞大的KV Cache储存需求。此外，NVIDIA、Arm接连推出CPU机柜以因应Agentic AI的CPU需求，也创造CPU RAM的增量市场。

本篇报告主要深度解析：(1) AI Inference的记忆体需求；(2) KV Cache Offloading带动的SSD POD需求；(3) Agentic AI带动的CPU RAM需求。期能解析AI Inference时代记忆体容量需求膨胀原因、现有解决方案与未来新记忆体需求结构。

一. AI Inference的记忆体需求
二. KV Cache Offloading带动的SSD POD需求
三. Agentic AI带动的CPU记忆体需求
四. 拓墣观点

图一　2023～2026年AI Models Average Output Tokens per Question
图二　KV Cache应用范例
图三　Agentic AI应用的CPU：GPU比例变化
图四　NVIDIA Dynamo KV Cache Offloading顺序(G1～G4)
图五　NVIDIA Vera CPU架构
图六　2026年NVIDIA CPU需求量情境分析结果

表一　2023～2026年各厂商CPU记忆体规格
表二　2026年NVIDIA CPU出货量情境分析假设
表三　AI Inference带动的记忆体需求动能汇整

会员专属

您好，该资料属会员权益方可浏览，您需成为会员且购买此产业项目权限才可观看，详细说明如下：

拓墣产业研究院之「产业数据库」为付费的会员服务，若您尚未具备会员身份，欢迎您申请加入或是与我们的客服联络了解。
若您所属公司机关已具有拓墣会员身份，并且设定予贵公司人员在线申请，请先行移至「申请会员账号」填写申请数据后送出，我们会尽快为您审核办理。若未开放在线申请，请您询问贵公司的承办联系人处理，谢谢。
由于贵公司无采购此产业项目，因此您将无法浏览此篇文章，欲查询贵公司所购买的产业项目明细，请至「会员权益」查询，谢谢。