AI推理时代来临:从GPU到ASIC的晶片技术与生态竞逐

摘要

2025年随著AI Inference需求大幅扩展,各大GPU供应商接连推出针对Inference Prefill阶段设计的AI晶片,例如NVIDIA Rubin CPX、Intel Crescent Island、Qualcomm AI200;此外,中国华为也推出Prefill专用ASIC Ascend 950PR。然而,即使Google、AWS、Meta、Microsoft等四大CSP皆已推出Inference应用的ASIC,仍未推出针对Prefill阶段的ASIC。

因此本篇报告主要深度解析:(1)目前ASIC开发进度;(2) ASIC与GPU能效比较;(3) Inference对AI晶片的规格要求;(4)目前Inference Prefill晶片发展;(5) Inference应用的ASIC技术规格展望。期能为厂商与投资人解析在Inference应用扩增背景下ASIC的市场发展方向。

一. 目前ASIC开发进度
二. ASIC与GPU能效比较
三. Inference对AI晶片规格要求
四. 目前Inference Prefill晶片发展
五. Inference应用的ASIC技术规格展望
六. 拓墣观点

图一 AI晶片能效比趋势
图二 Scaling Law三阶段
图三 SPAD架构示意图
图四 NVIDIA Rubin CPX结构
图五 VR NVL144 CPX Compute Tray
图六 华为Ascend 950PR
图七 Intel Crescent Island
图八 Qualcomm AI200

表一 2024~2027年AI晶片Roadmap
表二 2026~2028年ASIC设计服务商预计取得专案
表三 主要AI晶片算力与能效比
表四 Prefill与Decode比较
表五 目前已公布Inference AI晶片列表
表六 AI晶片规格演进

 

AI推理时代来临:从GPU到ASIC的晶片技术与生态竞逐

请输入您的会员账号与密码,即可浏览全文

Login 如何购买 下载完整报告档案 1.33MB PDF

会员专属
您好,该资料属会员权益方可浏览,您需成为会员且购买此产业项目权限才可观看,详细说明如下:
  • 拓墣产业研究院之「产业数据库」为付费的会员服务,若您尚未具备会员身份,欢迎您申请加入或是与我们的客服联络了解。
  • 若您所属公司机关已具有拓墣会员身份,并且设定予贵公司人员在线申请,请先行移至「申请会员账号」填写申请数据后送出,我们会尽快为您审核办理。若未开放在线申请,请您询问贵公司的承办联系人处理,谢谢。
  • 由于贵公司无采购此产业项目,因此您将无法浏览此篇文章,欲查询贵公司所购买的产业项目明细,请至「会员权益」查询,谢谢。
  • 客户服务专线: 02 8978-6498 ext.822
    客户服务信箱:

宣传推广

产业洞察

Apple全面调价添消费端需求变数,预估2026年全球笔电出货将衰退13.6%

根据TrendForce最新笔电产业研究,Apple全面调涨MacBook售价已改变过去市 [...]

Apple将导入未来显示色彩基准,加速重构OLED发光材料体系

根据TrendForce最新AMOLED技术与市场报告,Apple计画陆续于MacBook [...]

NVIDIA 800V Power Rack成Vera Rubin选用方案,预估至Rubin Ultra世代扩大采用

根据TrendForce最新AI server供电架构研究,NVIDIA正积极打造自家80 [...]

日本加速全固态电池研发、供应链建立,国家补助金额已达6.6亿美元

根据TrendForce最新《全球固态电池产业发展动态季报_2Q26》,日本政府近年扩大支 [...]