AI推理时代来临:从GPU到ASIC的晶片技术与生态竞逐

摘要

2025年随著AI Inference需求大幅扩展,各大GPU供应商接连推出针对Inference Prefill阶段设计的AI晶片,例如NVIDIA Rubin CPX、Intel Crescent Island、Qualcomm AI200;此外,中国华为也推出Prefill专用ASIC Ascend 950PR。然而,即使Google、AWS、Meta、Microsoft等四大CSP皆已推出Inference应用的ASIC,仍未推出针对Prefill阶段的ASIC。

因此本篇报告主要深度解析:(1)目前ASIC开发进度;(2) ASIC与GPU能效比较;(3) Inference对AI晶片的规格要求;(4)目前Inference Prefill晶片发展;(5) Inference应用的ASIC技术规格展望。期能为厂商与投资人解析在Inference应用扩增背景下ASIC的市场发展方向。

一. 目前ASIC开发进度
二. ASIC与GPU能效比较
三. Inference对AI晶片规格要求
四. 目前Inference Prefill晶片发展
五. Inference应用的ASIC技术规格展望
六. 拓墣观点

图一 AI晶片能效比趋势
图二 Scaling Law三阶段
图三 SPAD架构示意图
图四 NVIDIA Rubin CPX结构
图五 VR NVL144 CPX Compute Tray
图六 华为Ascend 950PR
图七 Intel Crescent Island
图八 Qualcomm AI200

表一 2024~2027年AI晶片Roadmap
表二 2026~2028年ASIC设计服务商预计取得专案
表三 主要AI晶片算力与能效比
表四 Prefill与Decode比较
表五 目前已公布Inference AI晶片列表
表六 AI晶片规格演进

 

AI推理时代来临:从GPU到ASIC的晶片技术与生态竞逐

请输入您的会员账号与密码,即可浏览全文

Login 如何购买 下载完整报告档案 1.33MB PDF

会员专属
您好,该资料属会员权益方可浏览,您需成为会员且购买此产业项目权限才可观看,详细说明如下:
  • 拓墣产业研究院之「产业数据库」为付费的会员服务,若您尚未具备会员身份,欢迎您申请加入或是与我们的客服联络了解。
  • 若您所属公司机关已具有拓墣会员身份,并且设定予贵公司人员在线申请,请先行移至「申请会员账号」填写申请数据后送出,我们会尽快为您审核办理。若未开放在线申请,请您询问贵公司的承办联系人处理,谢谢。
  • 由于贵公司无采购此产业项目,因此您将无法浏览此篇文章,欲查询贵公司所购买的产业项目明细,请至「会员权益」查询,谢谢。
  • 客户服务专线: 02 8978-6498 ext.822
    客户服务信箱:

宣传推广

产业洞察

可回收技术有望降低火箭发射成本,全球大厂加速推进

根据TrendForce最新研究,由于Starlink部署卫星星系需求上升,加上美国太空军 [...]

PlayNitride将并购Lumiode,加速近眼显示Micro LED发展

PlayNitride (錼创科技)董事会于12月16日公告表示,将以200万美元收购美国 [...]

汽车电动化、智慧化加速,预估2029年车用半导体市场规模达近千亿美元

根据TrendForce最新调查,随著汽车产业加速电动化、智慧化进程,预计将推升全球车用半 [...]

消费性电子与AI新品激励,3Q25前十大晶圆代工产值季增8.1%

根据TrendForce最新调查,2025年第三季全球晶圆代工产业持续受AI高效能运算(H [...]

1Q26记忆体涨势续强,手机、笔电品牌启动价格上修与规格降级

根据TrendForce最新调查,由于预期2026年第一季记忆体价格将再显著上涨,全球终端 [...]