AI基建需求续成长,DeepSeek崛起凸显产业将更注重高成本效益
根据TrendForce最新研究,DeepSeek近期连续发表DeepSeek-V3、DeepSeek-R1等AI模型,将促使终端客户未来更审慎评估投入AI基础设施的合理性,采用更具效率的软体运算模型,以降低对GPU等硬体的依赖。CSP则可能扩大采用自家ASIC基础设施,以降低建置成本。因此,2025年以后产业对GPU AI晶片或半导体实际需求可能出现变化。
TrendForce表示,全球AI server市场自2023年起快速成长,预期2025年占整体server出货比例将逾15%,至2028年有望接近20%。近年大型CSP业者应AI训练需求积极扩建,自2025年起将扩展重心至边缘AI推理,除了采用NVIDIA Blackwell等新一代GPU平台,AWS等也加大开发自家ASIC力道,以提升成本效益、满足特定AI应用需求。中国CSP和DeepSeek等相关AI业者面对美国晶片出口禁令,著重开发更高效的AI晶片或演算法,以促进AI需求和应用的多元发展。
AI 行业过去依赖扩大模型、增加数据和提升硬体效能来发展,但成本与效率成为挑战。DeepSeek 采用蒸馏模型(Model Distillation)技术,压缩大型模型以提升推理速度并降低硬体需求,同时充分发挥 NVIDIA Hopper 降规版晶片的效益,最大化运算资源利用。其成本优势来自高效能硬体选择、新型蒸馏技术及 API 开源策略,不仅优化技术与商业应用的平衡,也展现 AI 产业向高效发展的趋势。
TrendForce指出,在美国晶片禁令持续的情况下,预期中国AI市场将朝两个重点方向发展。首先, AI相关业者将加速投入自主AI晶片或供应链发展,如中系大型CSP业者等除尽量采购目前尚可取得的H20外,未来将加速扩大发展自有ASIC,应用于自家资料中心。其次,中国将利用既有的互联网基础优势,以软体补足硬体缺陷,上述DeepSeek打破常规,改采蒸馏技术强化AI应用机会即是。
整体而言,预期未来美国政府可能对中国相关AI或半导体禁令趋严下,迫使欲投入AI发展的中国业者加速发展自有AI晶片或HBM等硬体。尽管其效能不及NVIDIA等GPU方案,然主要为满足中国市场自用资料中心基础建设,单位晶片效能已非唯一考量。此外,DeepSeek等业者近期朝AI多模态模型发展,力求在更低的训练成本下,于特定应用领域达到类似效能,以加速实现商用化。