各類Al Server出貨占比預測：2030年ASIC品類有望提升至近40%

2026-04-05 人工智能 ai Google

【各類Al Server出貨占比預測：2030年ASIC品類有望提升至近40%】
根據TrendForce集邦咨詢最新AI Server研究，在大型云端服務供應商(CSP)加大自研芯片力道的情況下， NVIDIA（英偉達）在GTC 2026大會改為著重各領域的AI推理應用落地，有別于以往專注云端AI訓練市場。通過推動GPU、CPU以及LPU等多元產品軸線分攻AI訓練、AI推理需求，并借由Rack整合方案帶動供應鏈成長。

TrendForce集邦咨詢表示，隨著以Google（谷歌）、Amazon（亞馬遜）等CSP為首的自研芯片態勢擴大，預估ASIC AI Server占整體AI Server的出貨比例將從2026年的27.8% ，上升至2030年的近40% 。
為鞏固在AI市場的領導地位， NVIDIA采取的其中一項策略為積極推動GB300、VR200等整合CPU、GPU的整柜式方案，強調可擴展至AI推理應用。本次在GTC發表的Vera Rubin被定義為高度垂直整合的完整系統，涵蓋七款芯片和五款機柜。
觀察Rubin供應鏈進度，預計2026年第二季存儲器原廠可提供HBM4給Rubin GPU搭載使用，助力NVIDIA于第三季前后陸續出貨Rubin芯片。至于NVIDIA GB300、VR200 Rack系統出貨進程，前者已于2025年第四季取代GB200成為主力，預估至2026年出貨占比將達近80% ，而VR200 Rack則約在2026年第三季度末可望逐步釋放出貨量能，后續發展仍需視ODM實際進度而定。
另外， AI從生成跨入代理模型時代，在生成Token的譯碼(Decode)階段面臨嚴重的延遲與存儲器帶寬瓶頸。為此， NVIDIA整合Groq團隊技術，推出專為低延遲推理設計的Groq 3 LPU ，單顆內建500MB SRAM、整機柜可達128GB 。
然而， LPU本身的存儲器容量無法容納Vera Rubin等級的龐大參數與KV Cache 。 NVIDIA因此于本次GTC提出“解耦合推理(Disaggregated Inference)”架構，通過名為Dynamo的AI工廠作業系統，將推理流水線一分為二：處理代理型AI時，需進行大量數學運算并儲存龐大KV Cache的Pre-fill、Attention運算階段，交由具備極高吞吐量與巨量存儲器的Vera Rubin執行。而受限于帶寬且對延遲極度敏感的譯碼與Token生成階段，則直接卸載至擴充了巨量存儲器的LPU機柜上。
在供應鏈進度上，第三代Groq LP30由Samsung（三星）代工，已進入全面量產階段，預計于2026年下半年正式出貨，未來更規劃在下一代Feynman架構中推出效能更高的LP40芯片。

推薦閱讀

上一篇：亞布力論壇熱議人機共生，AI催生超級個體時代

下一篇：每周硬件推薦：2026年3月值哪些顯卡值得買？