Meta與谷歌達成數十億美元AI芯片合作 將租用谷歌云自研的TPU

Meta與谷歌達成數十億美元AI芯片合作 將租用谷歌云自研的TPU

2 月 27 日消息 , 據《The Information》援引匿名消息人士報道 , Meta 已與谷歌達成一項價值數十億美元的合作協議 , 將租用谷歌云自研的張量處理單元(TPU) , 用于訓練和運行其下一代大語言模型 。 這一合作不僅是 Meta 推動 AI 硬件供應鏈多元化的重要舉措 , 也成為谷歌向 AI 芯片市場霸主英偉達發起挑戰的關鍵一步 。


當下 , 全球科技巨頭正為 AI 算力基礎設施投入巨額資金 , Meta 便是其中之一 , 而谷歌則看準這一市場機遇 , 將自研 TPU 作為云業務的核心增長引擎 。 目前 AI 芯片市場仍由英偉達 GPU 主導 , 全球絕大多數 AI 應用均基于其產品搭建 , 而谷歌 TPU 憑借高性價比成為頗具吸引力的替代選擇 , 尤其在大模型訓練和推理場景中優勢顯著 。
極客網此前報道 , 谷歌在 2025 年 11 月推出了最新一代 Ironwood TPU , 這款旗艦產品擁有極強的算力和擴展能力:單服務器集群可部署多達 9216 顆 Ironwood TPU , 通過高速互連技術實現 9.6 太比特 / 秒的帶寬 , 還能對接 1.77 拍字節的共享高帶寬內存(HBM) 。 據谷歌官方數據 , 該款 TPU 的 FP8 精度百億億次浮點運算能力是最接近競爭對手的 118 倍 , 相比上一代 Trillium TPU , 訓練和推理性能提升 4 倍 。
對 Meta 而言 , 與谷歌的合作是其擺脫對英偉達單一依賴的重要布局 。 作為英偉達的核心大客戶 , Meta 本月初剛宣布將在英偉達新一代 Vera Rubin GPU 今年下半年量產后 , 采購數百萬顆該產品 , 而這款 GPU 目前已完成樣品交付 , 進入量產籌備階段 。 但 Meta 顯然不愿將算力命脈系于單一供應商 , 本周早些時候 , 其還與英偉達的主要競爭對手 AMD 達成了數十億美元的 AI 芯片采購協議 , 將購入包括最新 Instinct MI400 系列在內的多款產品 。 此外 , Meta 還獲得了認購 AMD 10% 股份的期權 , 若雙方合作達到預定性能目標 , 該期權將正式生效 。
分析認為 , Meta 的供應鏈多元化布局有著明確的商業邏輯 , 因為不同類型的 AI 處理器各有優劣 , 可針對不同的 AI 工作負載實現最優搭配;同時 , 通過引入多家芯片供應商的競爭 , Meta 能在算力基礎設施建設中爭取更優惠的價格 , 進一步降低 AI 研發成本 。
而谷歌則希望借助此次合作 , 打破英偉達在 AI 芯片市場的壟斷格局 。 此前 , 谷歌 TPU 僅通過谷歌云平臺以租用形式向客戶開放 , 如今其計劃改變商業模式 , 直接向客戶銷售芯片 , 讓企業可在自有私有數據中心部署 。 谷歌預計 , 這一策略有望在未來幾年搶占英偉達數據中心業務 10% 的營收份額 。
據悉 , Meta 目前還在與谷歌洽談另一項獨立合作 , 計劃為自有數據中心采購數百萬顆 TPU , 不過雙方目前尚未達成最終協議 。
值得關注的是 , 此次與谷歌的合作 , 也讓外界對 Meta 的自研芯片計劃產生更多關注 。 Meta 的自研訓練和推理加速器(MTIA)芯片上一次更新是在 2024 年 , 其原本計劃與臺積電合作開發新一代產品 , 并于 2026 年推出 , 這款芯片針對初代產品薄弱的 AI 模型訓練能力進行了優化 , 但據悉因遭遇技術難題 , 量產計劃已被迫推遲 。
【Meta與谷歌達成數十億美元AI芯片合作 將租用谷歌云自研的TPU】事實上 , Meta 的自研芯片之路本就波折不斷 , 其先后放棄了 Iris、Olympus 兩款自研訓練芯片的研發 , 核心原因在于芯片軟件穩定性不足、設計復雜難以規?;a , 在與 OpenAI、谷歌的大模型競爭中 , 自研芯片的風險讓其選擇暫時轉向外部采購 。

    推薦閱讀