給數據中心裝上AI大腦,商湯亮出“算電協同”方案,全年節電超1000萬度

給數據中心裝上AI大腦,商湯亮出“算電協同”方案,全年節電超1000萬度

文章圖片

給數據中心裝上AI大腦,商湯亮出“算電協同”方案,全年節電超1000萬度

文章圖片


智東西
作者 | 陳駿達
編輯 | 心緣
智東西12月12日報道 , 近日 , 在第二十屆中國IDC產業年度大典(IDCC2025)暨數字基礎設施科技展(DITExpo)上 , 商湯科技大裝置事業群智算中心總經理林海分享了商湯大裝置在算電協同方面的實踐經驗 。
林海稱 , 從全球范圍看 , 算力基礎設施正迎來新一輪“算力效能”戰略競爭 , 包括各大科技巨頭通過自研AI加速器、數據中心液冷、可再生能源電力協同等方式不斷提升算力效能 。
同時以 Palantir “Chain Reaction”等平臺為代表 , 將算力調度、電力預測與芯片資源管理納入同一體系 , 試圖構建“國家級AI基礎設施操作系統” 。
商湯大裝置在算電協同領域已展開探索 , 并給出了一套“算力—能源”協同的建設范式 。

一、全球推進“算力—能源”協同 , 商湯大裝置構建算電融合體系林海講道 , 近期 , 美國知名大數據企業Palantir Technologies Inc.(NYSE: PLTR)正式發布了名為“Chain Reaction”的產品 , 并將其定位為“面向美國人工智能基礎設施的操作系統” 。
這一舉措表明 , 以美國為代表的科技強國已開始從國家戰略層面 , 系統推進推動“算力—芯片—能源”一體化布局 , 旨在構建自主可控、高效協同的國家級人工智能基礎設施體系 。
在這一全球趨勢下 , 商湯大裝置基于自身萬卡級智算中心(AIDC)的長期運營實踐 , 于2025年7月正式發布了自主可控的“算電協同智能調度平臺” , 打通算力及電力數據 。
這不僅是一項企業降本增效的技術工程 , 更是關系到我國在人工智能時代能否在基礎設施層面掌握發展主動權的戰略課題 。
隨著AI應用需求爆發與“雙碳”目標推進 , 電力正成為制約算力擴展與綠色運營的關鍵瓶頸 。 林海稱 , 新一代智算中心絕非單純堆服務器、拼規模的傳統數據中心 , 而是要實現“算力與能源的深度協同” 。
然而 , 當前行業普遍存在“模型任務數據、集群負載數據、底層電力調度數據”彼此割裂 , 以及結算機制的不穿透 , 造成了數據的孤島以及運行模式難以協同 。
【給數據中心裝上AI大腦,商湯亮出“算電協同”方案,全年節電超1000萬度】為破解這一結構性難題 , 商湯大裝置聚焦更深層次的基礎設施運行邏輯 , 構建了“IaaS+MaaS+算電協同”的整體架構體系 , 穿透從底層風、火、水、電到頂層模型任務的全鏈路數據 , 以“源-網-荷-儲”全鏈路算電協同平臺 , 實現算力與能源的精準匹配 。
其中 , 商湯以能源大模型為核心 , 打破數據孤島 , 實現智能預測與高頻調度;同時攜手寧德時代打造具備智能控制能力的大規模儲能系統 , 為算力負載波動提供靈活、穩定的電力支撐 。

二、能源大模型賦能:創新算法架構 , 讓負荷預測更精準商湯自研能源大模型采用多模態MoE架構 , 基于海量行業知識文本、能源結構化數據、算力監控指標等數據訓練而來 , 并充分融合能源行業知識庫 , 可精準預測復雜場景的能源需求 , 并做出準確決策:
(1)打通數據閉環 , 實現全鏈路精準映射:打造“算力-電力”映射模型 , 通過獨創的“能量塊”數據模型與“算電功耗模型” , 打通從AI訓練任務、算力平臺、服務器硬件與配電系統的全鏈路數據 , 實現“任務-算力-功耗”的精準映射 。
(2)創新“能量塊” , 復雜場景精準預測:通過將能源本征數據、用戶用能特性、能源平衡規則等信息與算力服務器綁定為“能量塊”作為基礎TOKEN , 并基于多輪預訓練結果優化調整算法架構 , 全面提升復雜場景下的預測精度與泛化能力 。
(3)高頻次動態調度 , 實現最優能源平衡:以15分鐘為周期進行高頻次預測 , 并以5分鐘為周期進行決策修正迭代 , 基于實時能源狀態與負載預測 , 自動生成最優調度策略 , 并通過跨系統聯動執行 , 實現精準的算力預測、負荷預測、策略生成與修正 。
整體上 , 能源大模型可提前預測算力負載趨勢 , 并綜合電價信號、綠電比例、儲能狀態、電網需求等因素 , 進行跨系統聯合動態求解 , 實現“算隨電用、電隨算動”的主動調度 , 將數據中心從“剛性負荷”轉變為“可調資源” 。
目前 , 基于能量塊的模型能源需求預測準確率已經達到88%以上 , 決策準確率已達到93%以上 。 隨著算法與儲能設備的持續迭代優化 , 預測準確率將達到90%~95%的行業領先水平 , 決策準確率將超過95% 。

三、聯合寧德時代打造智慧儲能系統 , AIDC跑通“算隨電用、電隨算動”雙向閉環在儲能側 , 商湯與寧德時代聯合打造了規模達17.888MW/35.776MWh的新型儲能系統 , 并為其賦予了智慧管理能力 , 面向大模型訓練和推理的高峰波動場景進行了專項設計 , 可有效應對算力集群在高負載階段出現的瞬時功率缺口與尖峰波動 , 同時參與削峰填谷和電力市場交易 , 直接創造經濟價值 。
這一儲能系統成為智算中心的“電力緩沖池” , 具備毫秒級響應能力 , 可以在萬卡級集群啟動、負載突增時提供瞬時功率支撐 , 有效應對算力負載波動帶來的沖擊 , 保障集群穩定運行 。
它還通過“分季節調度”實現安全效率平衡 , 在PUE較低的冬春秋季 , 采用傳統兩充兩放模式;在高PUE、低冗余的夏季 , 則切換至由能源大模型驅動的智能調度模式 , 確保系統在安全紅線內高效運行 。
得益于系統級的算電協同優化 , 由商湯建設并自持的全國首個5A級智算中心上海臨港AIDC不僅可以根據算力負載變化 , 自動優化算力調度 , 還可通過能源大模型預測用電需求 , 智能控制儲能系統實現削峰填谷 , 在保障穩定運行的同時持續降低能耗和用電成本 , 成功實現“算隨電用、電隨算動”雙向閉環 。
目前 , 上海臨港AIDC實現了整體PUE降低至1.267 , PUE比設計值降低3%、全年節電超1000萬度、年化電費成本節約7%、碳減排3000噸的運營成效 , 帶來顯著的經濟與社會效益 , 成為綠色智算中心“樣板間” 。 商湯大裝置上海臨港智算中心還獲得“2025年度中國IDC產業算電協同先鋒獎” 。

結語:能源成為AI基礎設施重要一環能源供給在AI基礎設施建設過程中的重要性與日俱增 。 隨著全球算力需求爆發式增長 , 大模型的訓練與推理正帶來前所未有的能源消耗挑戰 。 產業不僅需要更高的算力 , 更需要更高效、更穩定、更可持續的算力供給方式 。
未來 , 商湯大裝置將以能源大模型和系統級算法為核心引擎 , 深化產業合作 , 打造面向大模型時代的下一代AI基礎設施底座 , 為產業降本增效與綠色發展提供持續動能 。

    推薦閱讀