Token調用量大爆發,AI云成了一門好生意

【Token調用量大爆發,AI云成了一門好生意】Token調用量大爆發,AI云成了一門好生意


作者|林易
編輯|重點君
剛過去的三月份 , AI行業最熱的詞屬于Token(詞元) 。 幾件事情幾乎同時發生:
國內 , 國家數據局局長劉烈宏在中國發展高層論壇宣布:中國日均Token調用量已突破140萬億 , 較兩年前的1000億暴增千倍 。
海外 , 英偉達創始人黃仁勛在GTC大會上說:Token將是未來數字世界最核心、最值錢的大宗商品 , Token的吞吐量將成為全球企業CEO追蹤的核心經營數據 。
同樣在三月 , 阿里云在財報電話會上公布了一個非常激進的目標:五年內云與AI商業化年收入突破1000億美元 , 隱含年復合增長率約47% 。 此外 , 字節跳動云計算業務火山引擎的豆包大模型日均調用量超過100萬億Tokens , 躋身全球前三 。
云計算作為AI時代的底層基礎設置 , 重要性越來越高 , 而AI云正成為一門真正的好生意 。
什么是好生意?在科技行業 , 標準基本可以概括為三條指標:規模效應帶來的邊際成本遞減、客戶生態鎖定帶來的高轉換成本 , 以及建立在標準化產品之上的高毛利率與經常性收入 。
這三條 , 亞馬遜AWS、微軟Azure、谷歌Cloud幾乎同時滿足 。 它們通過提供標準化的IaaS、PaaS、SaaS , 構建了高壁壘、高利潤的商業閉環:資源池越大成本越低 , 客戶一旦遷入就難以離開 , 軟件訂閱則持續產生高毛利現金流 。 2025自然年 , 這三家云廠商的利潤分別高達456億、540億和139.1 億美元 。
但中國云計算卻走上了一條截然不同的路 。 過去十幾年 , 盡管市場大盤不斷擴大 , 但國內云廠商長期陷入了重資產、低毛利、高度內卷的集成商困境 , 利潤卻始終做不上去 。 背后原因在于特殊的IT消費習慣、貧弱的SaaS生態 , 以及大型政企客戶對高度定制化的偏好 。 傳統IaaS階段 , 由于各家云廠商提供的計算、存儲和網絡資源高度同質化 , 市場競爭最終往往淪為價格戰 。 為了爭奪非互聯網行業的政企大客戶 , 云廠商做了大量低毛利、高人力的定制化開發與本地部署工作 , 這使得云計算從一種本應具備高度規模效應的輕量化服務 , 變為了以人力和硬件堆砌為主的傳統IT項目制生意 。
直到這一輪AI浪潮 , 為國內云計算廠商帶來了重構商業模式的機會:將大模型封裝成可調用、可計費的標準化云服務 , 賣給企業與開發者 , 成為新的增長引擎 。

從價格戰到漲價潮
AI首先推動了云計算行業的結構性增長 。 2025年第一季度 , 中國云基礎設施服務支出達116億美元 , 同比增長16% , AI相關需求已成為推動企業向云端遷移的主要動力 。 另據Omdia報告 , 2025年中國AI云市場規模預計達518億元 , 同比增長148% , 到2030年將突破1930億元 。 (注:各家云廠商對AI云的定義有所不同)
但增長背后曾是慘烈的價格戰 。 2024年5月 , 火山引擎旗下豆包大模型在國內率先掀起大模型的降級潮 , 此后 , 阿里云、百度智能云等相繼跟進 , 大模型Token定價在不到一年內狂降超90% , 部分云廠商的推理算力毛利率跌為負數 。 他們策略是“以虧損換規模” , 畢竟誰能先在開發者和企業客戶中建立起API調用習慣 , 誰就能在未來占據主動 。
直到2026年初 , 價格戰信號才開始逆轉 。 海外 , 亞馬遜AWS與谷歌Cloud先后宣布漲價 , 國內 , 阿里云、百度智能云、騰訊云隨即跟進 。 3月18日阿里云和百度智能云同步官宣漲價 , 其中:
阿里云最高漲34%:對AI算力、存儲等產品進行調價 。 其中 , 采用自研芯片的平頭哥真武810E等算力卡產品上漲5%-34%;滿足高性能計算的文件存儲產品CPFS上漲30% 。 新價格于2026年4月18日起執行 。
百度智能云最高漲30%:AI算力相關產品服務上調約5%-30%;并行文件存儲等上調約30% 。 同樣于2026年4月18日起生效 。
漲價最直接的導火索就是激增的Token需求 。 單純的大模型對話帶來的Token消耗有限 , 而2026年Agent爆發和多模態模型成熟徹底擴容了AI云市場 。 尤其是Claude Code、OpenClaw等智能體產品的走紅 , 讓科技公司意識到 , 一次智能體任務往往包含多輪內部推理、工具調用和任務執行 , 其Token消耗量通常顯著高于普通的AI對話 。 算力需求從“云端訓練”徹底轉變為“訓練+推理”雙輪驅動 , 導致現有AI算力資源極度緊缺 。
正是這種算力供需關系的變化 , 直接催生了商業計費模式的改變 。

從IaaS算力租賃到MaaS Token經濟學
在傳統的IaaS階段 , 云廠商的核心商業模式是作為“二房東” , 出租底層計算資源、存儲空間和網絡帶寬 , 同質化嚴重 。
Token出現打破了這一局面 。 Token是AI模型處理語言、圖像、音視頻的最小語義單元 , 用戶每次與大模型交互 , 最終都被拆解成Token完成運算 。 以Token計費 , 云廠商從\"賣硬件使用權\"轉變成了\"賣智能服務\" 。
這套模式有優勢非常明顯:首先是抹平了硬件同質化 。 用戶不再關心底層是什么GPU , 只關心同等Token能否完成任務;其次是天然放大了規模效應 。 算力池越大 , 并發調度效率越高 , 分攤到每個Token的邊際成本越低;最后是標準化API接口形成了生態鎖定 , 調用習慣一旦建立 , 遷移成本極高 。 云服務真正變成了像水電一樣 , 打開即用 , 接上即跑 。
云廠商也正在將緊缺的AI算力資源向高附加值的Token業務傾斜 。 比如 , 騰訊云在過去一個多月快速整合資源 , 推出了覆蓋云端、C端及企業版的“龍蝦”產品矩陣 , 并直接將原有的MaaS大模型服務平臺升級為TokenHub , 推出統一的Token Plan服務 。
智能體的普及使得原本按次調用的能力變成了高頻、自動化的服務 , 極大地推高了云廠商的Token流水 , 也讓MaaS業務有望在未來占到云廠商整體收入的30%甚至更高 。
據《財經雜志》報道 , 2025年12月末 , 阿里云智能集團資深副總裁、公共云事業部總裁劉偉光在一場小規模溝通中稱 , MaaS收入在云廠商整體收入的占比 , 有可能達到30%甚至更高 。 此外 , 亞馬遜AWS管理層在2025年三季度財報電話會議上也曾披露 , 要把Bedrock打造成全球最大的推理平臺 , 收入貢獻將與其核心計算產品EC2不相上下 , 預計在總營收中占比超過30% 。
而這正是頂級云生意所需要的\"經常性、高毛利、可復制\"的收入結構 。

AI云的勝負手是全棧成本的競爭
模式雖好 , 但AI云的競爭正變得日趨激烈 。
海外 , 轉型AI云 , 成為亞馬遜AWS、微軟Azure、谷歌Cloud、甲骨文OCI的共同目標;國內 , 阿里云、百度智能云、騰訊云、火山引擎、華為云等科技云廠商 , 也紛紛強化自己的AI屬性 。 各家云廠商的資本開支 , 也持續創新高 。
在我們看來 , AI云的競爭不是單純的算力競爭 , 而是全棧成本的競爭 。 勝負手不在于誰的GPU更多 , 而在于誰能實現最低的\"單位Token成本\" 。
美國四大云廠商的競爭已經驗證了這個邏輯 。 谷歌是全棧整合程度最高的玩家 , Gemini系列模型由自研TPU訓練、部署在TPU上 , 芯片、模型、云服務三位一體 , 同時掌握成本控制權與定價權 。 亞馬遜累計交付超140萬枚自研Trainium 2芯片 , 性價比比同類英偉達GPU高30%-40% 。 反面教材案例甲骨文 , 無自研芯片 , 算力建設完全依賴英偉達 , 資本支出超過自身經營性現金流 , 同時高度依賴OpenAI單一客戶 , 處境最為脆弱 。
中國云廠商面臨同樣的競爭邏輯 , 疊加地緣壓力 , 維度更為復雜 。
阿里云擁有規模與全棧的雙重優勢 , 護城河最深 。 百煉MaaS平臺聚合通義千問、DeepSeek等數十款主流模型;已累計向實際業務部署出貨超過47萬顆AI芯片 , 60%以上服務于外部商業化客戶 。 未來三年 , 阿里宣布將投入超3800億元用于云和AI基礎設施建設 。
百度智能云不急于搶Token流量規模 , 而是向能源、金融、汽車等垂直行業的核心流程深度滲透 , 憑借自研芯片昆侖芯、文心大模型與千帆平臺的\"芯-云-模-體\"全棧自研體系 , 連續兩年拿下國內大模型招投標項目數和中標金額雙料第一 。
火山引擎走的是激進的MaaS優先路線 。 字節跳動內部抖音、視頻創作、Seedance視頻生成模型等龐大的應用生態 , 平攤了基礎設施固定成本 , 讓火山引擎在Token價格上得以持續激進定價 。 據《晚點》報道 , 火山引擎此前曾定下了2026年MaaS業務收入超百億元的目標 , 隨著Seed 2.0、Seedance 2.0 等模型發布、OpenClaw持續爆火 , 團隊已提升了收入目標 。
騰訊云過去幾年實現艱難轉型 。 2022年前后 , 騰訊云主動砍掉低毛利總包業務 , 聚焦高毛利自研PaaS/SaaS產品 , 將\"被集成\"而非\"總集成\"樹立為核心戰略 。 短期市場份額承壓 , 但改善收入結構:2025年IaaS占四成、PaaS占四成、SaaS占兩成 , 而PaaS與SaaS的毛利率維持在50%-70% , 遠高于IaaS的10%-15% 。 成立12年后 , 首次實現規?;?, 馬化騰在財報中將其列為當年核心成就 。

生成Token的成本與效率決定一切
AI將云計算的計費單元從同質化的算力資源轉向差異化的智能服務;Token的爆炸式增長 , 使MaaS層收入很長一段時間內看不到天花板;標準化API帶來的規模效應與生態鎖定 , 正在賦予頭部云廠商一定程度的定價權 。
AI讓云計算的生意模式變好了 , 但機會注定只屬于少數玩家:有充裕的現金流 , 能承受千億級算力軍備投入;能自研芯片或深度國產算力整合能力 , 在英偉達生態之外構建成本控制能力;以及有自研模型和MaaS工程化落地能力 , 因為模型強弱直接決定單卡Token吞吐量 , 決定單Token成本 , 最終決定毛利率 。
正如黃仁勛所說:生成Token的成本與效率 , 決定科技企業的營收與生死 。

    推薦閱讀