日均 120 萬億 Token,火山引擎兩年前的賭注開始兌現

日均 120 萬億 Token,火山引擎兩年前的賭注開始兌現

文章圖片

日均 120 萬億 Token,火山引擎兩年前的賭注開始兌現

兩年前 , 火山引擎說要 All in Token 的時候 , 很多人覺得這是一句正確但空洞的口號 。 彼時大模型的商業化還停留在「有沒有用」、「用不用得起」的爭論里 , Token 這個詞對大多數企業來說 , 更像是一個技術名詞而非商業單位 。
兩年后的今天 , 國家數據局局長在中國發展高層論壇上說 , 中國日均 Token 調用量兩年增長超千倍 , 全國科學技術名詞審定委員會也給了 Token 中文譯名(詞元) , 一套以 Token 計費為基礎的商業模式正在加速成型 。
火山引擎無疑是這個模式的「領先者」 。 4 月 2 日 , 火山引擎在武漢舉辦了 2026 年 AI 創新巡展的第一站 。 會上 , 譚待宣布截至今年 3 月 , 豆包大模型日均 Token 使用量突破 120 萬億——三個月翻了一倍 , 兩年增長了 1000 倍 。 同時 , 他在臺上宣布了 Seedance 2.0 API 正式面向企業公測 , 并介紹了龍蝦類智能體產品 ArkClaw 的全面升級 。

火山引擎總裁譚待丨來自:火山引擎 AI 創新巡展·武漢站

火山引擎兩年押注的那條路 , 今天被證明是對的 。 而今天的巡演 , 是它帶著驗證過的戰略和兩件新武器 , 加速向全行業推進的開始 。

01
Seedance 2.0:
不只是「生成視頻」 , 而是「生產視頻」

春節以來 , Seedance 2.0 席卷全球 。
這可能是真正第一個公認的國產 SOTA 模型 。 與之前的視頻模型相比 , Seedance 2.0 帶來的是質的變化:不是誰的畫質更好 , 生成時間長了幾秒 , 或者在對口型、吃面這樣某幾個動作上表現更好——而是視頻生成終于從「能玩」變成了「能賺錢」 。

火山方舟試用 Seedance 2.0 丨來自:火山引擎官網

Seedance 2.0 的技術突破集中在兩個方向 。
第一個是「多模態參考」能力 。 火山引擎大模型解決方案負責人張天劼在演講中提了一個很樸素的判斷:人類語言對圖像和聲音的描述永遠是不充分的 。 創作者腦子里的畫面 , 很難靠一段文字 prompt 完全傳達給模型 。 Seedance 2.0 的做法是 , 讓模型不只看 prompt , 還看圖片、看視頻、聽聲音——在充分理解各種素材之后再去創造 。
創作者扔幾張參考圖、一些過往視頻、一段背景音樂進去 , 模型就能產出電影級畫質的作品 。 更有意思的是 , 模型看多了參考素材之后 , 甚至會冒出自己的「創意想法」 。 現場展示了一段由 Seedance 2.0 自主編排腳本、自主生成的品牌素材 , 從創意到執行全程沒有人工介入 。
這個能力也順帶解鎖了一種全新的創作方式:視頻編輯 。 好的創作從來不是一蹴而就的 , 基于視頻素材的參考 , Seedance 2.0 可以對已有素材進行精準修改——改變風格、切換環境、增減角色 。 這甚至改變了「抽卡」這個概念的含義:過去抽卡是在多次生成中挑一個合格的;而 Seedance 2.0 抽卡 , 是讓創作者在不同的創意之間做選擇 。
第二個突破是對物理世界的理解 。 通過在訓練中統一建?!咐斫狻购汀干伞?, Seedance 2.0 學會了物理規律 。 即使創作者沒有精細描述生成細節 , 模型也會自動讓畫面「合理」——動漫打斗場景里的碰撞和反彈很自然 , 一鏡到底的長鏡頭里多個人物與環境之間的交互很精準 , 油脂飛濺、彩帶飄舞這些細節都處理得很到位 。
技術好不好 , 最終還是要看能不能賺錢 。 火山引擎給了幾個數據:今年春晚是 Seedance 交付的首個企業級大客戶 , 屏幕上那些國風畫面和視覺特效都由它生成;首批標桿客戶福建奇想做精品動漫 , 每分鐘成本從超過 1 萬元降到 4000-5000 元 , 人力從 20 多人天降到 3 人天 , 綜合效率提升近 10 倍 。 短劇領域更直接 , 3-5 人的小團隊一周完成一部作品 , 上線幾小時就能回本 。 廣告團隊用它批量生成千人千面的素材 , 點擊率和轉化率都有明顯提升 。
安全合規是 Seedance 2.0 敢放出來給企業用的另一個底氣 。 Seedance 2.0 剛發布的時候曾因版權問題引起爭議 , 甚至影響了其全球發布 。 而火山引擎退出的企業版搭了一套覆蓋全流程、全模態的版權和肖像安全體系 , 從創作前、創作中到創作后全鏈路防護 , 對侵權和深度偽造行為進行檢測和防御 。
火山引擎在會上引用的第三方評測顯示 , 行業平均異常率(VEO 3.1)大約為 20% , Seedance 的綜合異常率只有 1.8%——遠超行業水平 。
還有一個容易被忽略但非常關鍵的數字:視頻生成對 Token 的消耗量極大 。 火山引擎透露 , 生成 1 分鐘 720P 視頻 , Token 消耗在百萬級以上 , 而目前火山官網的定位 , Seedance 2.0 生成模式的售價為 46 元/百萬 Tokens 。 譚待也在采訪中承認 , 視頻生成已經成為驅動 MaaS 收入增長的超級引擎——隨著 AI 視頻創作從實驗走向產業化 , 視頻正在成為 Token 消耗的新主力 。

02
ArkClaw:解決龍蝦
「用起來很爽、用下去很難」的問題

如果說 Seedance 2.0 釋放的是人類的創造力 , ArkClaw 要解決的就是 AI 的執行力 。
龍蝦是 2026 年最熱的技術敘事 。 OpenClaw 讓 AI 第一次能夠連接真實世界、調用工具、執行任務 , 吸引了海量開發者涌入 。 但熱歸熱 , 真正在企業里跑通的案例并不多 。 火山引擎云基礎產品負責人洪濤濤在演講中的總結很直接:OpenClaw 解決了「能不能用 AI」的問題 , 但沒有解決「AI 能不能把事做完」的問題 。
他把企業用龍蝦的痛點歸納成四個詞:不敢用、用不起、用不好、記不住 。
不敢用 , 是因為龍蝦直接操作系統和數據 , 一旦權限失控 , 后果很嚴重——你讓龍蝦幫你改個密碼 , 它可能真的就改了 , 連確認都不帶的 。 用不起 , 不只是說 Token 貴 , 更是配置門檻太高 , 需要大量手動操作 , 只有技術背景很強的人才搞得定 , 普通用戶的上手成本很高 。 用不好 , 是因為龍蝦有能力但不能閉環 , 做到一半就卡住了 , 缺少平臺層面的上下游連接 , 后面還是得人工接手 , 整體體驗像一堆散裝零件而不是一個系統 。 記不住 , 是最大的隱痛——你今天花幾個小時調教好的龍蝦 , 明天可能就忘了你的偏好和要求 , 溝通成本一點沒減少 。 洪濤濤說 , 養好一只龍蝦需要每天投入 4-5 個小時 , 持續 5-7 天 。

ArkClaw 官網頁面丨來自:火山引擎官網

ArkClaw 是火山引擎對這四個痛點的系統性回應 。
安全方面 , ArkClaw 從底層架構就做了原生安全設計 。 每個用戶有獨立的隔離環境 , 默認無公網 IP , 所有通信走統一網關和強制認證 。 飛書、微信、釘釘過來的消息都要簽名校驗 , 內置信息防護機制可識別和攔截惡意指令 。 運行過程中持續做安全檢測 , 高危操作需要人工二次確認 。 火山引擎還拿到了信通院關于龍蝦類產品的兩項權威認證——「智能助理智能體產品可信能力認證」和「安全防護產品有效性認證」 , 是國內唯一一家同時拿到這兩項的廠商 。
【日均 120 萬億 Token,火山引擎兩年前的賭注開始兌現】易用性方面 , ArkClaw 做到了開箱即用 。 秒級配對飛書 , 也支持微信、釘釘、微博等多渠道 。 升級了網盤功能 , 本地和云端文件無縫同步 , AI 可以直接批量處理云端的簡歷、報表、海報 。 加了瀏覽器智能控制能力 , 龍蝦可以像真人一樣操作網頁——比如有公司把視頻標注工作安排在夜間 , 讓龍蝦在凌晨自動打開標注平臺完成任務 , 第二天早上直接拿到成品 。
ArkClaw 還引入了 Skill , 不僅接入了 SkillHub , 還可以自我封裝 。 如果一件事你需要做三次以上 , 就可以把它封裝成一個 Skill , 讓龍蝦自動執行 。 這些 Skill 可以在團隊內共享 , 沉淀為企業的能力資產 。 洪濤濤的說法是 , 「上一個時代我們說裝一套軟件 , 這個時代我們說養一只龍蝦 。 」當企業里的 Skill 越來越多 , 就形成了一個專屬的能力庫 , 人在用 AI 而不是 AI 在用人 。
在長期記憶這個最難的問題上 , 火山引擎聯合開源項目 OpenWriting 給出了方案 。 OpenWriting 是專門為 Agent 設計的長期記憶系統 , 今年 1 月開源后在 GitHub 上一度登上榜首 。 它的核心思路是「統一和極簡」——把龍蝦需要的所有信息(知識、工具、任務、歷史決策)按三層分級存儲:L0 是摘要 , L1 是概要 , L2 是詳細內容 。 執行任務時按需加載必要信息 , 既避免上下文噪聲 , 又大幅降低 Token 消耗 。 它還會把 Agent 的決策過程、檢索記錄、犯過的錯誤都保存下來 , 實現記憶偏好、認知糾錯、經驗沉淀 , 讓龍蝦越用越聰明 。
效果很顯著:搭載 OpenWriting 后 , OpenClaw 的任務成功率提升超過 40% , Token 成本降低約 80% 。 一周后再執行同類任務 , 龍蝦依然會按照用戶偏好和歷史經驗來操作 。
譚待還提出了一個值得關注的企業級 Agent 實踐模式:他認為企業 Agent 建設應該「敏態」和「穩態」并行 。 敏態以 ArkClaw 為代表 , 鼓勵一線員工自由探索、激發創新 , 解決「怎么成為一個更好的銷售」「怎么成為一個市場高手」這類個人生產力問題 。 穩態由 HiAgent 承載 , 當找到 AI 最佳實踐后 , 把它流程化、規范化、規模化落地 。 敏態是創新實驗場 , 穩態是生產車間 , 兩條線互補共生 , 形成從探索到轉型的進化飛輪 。

03
兩年前就想清楚了的事 , 今天開始兌現

把視角拉遠來看 , 這次武漢站活動最值得玩味的 , 可能不是某一個具體產品 , 而是火山引擎過去兩年戰略的「兌現時刻」 。
回到 2024 年 5 月 , 豆包大模型第一次發布 。 當時行業里的普遍討論還在「模型能力」層面打轉 , 而火山引擎已經把 MaaS 確立為最高優先級 。 譚待那時說了一句話:「只有大的調用量 , 才能打磨出好模型 。 只有在真實場景中落地 , 用的人越多 , 調用量越大 , 模型才會越來越好 。 」
這句話暗含了火山引擎整個競爭策略的三根支柱:模型能力是根基 , 基礎設施是保障 , 成本是撬動用戶的杠桿 。
模型能力方面 , 從豆包 1.0 到 2.0 , 火山引擎保持了高頻迭代節奏 。 最新的 2.0 系列在多模態理解、視覺推理、復雜任務執行等核心能力上躋身全球第一梯隊 。 而 Seedance 2.0 這個 SOTA 模型的推出 , 更是幫助火山在視頻場景拉開了競爭差距 。
基礎設施方面 , MaaS 的核心邏輯是用戶不需要關心底層部署——不用自己買卡、自己維護機房、自己跟著模型每半個月的更新節奏調整部署方案 。 以 Token 為單位按需調用、按量付費 , 這種「Token 工廠」模式是模型最經濟、最便捷的使用方式 。 火山引擎用自身的推理基礎設施 , 把這個工廠的效率和穩定性推到了行業前沿 。
成本方面 , 2024 年率先打響大模型價格戰 , 用極具競爭力的 Token 定價迅速擴大市場份額 。 低成本不是目的 , 而是做大調用量的手段——調用量大了模型更好 , 模型更好場景更多 , 場景更多調用量更大 , 飛輪就轉起來了 。
兩年下來 , 飛輪轉出了什么成果?MaaS 調用量增長 1000 倍 。 累計 Token 消耗超萬億的企業從 100 家增長到 140 家 。 在所有云廠商中 , 火山引擎也是唯一一家從 2024 年 5 月起就持續追蹤并公布 Token 公有云調用量的平臺 。 這不僅出于信息同步 , 更是在用 Token 調用量來定義自己的業務健康度 。
而現在 , 兩個新變量的疊加 , 讓火山引擎的先手優勢被進一步放大 。
Seedance 2.0 帶來了視頻生成的產業化 。 1 分鐘視頻就消耗百萬級 Token , 當 AI 視頻從實驗走向量產 , 它就是 MaaS 收入增長最強勁的引擎 。 火山引擎不僅有全球領先的視頻生成模型 , 還為它配好了安全合規體系 , 在商業化落地的速度和深度上都跑在了前面 。
龍蝦的爆發帶來了 Agent 場景的井噴 。 每一次 Agent 任務可能涉及幾十上百輪工具調用 , 消耗數十萬 Token 。 龍蝦讓更多人第一次體驗到了購買模型 API、感受 Token 這個「新貨幣」的過程 。 此外 , 龍蝦的出現 , 也讓 AI 應用的單元從前兩年的「行業」變成「職能」 , 任何行業公司的 HR、銷售、人力崗位 , 都可以通過龍蝦解決問題 , 這極大加速了 Agent ToB 的應用落地 。
Seedance 2.0 加上 ArkClaw 與飛書的深度整合 , 構成了火山引擎在 2026 年最重要的兩件武器 。 一個釋放創造力 , 一個釋放執行力 , 兩者共同驅動 Token 消耗的爆發式增長 。
采訪中有一個很有趣的細節:當被問到更多大廠開始重視 MaaS , 火山引擎如何應對時 , 譚待說對于火山引擎 , 因為兩年前其實就把這事想得比較清楚 , 在組織上 , 在產品上就針對性地做了很多優化 , 所以現在反而不需要做什么調整 。
回頭看 , 火山引擎可能是國內最早想清楚 MaaS 這件事的云廠商 。 它不是走一步看一步 , 而是在兩年前就看到了終局——模型能力、基礎設施、成本三位一體 , Token 就是 AI 時代的水電煤 。 今天 120 萬億日均 Token、帶著兩個新武器殺向更廣闊的市場 , 這些不是偶然堆出來的成果 , 而是一條一以貫之的戰略在時間維度上的兌現 。
武漢只是第一站 。 譚待在開場就明確說了 , 這是「2026 年火山引擎 AI 城市創新發展的第一站」 。 接下來 , 火山引擎會以巡演的方式 , 把 Seedance 2.0 和龍蝦這兩件利器帶到全國各個城市 , 深入各行各業的毛細血管 。
這場席卷 , 才剛剛開始 。
*頭圖來源:視覺中國

    推薦閱讀