AI落地的物流樣本

AI落地的物流樣本

文章圖片

AI落地的物流樣本

文章圖片


站在2026年 , 回望剛剛過去的2025年 , 幾乎所有人都認同這是AI在B端落地的大年 。
“ToB的生意跟ToC完全不一樣 , C端會有波動和起伏 , 而B端只要增長會一直增長 , 既不可能說用就用 , 也不可能用了之后立馬棄用 , 有很高的粘性 。 ”阿里云一位從事B端業務多年的老兵表示 。
一位飛書客戶成功經理提到 , 2023年到2024年上半年 , 飛書跟客戶共創了大概1500個場景 , 實際有用的不超過20個 。 可到了2025年 , 光是飛書AI效率先鋒大賽 , 便涌現了230個真實業務場景案例 。
AI不僅在生產資料上重構著企業業務 , 還改變著企業更深層次的組織肌理 。 上述阿里云人士表示 , “企業上云時代 , 我們主要對接企業IT部門 , 而在AI大規模落地時 , 目前有約三成不再是IT部門 。 ”
AI與IT部門的交融 , 大約有三種形態 , 較為激進的企業 , 會單獨成立一級AI部門;第二種是循序漸進 , 將AI團隊融入到既有的IT部門中;第三種較為特殊 , 成立由企業一把手直管的辦公室 , 扮演著中臺角色 , 雖然建制不大 , 但優先級很高 。
當企業客戶從內到外開始變化 , 云與AI大廠的策略也在逐漸發生變化 。



前述阿里云人士表示 , “IT和云的目標是走進運維 , 現在AI需要走進業務 。 ”
這一觀點與飛書不謀而合 。 “過去IT或是云采購大部分是自上而下的 , 而AI的落地則是自下而上 , 業務一線的工作人員在自己的工作流程中把AI工具用好 , 實踐做出來 。 ”
可以看到 , 無論是擁有全棧AI技術體系的阿里云 , 還是完成了從SaaS轉型為PaaS的飛書 , 都意識到了AI正在改變toB生意的邏輯 。
我們試圖從極兔這家物流企業的角度 , 窺探企業AI落地背后的選擇與考量 。
AI云廠商做元器件 , 企業做集成與廠商期待AI加速落地不同 , 企業在實際運作中 , 更傾向于漸進式 。 “我們不是一次性地全量投入 , 而是漸進式 , 在一個階段內找最重點、最急迫的問題 , 然后試點、打磨、升級、推廣 。 ”極兔AI團隊表示 。
極兔同許多大公司一樣 , 內部系統無外乎外采與自研兩種 , 而判斷外采與自研 , 主要取決于投入成本、實際場景 , 以及是否關系到企業核心競爭力 。 作為全球化企業 , 極兔對于核心系統和應用都會傾向于自主研發 , 而在底層通用大模型服務上會更多依賴于外采 。
在企業實際運作中 , 外采與自研的邊界并不是那么涇渭分明 , 更多時候是以集成的形態出現 。 例如自動化設備的集成程度便很高 。 “物流行業發展很多年 , 自動化設備比較成熟 , 如條碼、分揀、存取、GPS跟蹤等系統 , 不同企業都會做一定程度的集成” 。 一位極兔人士表示 。 快遞企業在成熟解決方案面前 , 沒有必要“重復造輪子” 。
而另一部分涉及到企業核心競爭力 , 或是市面上沒有的系統 , 企業只能自研 。 一位極兔人士提到 , “只是底層很多原子化能力會采用外部成熟方案 。 ”這也是不少toB廠商強調“被集成”的根本動因 。
例如影響快遞公司效率的異常件識別系統 , 極兔通過自研或外采成熟的圖像識別、OCR(光學字符識別)、人臉識別等方案 , 集成到自己的物流系統之中 。 再比如 , 涉及到核心關鍵的物流相關模型 , 尤其是垂域大模型 , 進行場景化的微調 , 亦是如此 。



值得一提的是 , 企業對于一些高度集成后的PaaS產品 , 表現出了很高的興趣 。
過去幾年 , 生成式AI吸引了不少企業關注 , 其中就包括市場營銷部門 。 不論廠商將故事講得多么美好 , 生成式AI在企業級市場中 , 仍然算不上盡善盡美 。
一位極兔速遞中國市場營銷部編導表示 , “在企業流程中我們要的是確定性 , 不管是生產場景 , 還是輸出一個企業級宣傳片 , 確定性對于企業來說是最重要的 。 ”即便模型再好用 , 使用者Prompt能力再強 , 最后輸出的片子仍有很大概率不可用 。
視頻生成大模型存在一個悖論 , 既要保持生成物料的審美一致性 , 同時得根據腳本節奏呈現出差異化特點 , 即便如此 , 到最后的商標環節 , 還是得靠“手搓” , 或引入原片 。 “對于企業來說 , 商標的色號、形制都不能有絲毫問題 。 ”
團隊用拆解工作流的手段 , 解決了問題 。 他們將內容生產切割為N個節點 , 腳本生成、分鏡生成、校驗故事等環節都有對應的Agent , 且調用的模型各不相同 。 在此基礎上 , 又引入了一套由自己和第三方產品混合的Agent , 對生成的物料進行整合 。
在整個流程中 , 團隊會根據實際生成效果 , 調用不同模型 , 通義、豆包、Deepseek、即夢等 , 海外市場因合規原因也會使用其他大模型 。 極兔方面表示 , “我們會根據業務場景靈活使用自研AI平臺或飛書平臺 , 搭建智能體或工作流應用 , 引入AI后能讓確定性更高 。 ”
在企業上云的時代 , 不少廠商都使用混合云策略 , 存在一個體量不小的云下市場 。 而在AI時代 , 不少廠商也走向了混合模型 , 從而讓一部分需求可以被Token計算 , 另一部分則完全無法計算 。
一位阿里云資深市場人士測算 , 占比更高的中小企業主要是在云上訓練 , 這部分能夠參考Token消耗 。 而另一部分企業要么處于合規和安全 , 要么是企業IT能力強 , 這部分占比很高的需求情況無法計算 , 例如私有化部署和云下訓練部分 , “我們只知道他投入了多少在IaaS , 卻不知道調用了多少Token” 。
無法被預計的部分確實在極兔的案例中頻頻出現 。 一位極兔人士告訴光子星球 , 公司在AI應用上采用混合技術策略 。 最終服務端的高頻Token消耗 , 主要來自行業主流的模型調用 , 以滿足大量通用需求 。 然而 , 在追求核心業務場景的定制化效果時 , 極兔的研發中心放在了基于可微調基座模型 , 進行自主的模型精調與后訓練 。
通過這種方式 , 極兔得以構建私有化的專屬模型 , 而非僅僅依賴商業API調用 。
AI落地的KPI:性能、效果、成本去年年中 , 世界人工智能大會公布了一組數據 , 截至去年7月 , 全球已發布大模型3755個 , 其中1509個來自國內公司 。
以生成式AI為代表的大模型 , 處于超供給的情況下 , 在需求側卻出現了以決策式AI為代表的中小模型短缺 。 根據極兔方面的實踐來看 , 當前階段 , 企業對于中小模型的需求高于大模型 。 一部分原因是通用模型無法解決垂直場景中的問題 , 企業需要在垂直場景中能用的AI 。
“一些核心場景的延遲要求很苛刻 , 可能要20毫秒以內 , 且調用非常大 , 現階段只能用小模型來解決 。 ”極兔方面提到 , 在下單時生成電子面單必須依賴小模型 , 而使用大模型的場景主要集中在對延遲要求沒有那么高 , 涉及到語義理解的場景 , 像AI助手、智能客服、經營分析等 。
實踐不僅讓極兔很早就意識到了大模型與中小模型的差異化 , 甚至在不斷積累之下 , 已在使用AI改造自己的核心能力 。
據悉 , 集團正在構建物流AI決策大腦 , 該系統的目的是整合攬收、中心操作、運輸、末端、客服等原本獨立性相對較強的環節 , 提升環節間的協作能力 , 從而為集團整體提效 。 而在這個過程中 , 極兔自然而然地很清楚 , 到底在如此多的模型中 , 自己應該用什么模型 。
評估模型 , 企業不會關注模型廠商的參數 , 而是看業務反饋 。 具體流程是業務部門提出需求 , 然后極兔技術團隊會基于業務場景和需求做調研與測算 , 評估ROI 。 評估通過之后 , 需求部門和產研部門會對齊 。
整個過程中 , 有三個核心評估指標 , 分別是效果(準確性)、性能(響應時間)、成本(價格) 。
以知識問答為例 。 極兔會首先測試不同模型的性能 , 關鍵信息抽取準確性 , 例如全球各地的地理實體、人名、郵編 。 這是一個剛性指標 , 通常要求高于95%以上才能入候選池 。
由于調用量往往會非常大 , 因而還會增加響應時間 。 極兔AI團隊表示 , “DeepSeek的準確性非常好 , 但因為太慢了 , 所以在這個環節上可用性較低 。 ”



效果與性能在整個評估環節中起決定作用 , 能覆蓋兩個核心需求 , 且領先其他模型 , 便會最終應用 。 照理來說 , 微利的快遞物流行業會非常關注成本 , 但因為2024年以來 , Token價格持續下跌 , 成本在決策天平上的權重已讓位于性能與效果 , 企業對于成本的首要顧慮得以緩解 , 從而更傾向于應用領先的技術模型 。
從該案例可以看到 , 企業對于模型的選用帶有典型的“可插拔”特點 , 隨著業務變化而隨時更換 。
盡管極兔對于AI落地持漸進式思維 , 但集團對于AI的投入力度很大 , 面對業務與技術同時處于頻繁迭代的現狀 , 企業預算隨之變得較為彈性 。
以2025年預算為例 , 集團按照物流AI決策大腦的藍圖 , 為十余個業務制定了對應的預算規劃 。 與此同時 , 還設置了一個或季度 , 或半年度的滾動機制 。 當突然發現新需求 , 或是新技術后 , 集團內便會立即調研、測試 , 將前述流程跑一遍 , 只要符合流程便會立即上報 。
廠商包不圓的異構去年年底 , 海外谷歌Gemini 3、GPT 5.2陸續發布 , 國內如火山引擎發布了豆包大模型1.8 , 阿里通義大模型體系持續迭代 , 企業在實際應用中其實比模型廠商有更多有效反饋 。
“年底這一輪迭代后 , 模型的數學推理能力急劇增強 , 但是存在過擬合的問題 。 ”極兔AI團隊表示 , 過分追求測試集的評測 , 導致企業在落地過程中發現了比較嚴重的幻覺和不準確的問題 。 因此 , 企業不得不將更多精力放在基于文檔的知識問答、通過工程化手段提升準確性 , 以及基于上下文的任務規劃能力上 。
某云廠商人士承認 , 雖然模型廠商都號稱百萬級 , 但各種原因使得實際上給企業的文本上限不過3萬 , 限制了AI在廠商業務中的落地情況 。



Manus在2025年嶄露頭角 , 只因做了任務規劃這一件核心事情 , 借助大模型的任務規劃能力去精準調用各個工具 。 但是再好的解決方案 , 在3萬的Token上限面前 , 仍是“巧婦難為無米之炊” 。
上下文的限制 , 不僅是企業當下最頭疼的問題 , 也是導致以決策式AI為代表的小模型盛行 , 而以生成式AI為代表的大模型產品在B端遇冷的一個重要原因 。 從這個角度來講 , 飛書這類協同工具在去年吃到的紅利 , 或多或少便是給了企業一個大模型難以垂直應用的解決方案 。
技術路線再是美好 , 真正落到現實情況中總會走樣 。
“我們用的云服務和模型比較多 , 各個廠商都會有銷售代表或解決方案代表常駐企業 , 而且不光是大模型 , 還有云基礎設施的存儲計算廠商 。 ”一位極兔人士在閑聊中透露出的信息 , 揭示了混合云與混合模型業態下的眾生相 。
從極兔這個案例可以肯定的是 , 單一的云服務和AI廠商不可能將一家企業包圓 。 這既有技術、服務能力的考量 , 也有安全與合規的因素 , 現實之所以與理想有差異 , 原因便在于理想的動因只有技術 , 而現實的動因千萬個 。
【AI落地的物流樣本】大廠們真正需要思考的問題是 , 企業級應用的混合模型趨勢 , 導致IaaS、PaaS、MaaS層將長期處于異構情況下 , 如何為企業創造真實價值 。
異構的不止是技術 , 商業世界中從來如此 。

    推薦閱讀