AAAI 2026 Oral | 給多流數據配「私教+外援」,漂移來了也不慌

AAAI 2026 Oral | 給多流數據配「私教+外援」,漂移來了也不慌

文章圖片

AAAI 2026 Oral | 給多流數據配「私教+外援」,漂移來了也不慌

文章圖片

AAAI 2026 Oral | 給多流數據配「私教+外援」,漂移來了也不慌

文章圖片

AAAI 2026 Oral | 給多流數據配「私教+外援」,漂移來了也不慌

文章圖片

AAAI 2026 Oral | 給多流數據配「私教+外援」,漂移來了也不慌

文章圖片



本文作者為:En Yu Jie Lu Kun Wang Xiaoyu Yang Guangquan Zhang 。 所有作者均來自于悉尼科技大學(UTS)澳大利亞人工智能研究院(AAII) 。
在智慧城市、社交媒體、工業物聯網等真實開放動態環境中 , 數據往往以多流(Multistream)形式并發產生 。 然而 , 現實世界并非完美的實驗室 , 這些數據流往往存在異構性 , 且分布變化各不相同 , 伴隨著復雜的異步概念漂移 。
如何讓模型既能 “專精” 于單一流的特性 , 又能 “博采眾長” 利用流間相關性 , 同時還能自適應分布變化?
悉尼科技大學(UTS)研究團隊提出了一種全新的漂移感知協作輔助混合專家學習框架 —— CAMEL (Collaborative Assistance Mixture of Experts Learning) 。
CAMEL 巧妙地將混合專家模型(MoE)引入流式學習 , 通過 “私有專家” 與 “輔助專家” 的協作機制 , 以及自動化專家生命周期管理 , 完美解決了異構多流學習中的關鍵問題 。 該工作已被 AAAI 2026 接收為 Oral 論文 。

論文標題:Drift-aware Collaborative Assistance Mixture of Experts for Heterogeneous Multistream Learning 論文鏈接:https://arxiv.org/abs/2508.0159801 引言
在真實應用場景中 , 數據通常以連續且無限的數據流形式產生 , 其生成機制往往呈現顯著的非平穩性 , 即數據的聯合概率分布隨時間發生不可預測的概念漂移 。 這一特性與經典機器學習所依賴的獨立同分布(I.I.D.)假設存在根本沖突 。
然而 , 現有研究大多聚焦于單一或同構數據流的漂移建模 , 難以應對真實世界中普遍存在的多源異構數據流情形 。 以智能城市為例 , 交通傳感器、氣象觀測、公共交通記錄及社交媒體等信息流在時間尺度與演化模式上彼此獨立 , 卻潛藏著重要的動態關聯 。 若能在概念漂移過程中有效挖掘并利用這些跨流關系 , 將顯著提升決策的準確性與魯棒性 。
現有的方法往往陷入兩難:要么假設所有流是同構的 , 強行統一處理導致模型失配;要么采用靜態模型 , 一旦某個流發生漂移 , 重新訓練會導致 “災難性遺忘” , 而增量微調又可能因為流之間的不同步演化而引發 “負遷移”。
為此 , 作者正式定義了異構多流學習(HML)問題 , 并提出 CAMEL 框架 。 這是一種動態的、通過協作輔助的混合專家學習框架 , 通過模塊化設計在 “專精 — 協作 — 適應” 之間取得平衡 。

【AAAI 2026 Oral | 給多流數據配「私教+外援」,漂移來了也不慌】圖 1:CAMEL 整體框架 。 每個流的 MoE 模塊利用動態的私有專家庫和專用的輔助專家 , 通過多頭注意力進行協作融合 。 系統遵循 “測試 - 診斷 - 適應” 的循環 , 通過自主專家調節器動態管理專家生命周期以響應漂移信號 。
02 方法論與架構設計
研究團隊面向 HML 場景下的三大核心挑戰:內在異構性、多流知識融合以及異步概念漂移 , 設計了一套模塊化的漂移感知架構 。
挑戰一:內在異構性

CAMEL 為每個流配置異構感知的 “獨立系統”:

挑戰二:多流知識融合
多流數據的核心價值在于流之間的潛在相關性 , 但盲目融合所有流的信息會導致負遷移 。

挑戰三:異步概念漂移
面對數據分布的非平穩性 , CAMEL 設計了自主專家調優器, 在專家粒度上實現模型容量的在線伸縮 , 遵循 “測試 - 診斷 - 適應” 的閉環邏輯:
漂移檢測:利用基于最大均值差異(MMD)的漂移檢測器監控特征分布變化 。 增量式擴展(AddFreeze): 當檢測到漂移且伴隨性能顯著下降時 ,實例化一個新的私有專家學習新概念 , 并凍結舊專家以規避災難性遺忘 。
03 理論分析與實驗驗證


實驗驗證:為了驗證 CAMEL 的有效性 , 研究團隊構建了包含 12 個合成流和 4 個真實數據集(涵蓋了天氣、新聞、信用卡信息等)的 8 大基準場景 。
表 1 中的結果表明 , CAMEL 在幾乎所有場景中實現了最先進的平均準確率 , 顯著超越了單流基線(SRP、AMF、IWE)和多流方法(MCMO、OBAL、BFSRL) 。 CAMEL 的優越性在異構環境中尤為明顯 , 現有的多流方法由于依賴共享特征或標簽空間而失敗 。 相比之下 , CAMEL 的流特定模塊能夠在輸入異構下實現穩健的性能 。 該框架還通過其協作輔助機制有效利用潛在的流間相關性 , 超越了單流方法 。

表 1:各方法在所有基準上的分類準確率(%) 。 紅色代表最優 , 藍色代表次優 。
04 結語
CAMEL 的提出標志著多流學習從 “靜態同構” 向 “動態異構” 邁出了關鍵一步 。該框架以私有專家保障流內專精 , 以輔助專家挖掘跨流關聯 , 并通過自動化的專家生命周期管理在漂移下實現持續適應與效率控制 , 為復雜、動態演化的異構多流場景提供了一種可擴展的解決方案 。

    推薦閱讀