北京大學提出分布驅動的終身學習范式，用結構建模解決災難性遺忘

2025-12-07 人工智能算法 ai 施耐德電氣自動化

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

近日，北京大學王選計算機研究所周嘉歡助理教授與彭宇新教授合作在人工智能重要國際期刊 IEEE TPAMI 發布一項最新的研究成果：DKP++（Distribution-aware Knowledge Aligning and Prototyping for Non-exemplar Lifelong Person Re-Identification）。該工作針對終身學習中的災難性遺忘問題，提出分布建模引導的知識對齊與原型建?？蚣?，不僅有效增強了對歷史知識的記憶能力，也提升了模型的跨域學習能力。

本文的第一作者為北京大學北京大學王選計算機研究所助理教授周嘉歡，通訊作者為北京大學王選計算機研究所教授彭宇新。目前該研究已被 IEEE TPAMI 接收，相關代碼已開源。

論文標題：Distribution-aware Knowledge Aligning and Prototyping for Non-exemplar Lifelong Person Re-Identification 論文鏈接：https://ieeexplore.ieee.org/abstract/document/11120364 代碼鏈接：https://github.com/zhoujiahuan1991/TPAMI-DKP_Plus_Plus
行人重識別（Person Re-Identification ReID）旨在針對跨相機視角、跨地點、跨時間等場景中，基于視覺特征實現對同一行人圖像的匹配與關聯。該技術在多攝像頭監控、智能交通系統、城市安全管理以及大規模圖像視頻檢索等實際場景中具有廣泛應用價值。然而，在現實環境中，由于采集地點、拍攝設備和時間條件的不斷變化，行人圖像的分布會隨之發生遷移，導致測試數據與模型訓練時所依賴的源數據之間存在顯著的域偏移。這一分布漂移問題使得傳統 “靜態訓練 - 固定推理” 的 ReID 范式在長期動態環境中的適應性不足。

為應對這一挑戰，研究者提出了更具現實意義的任務設定，終身行人重識別（Lifelong Person Re-ID LReID）。該任務要求模型在持續接收新域數據的過程中，能夠高效地增量學習新知識，同時保持對先前已學習域中身份信息的辨識能力，從而實現跨時間與跨域的長期學習與知識保留。

研究現狀

終身行人重識別任務的核心挑戰是災難性遺忘問題，即模型在學習新域知識后，對舊域中行人數據的檢索性能大幅降低。為解決該問題，現有方法主要通過保留歷史樣本或采用知識蒸餾策略來緩解遺忘。然而，保留歷史樣本的方法存在數據隱私風險和存儲開銷持續增長的問題；知識蒸餾方法因強制新舊模型輸出一致性，制約了模型的可塑性，限制了新知識學習能力。盡管原型學習技術在類增量學習任務中取得了較高性能，但現有方法僅為每個類別保留單一特征中心，忽略了類內分布差異，導致行人的細粒度知識丟失，難以適用于依賴細粒度匹配的終身行人重識別任務。

研究動機

動機 1：分布原型學習。為實現無歷史樣本存儲條件下有效保留歷史知識，我們提出通過實例級分布建模挖掘數據中的細粒度信息，進而構建分布原型，提升對不同域數據信息的表征和保存能力。

圖 1 分布原型學習動機

動機 2：跨域分布對齊。雖然分布原型可有效緩解遺忘問題，由于新舊域數據存在分布鴻溝，造成歷史原型對新數據學習的引導和約束作用較弱，導致模型的新知識學習能力和抗遺忘能力仍然受限。為克服該挑戰，我們提出引入輸入端分布建模并構建跨域樣本對齊機制，提升歷史分布信息對新域特征學習的引導作用，從而在大幅提升模型對歷史知識鞏固能力的同時，保障了對新數據知識的學習能力。

圖 2 跨域分布對齊動機

方法設計：分布建模引導的知識對齊與原型建?？蚣?br />

圖 3 DKP++ 模型

（1）實例級細粒度建模：提出實例分布建模網絡，動態捕捉行人實例的局部細節信息，為細粒度匹配奠定基?。 ?

（2）分布感知的原型生成：設計分布原型生成算法，將學習到的實例級分布信息聚合為更魯棒的類別級分布原型，克服了單一特征中心的局限性，保留類內差異知識。

（3）分布對齊：引入輸入端分布建模機制，彌合新舊數據特征分布鴻溝，提升模型對歷史知識的利用能力。

（4）基于原型的知識遷移：提出基于原型的知識遷移模塊，利用生成的分布原型和有標注的新數據協同指導模型學習，在促進新知識吸收的同時，實現了對舊知識的記憶。

實驗分析

1. 數據集與實驗設置

論文的實驗采用兩個典型的訓練域順序（Order-1 與 Order-2），包含五個廣泛使用的行人重識別數據集（Market1501、DukeMTMC-ReID、CUHK03、MSMT17、CUHK-SYSU）作為訓練域。分別評估模型在已學習域（Seen Domains）上的知識鞏固能力和在未知域（Unseen Domains）上的泛化能力。評測指標采用行人 ReID 任務的標準指標：平均精度均值（mAP）和 Rank-1 準確率（R@1）。

【北京大學提出分布驅動的終身學習范式，用結構建模解決災難性遺忘】

2. 實驗結果：

綜合性能分析：在兩種不同的域順序設定下， DKP++ 的已知域平均性能（Seen-Avg mAP 和 Seen-Avg R@1）相比于現有方法提升 5.2%-7% 。同時， DKP++ 在未知域的整體泛化性能（UnSeen-Avg mAP 和 UnSeen-Avg R@1）上相比于現有方法提升 4.5%-7.7% 。

學習趨勢分析：與現有方法相比，隨著已學習域的數量增加， DKP++ 呈現了更高的歷史知識鞏固能力。同時， DKP++ 也呈現了更高的未知域泛化性能增長速度，驗證了其所積累知識的魯棒性。

基礎模型適配能力分析：在以不同的重識別基礎模型（VF-Res ， VF-ViT）作為預訓練模型時， DKP++ 均保持了對現有方法的優勢，說明其對不同的預訓練模型均具備良好的適配能力。

總結與展望

1. 技術創新

本項被 IEEE TPAMI 2025 接收的工作聚焦于終身行人重識別（LReID）任務，提出了以下創新性設計：

分布原型建模與表征：提出基于實例級分布建模構建分布原型，增強了模型對歷史信息的表達能力；

樣本對齊引導的原型知識遷移：通過域分布建模與樣本分布對齊克服新舊域數據的分布鴻溝，增強歷史原型的利用能力。 ?

2. 未來展望

DKP++ 為無樣本保留的終身學習技術提供了新范式，未來在多個方面仍有改進空間：

1. 基于大模型的分布對齊。本方法的分布對齊通過簡單的卷積網絡實現，未來可基于 Diffusion 等架構促進分布對齊以進一步提升模型的抗遺忘能力。

2. 知識主動遺忘機制。由于缺乏顯式的引導，模型中往往包含冗余知識，在引入抗遺忘機制時容易干擾新知識的學習，因此構建模型的主動遺忘機制對進一步增強模型的知識鞏固和學習能力具有重要研究價值。

3. 多模態終身學習機制。實際場景中存在紅外、點云、音頻、文本等多模態信息，增強模型的多模態數據持續學習能力，可促進模型充分利用多元化信息以增強復雜環境的感知能力。

推薦閱讀

上一篇：Q4 NAND Flash價格將上漲5-10%

下一篇：五十來歲正該闖！雷軍曝造芯造車血淚史，小米17正面戰蘋果！