原阿里千問后訓練負責人郁博文跟隨林俊旸離職后,被曝閃電加入字節seed

原阿里千問后訓練負責人郁博文跟隨林俊旸離職后,被曝閃電加入字節seed

強化多模態布局 , 字節Seed被曝迎來前阿里Qwen后訓練負責人郁博文

據IT時代網報道 , 3月11日 , 知情人士透露 , 原阿里巴巴通義實驗室Qwen(千問)大模型后訓練負責人郁博文已正式加入字節跳動 , 擔任Seed團隊視覺模型與多模態交互團隊后訓練負責人 。 這是繼今年3月初郁博文從阿里離職后 , 其職業動向的首次明確 。
公開資料顯示 , 郁博文本科畢業于中南大學 , 后考入中國科學院信息工程研究所攻讀研究生 , 2022年獲得中國科學院大學博士學位 。
在讀期間 , 他專注于自然語言處理與信息抽取領域研究 , 曾在ACL、EMNLP等國際頂級學術會議上發表多篇論文 , 并提出將信息抽取任務轉化為圖結構問題的創新思路 , 有效解決了實體重疊、嵌套等復雜場景下的識別難題 。 憑借突出的學術表現 , 他曾榮獲中國科學院院長獎 。
2022年博士畢業后 , 郁博文以阿里集團最高級別校招項目“阿里星”身份加入阿里巴巴達摩院 , 擔任算法專家(P7) 。 入職初期即深度參與通義千問大模型的早期訓練與研發 , 迅速成長為千問團隊核心骨干 , 并最終擔任后訓練(Post-training)負責人 。
作為后訓練負責人 , 郁博文在大模型的“對齊”與“精調”領域貢獻卓著 。 他主導了Qwen系列Chat模型的研發 , 通過監督微調(SFT)、強化學習(RLHF)、直接偏好優化(DPO)等技術 , 將通用大模型轉化為符合人類價值觀和使用習慣的對話模型 。
針對不同規模模型 , 他設計了“四階段進化論”和“知識蒸餾”策略 , 使Qwen模型在長文本生成、復雜推理及多模態理解等任務上表現優異 。 在LMSYS Chatbot Arena等全球權威評測中 , Qwen系列多次躋身前十 。
2026年3月 , 阿里通義實驗室啟動組織架構調整 , 計劃將原本垂直整合的Qwen團隊拆分為預訓練、后訓練、文本、多模態等多個平行模塊 。 這一調整導致郁博文的管理范圍大幅縮小 , 且與其堅持的“預訓練與后訓練必須深度耦合”的技術理念產生沖突 。 此外 , 阿里高層對千問團隊施加的商業化考核壓力 , 也加劇了團隊內部的分歧 。
2026年3月3日 , 郁博文提交辭職申請 , 次日正式離職 。 其工作由前Google DeepMind高級資深研究員周浩接任 。
【原阿里千問后訓練負責人郁博文跟隨林俊旸離職后,被曝閃電加入字節seed】字節Seed團隊近年來在大模型和多模態領域持續發力 , 郁博文的加入無疑將強化其在視覺與多模態交互方面的后訓練能力 , 進一步推動字節在AI領域的布局 。

    推薦閱讀