原阿里千問后訓練負責人郁博文跟隨林俊旸離職后，被曝閃電加入字節seed

2026-04-07 阿里巴巴千問

強化多模態布局，字節Seed被曝迎來前阿里Qwen后訓練負責人郁博文

據IT時代網報道， 3月11日，知情人士透露，原阿里巴巴通義實驗室Qwen（千問）大模型后訓練負責人郁博文已正式加入字節跳動，擔任Seed團隊視覺模型與多模態交互團隊后訓練負責人。這是繼今年3月初郁博文從阿里離職后，其職業動向的首次明確。
公開資料顯示，郁博文本科畢業于中南大學，后考入中國科學院信息工程研究所攻讀研究生， 2022年獲得中國科學院大學博士學位。
在讀期間，他專注于自然語言處理與信息抽取領域研究，曾在ACL、EMNLP等國際頂級學術會議上發表多篇論文，并提出將信息抽取任務轉化為圖結構問題的創新思路，有效解決了實體重疊、嵌套等復雜場景下的識別難題。憑借突出的學術表現，他曾榮獲中國科學院院長獎。
2022年博士畢業后，郁博文以阿里集團最高級別校招項目“阿里星”身份加入阿里巴巴達摩院，擔任算法專家（P7）。入職初期即深度參與通義千問大模型的早期訓練與研發，迅速成長為千問團隊核心骨干，并最終擔任后訓練（Post-training）負責人。
作為后訓練負責人，郁博文在大模型的“對齊”與“精調”領域貢獻卓著。他主導了Qwen系列Chat模型的研發，通過監督微調（SFT）、強化學習（RLHF）、直接偏好優化（DPO）等技術，將通用大模型轉化為符合人類價值觀和使用習慣的對話模型。
針對不同規模模型，他設計了“四階段進化論”和“知識蒸餾”策略，使Qwen模型在長文本生成、復雜推理及多模態理解等任務上表現優異。在LMSYS Chatbot Arena等全球權威評測中， Qwen系列多次躋身前十。
2026年3月，阿里通義實驗室啟動組織架構調整，計劃將原本垂直整合的Qwen團隊拆分為預訓練、后訓練、文本、多模態等多個平行模塊。這一調整導致郁博文的管理范圍大幅縮小，且與其堅持的“預訓練與后訓練必須深度耦合”的技術理念產生沖突。此外，阿里高層對千問團隊施加的商業化考核壓力，也加劇了團隊內部的分歧。
2026年3月3日，郁博文提交辭職申請，次日正式離職。其工作由前Google DeepMind高級資深研究員周浩接任。
【原阿里千問后訓練負責人郁博文跟隨林俊旸離職后，被曝閃電加入字節seed】字節Seed團隊近年來在大模型和多模態領域持續發力，郁博文的加入無疑將強化其在視覺與多模態交互方面的后訓練能力，進一步推動字節在AI領域的布局。

推薦閱讀

上一篇：一加16再次被確認：滿血第六代驍龍8+2億潛望，核心規格基本清晰了

下一篇：激光雷達邁入“圖像級”時代：華為乾崑如何重塑智能駕駛感知邊界