通義巨震:周靖人收權,林俊旸放手?

通義巨震:周靖人收權,林俊旸放手?

文章圖片

通義巨震:周靖人收權,林俊旸放手?

林俊旸宣布離開千問 , 這個事非常突然 , 本來還在看幾位長老陪馬老師溜園的新聞 。

目前確定的信息是 , 林俊旸是昨天下午提的離職 , 阿里那邊剛開始走流程 。 同一天 , Qwen的后訓練負責人郁博文也正式離職 , 他的工作由年初從谷歌挖過來的zhou姓高管接任 。
林俊旸去年剛晉升 , 是阿里最年輕的P10 , 外界擔心他突然離開給Qwen后續模型研發和更新帶來不確定性 。
這種擔心不太必要 。
林俊旸和郁博文等固然是Qwen系列模型的核心功臣 , 大模型領域單兵能力的重要性也確實相比過去大幅提升 , 但阿里整個AI研發體系不可能只依賴于兩三個重要的技術骨干 。
我不相信Qwen因為林俊旸離開就會徹底隕落 , 就像我不太相信鵝廠招來姚順雨就能扭轉局面一樣 。
1先梳理下林俊旸和郁博文等人離開的原因 。
有傳言是說 , 阿里內部對現有的開源模式有分歧 , 覺得開源的成本投入不劃算 , 或者認為開源影響了阿里云賣自己的API 。
這個說法不合理 。 我倒不是說阿里內部沒有這種討論 , 而是因為林俊旸是做模型基礎研發 , 模型開源還是閉源 , 都不影響他工作結果的價值 。 就算阿里突然全面轉向閉源 , 模型研發照樣得有人帶 , 后訓練這些照樣得繼續做 。
按照這個邏輯 , 唯一能把這兩件事統一起來的 , 就是林俊旸確實有不可妥協的開源理想 。 給個P10又怎樣 , 只要Qwen轉向閉源 , 勞資立馬撂挑子不干 。
這種可能性有 , 但確實很小 。 不只是林俊旸走了 , 郁博文這些也走了 , 不可能說這些人都要當Richard Stallman吧 。
而且綜合各方面的消息 , 林俊旸的離開比較突然 。
說是昨天下午通義開了場內部會議 , 會上產生分歧 , 林俊旸當場離開 , 幾小時后就在X平臺上宣布了離職的消息 。 林俊旸級別高 , 阿里如果真的想調整開源戰略 , 這種業務負責人多少有點提前的吹風和討論 。
所以林俊旸突然離開 , 最大可能還是跟通義最近的組織調整有關 。
而這個組織調整的原因 , 應該不是直接出于開源和閉源的戰略有重大變化 。 今天阿里算是全球模型開源的扛把子 ,
HF上下載量一直保持領先 。 但阿里開源的整體狀態是三角形:中腰部模型能力很強 , 但參數量最大的最強模型表現是有差距的 。
阿里如果只是想做B端 , 通過云服務賣API , 這個問題還沒有那么關鍵 , 因為開源跟閉源是兩個賽道 。 然而阿里從去年11月開始 , 已經明牌要參與這輪AI入口爭奪 。
因為千問APP起步晚了對手一年多 , 需要投入更多資源追上對手 , 整個春節檔阿里為千問投入的預算也是最多的 。 這些措施取得了明顯效果 , 千問APP用戶快速增長 , 目前已經甩開元寶 , 但仍然低于豆包 。
從純B端向B/C兩端兼顧的轉向 , 對Qwen的模型能力提出了更高的要求 。 集團層面 , Qwen也得更多配合千問APP的產品團隊 , 因為后者當下是集團最大的優先級 。

林俊旸直接負責的Qwen團隊隸屬于通義實驗室 , 后者由阿里云CTO周靖人負責 。
通義正計劃將Qwen團隊分拆 , 從涵蓋不同訓練流程和模態的“垂直整合”體系 , 轉變成預訓練、后訓練、文本、多模態等一個個分開的水平分工團隊 , 這些團隊仍隸屬通義實驗室 。
晚點報道提到 , 林俊旸并不認可這種分開拆散團隊的做法 , 他認為預訓練、后訓練 , 乃至 Infra 和訓練團隊應該更緊密地結合和溝通 。
這個描述其實非常有意思 , 值得推敲一番 。
預訓練、后訓練這些團隊本身就是各自存在的 , 為什么在Qwen下面就是垂直整合 , 分拆過后就是水平分工呢?整個通義實驗室依舊在周靖人博士的領導之下 , 各團隊之間的拉通對齊怎么就不能做繼續做呢?
按照互聯網公司喜歡講的管理學模型 , 甚至可以說這讓組織結構進一步扁平化 , 有利于提高信息傳遞的效率 。
當然這只是理論上 , 而理論跟實際往往有相當的距離 。 林俊旸和Qwen團隊已經經過了長時期磨合 , 保持著高強度產出 , 做這種分拆一定意味著大量的組織摩擦和不確定性 。
2這些動作無法避免的后果是 , 林俊旸的“勢力范圍”在縮減 。
【通義巨震:周靖人收權,林俊旸放手?】他領導的Qwen團隊從去年中開始組建自己的Infra團隊 , 代替原來阿里云的人工智能平臺PAI 。 也就是說 , Qwen團隊在逐步補齊所有LLM訓練需要的基礎設施 。
OpenAI infra負責人翁家翌前段時間提到 , 真正拉開openai和meta差距的就在于infra上 。 他認為這其中的關鍵在于誰的RL infa BUG相對更少 , 訓練迭代更快 。
所以可以推測 , 林俊旸對于由阿里云PAI來負責通義各業務的infra不滿意 , 因此要單獨組建infra團隊 。
但阿里內部對Qwen團隊的投入產生評價本身就是有分歧的 , 這種團隊擴充或許進一步加劇了這種分歧 , 拉大了集團高管跟林俊旸團隊的張力 。 據說甚至有高管對除夕夜亮相發布的Qwen-3.5并不完全滿意 , 稱其是一個“半成品” 。
最終的局面就變成 , 一邊是林俊旸和Qwen團隊感覺受到了集團的資源掣肘 , 另一邊則是集團對Qwen表現也不滿意 , 要大調組織架構 , 提升產出并且加強跟C端產品的閉環 。
今天還流出一份吳媽給通義團隊開會的摘要 , 信息量很多但不保真 。

看起來從谷歌挖過來的zhou姓高管 , 是林俊旸離職的導火索 。 zhou擔心自己融不進Qwen團隊 , 所以要求掛到周靖人下面 。 晚點報道也提到 , zhou確實是直接向周靖人匯報 。
這個細節如果屬實 , 那基本意味著zhou跟林早就是要二選一 。
因為zhou是搞后訓練的 , 搞后訓練的跟統籌模型研發的不對付 , 還向頂頭上司“告御狀” , 暗示對方要排擠我 , 這后面抬頭不見低頭見的 , 哪里還有合作的可能 。
既然最后zhou的訴求得到了滿足 , 成功入職了 , 就說明周靖人和集團當時已經在兩個人之間做出了選擇 。

    推薦閱讀