除夕重磅!千問開源Qwen3.5,最大吞吐量提升至19倍

除夕重磅!千問開源Qwen3.5,最大吞吐量提升至19倍

文章圖片

除夕重磅!千問開源Qwen3.5,最大吞吐量提升至19倍

文章圖片

除夕重磅!千問開源Qwen3.5,最大吞吐量提升至19倍

文章圖片

除夕重磅!千問開源Qwen3.5,最大吞吐量提升至19倍

除夕夜 , 阿里官宣發布并開源新一代千問大模型千問 3.5(Qwen3.5-Plus) 。 這是繼 2025 年除夕發布 Qwen2.5-Max 后 , 阿里又一次在除夕帶來新一代模型 。

現在 , 千問 APP 與 PC 端(qianwen.com)已經同步上線 , 用戶可在頁面頂部選擇模型新一代模型 , 來體驗千問 3.5 的能力 。

去年除夕更新的 Qwen2.5-Max 重點在規模和性能 , 而這次 , 千問 3.5 更像是一場從純文本模型到原生多模態模型的底層架構層面重構 。


圖丨現在打開千問 , 已經可調用新模型 Qwen3.5-Plus(來源:千問)

與前幾代的千問大語言模型相比 , 千問 3.5 這次帶來哪些模型性能的提升呢?

從預訓練來看 , 千問 3 是在純文本 Tokens 上進行 , 而千問 3.5 的預訓練則基于視覺和文本混合 token 。 也就是說 , 視覺理解不再像從前那樣以外掛模塊形式存在 , 而是同語言能力共同在底層建?!白鲬稹?。

此外 , 其還大幅新增了中英文、201 種語言與方語言、STEM 和推理等數據 。 這意味著 , 打破了以往的局限性 , 而是嘗試讓模型在更密集的世界知識和推理邏輯 。

值得關注的是 , 千問 3.5 以少于 40% 的參數量實現了超萬億的 Qwen3-Max 基座模型的高性能 。 這背后反應的不是簡單的堆參數 , 而是效率導向的架構優化 。


(來源:千問)

在推理、編程、Agent 智能體等全方位基準評估中均表現優異:

·在指令遵循 IFBench 上 , 以 76.5 分刷新所有模型紀錄;

·在 MMLU-Pro 知識推理評測中超越 GPT-5.2 , 獲得 87.8 分得分;

·在博士級難題 GPQA 測評中得分為 88.4 分 , 高于 Claude 4.5 , 但與 GPT-5.2 的 92.4 分和 Gemini 3 Pro 相比仍有進步的空間;

·在通用 Agent 評測 BFCL-V4、搜索 Agent 評測 Browsecomp 等基準中 , 千問 3.5 表現與 Gemini 3 Pro、GPT-5.2 相比性能更優 。


(來源:千問)

總體來看 , 這種原生多模態訓練 , 為千問 3.5 的視覺能力帶來了顯著提升 。 千問 3.5 在多項權威測評中 , 均實現了最佳性能 , 包括多模態推理(MathVison)、通用視覺問答 VQA(RealWorldQA)、文本識別和文件理解(CC_OCR)、空間智能(RefCOCO-avg)、視頻理解(MLVU)等 。

可以看到的是 , 千問 3.5 不再是“語言強、視覺補” , 而是在統一架構下形成了一種相對完整的能力矩陣 。


【除夕重磅!千問開源Qwen3.5,最大吞吐量提升至19倍】(來源:千問)

千問 3.5 之所以能實現性能的顯著提升 , 離不開性對 Transformer 經典架構的突破 。

此前 , 千問團隊自研的門控技術成果“Gated Attention for Large Language Models: Non-linearity Sparsity and Attention-Sink-Free” , 獲得全球 AI 頂會 2025 NeurIPS 最佳論文 。


(來源:arXiv)

本次千問 3.5 創新的混合架構中已融合該技術 , 團隊結合線性注意力機制和稀疏混合專家 MoE 模型架構 , 實現了“高參數、低激活”的結構:模型總參數規模達 397B , 但每次推理僅激活 17B 參數 。 這種結構帶來的好處可能是 , 模型在保持高性能能力的同時 , 推理效率大幅度提升 。


(來源:千問)

根據千問官網 , 千問 3.5 通過訓練穩定優化以及多 token 預測等系列技術 , 實現了 Qwen3.5 性能比肩 Qwen3-Max 模型 , 并在此基礎上對推理效率進一步提升:在 32K 上下文場景中 , 千問 3.5 推理吞吐量可提升 8.6 倍;而在 256K 超長上下文中 , Qwen3.5 推理吞吐量最大能實現 19 倍的提升 。

這意味著 , 在長文本分析、復雜推理、Agent 調度等場景中 , 成本和延遲大幅下降 。


圖丨千問 3.5 推理效率大幅提升 , 最大吞吐量提升至 19 倍(來源:千問)

基于優異的視覺能力 , 千問 3.5 還突破性地實現了從 Agent 框架到 Agent 應用 , 尤其是在提升操作效率方面 。 例如 , 能夠自主操作手機與電腦 , 高效完成日常任務 , 在移動端支持更多主流 APP 與指令 , 在 PC 端可處理更復雜的多步驟操作 , 包括跨應用數據整理、自動化流程執行等 。

同時 , 千問團隊還構建了一個可擴展的 Agent 異步強化學習框架 , 基于此端到端可加速 3 到 5 倍 , 并將插件式智能體 Agent 支持擴展至百萬級規模 。 這也是標志千問從對話模型向行動模型過渡轉化 。

千問透露 , 下一階段的重點將從模型規模轉向系統整合:構建具備跨會話持久記憶的智能體、面向真實世界交互的具身接口、自我改進機制 。

放眼全球全球的大模型競爭已然不再只是比拼“更大、更準” , 而是“更高效、更可執行” 。 千問 3.5 不僅是一次模型的更新 , 一場關于模型的效率革命 , 已經開始了 。

參考資料:
https://qwen.ai/blog?id=qwen3.5
https://github.com/qiuzh20/gated_attention

排版:劉雅坤

    推薦閱讀