除夕重磅！千問開源Qwen3.5，最大吞吐量提升至19倍

2026-03-13 機器人春晚小品

文章圖片

文章圖片

文章圖片

除夕夜，阿里官宣發布并開源新一代千問大模型千問 3.5（Qwen3.5-Plus）。這是繼 2025 年除夕發布 Qwen2.5-Max 后，阿里又一次在除夕帶來新一代模型。

現在，千問 APP 與 PC 端（qianwen.com）已經同步上線，用戶可在頁面頂部選擇模型新一代模型，來體驗千問 3.5 的能力。

去年除夕更新的 Qwen2.5-Max 重點在規模和性能，而這次，千問 3.5 更像是一場從純文本模型到原生多模態模型的底層架構層面重構。

圖丨現在打開千問，已經可調用新模型 Qwen3.5-Plus（來源：千問）

與前幾代的千問大語言模型相比，千問 3.5 這次帶來哪些模型性能的提升呢？

從預訓練來看，千問 3 是在純文本 Tokens 上進行，而千問 3.5 的預訓練則基于視覺和文本混合 token 。也就是說，視覺理解不再像從前那樣以外掛模塊形式存在，而是同語言能力共同在底層建?！白鲬稹?。

此外，其還大幅新增了中英文、201 種語言與方語言、STEM 和推理等數據。這意味著，打破了以往的局限性，而是嘗試讓模型在更密集的世界知識和推理邏輯。

值得關注的是，千問 3.5 以少于 40% 的參數量實現了超萬億的 Qwen3-Max 基座模型的高性能。這背后反應的不是簡單的堆參數，而是效率導向的架構優化。

（來源：千問）

在推理、編程、Agent 智能體等全方位基準評估中均表現優異：

·在指令遵循 IFBench 上，以 76.5 分刷新所有模型紀錄；

·在 MMLU-Pro 知識推理評測中超越 GPT-5.2 ，獲得 87.8 分得分；

·在博士級難題 GPQA 測評中得分為 88.4 分，高于 Claude 4.5 ，但與 GPT-5.2 的 92.4 分和 Gemini 3 Pro 相比仍有進步的空間；

·在通用 Agent 評測 BFCL-V4、搜索 Agent 評測 Browsecomp 等基準中，千問 3.5 表現與 Gemini 3 Pro、GPT-5.2 相比性能更優。

（來源：千問）

總體來看，這種原生多模態訓練，為千問 3.5 的視覺能力帶來了顯著提升。千問 3.5 在多項權威測評中，均實現了最佳性能，包括多模態推理（MathVison）、通用視覺問答 VQA（RealWorldQA）、文本識別和文件理解（CC_OCR）、空間智能（RefCOCO-avg）、視頻理解（MLVU）等。

可以看到的是，千問 3.5 不再是“語言強、視覺補” ，而是在統一架構下形成了一種相對完整的能力矩陣。

【除夕重磅！千問開源Qwen3.5，最大吞吐量提升至19倍】（來源：千問）

千問 3.5 之所以能實現性能的顯著提升，離不開性對 Transformer 經典架構的突破。

此前，千問團隊自研的門控技術成果“Gated Attention for Large Language Models: Non-linearity Sparsity and Attention-Sink-Free” ，獲得全球 AI 頂會 2025 NeurIPS 最佳論文。

（來源：arXiv）

本次千問 3.5 創新的混合架構中已融合該技術，團隊結合線性注意力機制和稀疏混合專家 MoE 模型架構，實現了“高參數、低激活”的結構：模型總參數規模達 397B ，但每次推理僅激活 17B 參數。這種結構帶來的好處可能是，模型在保持高性能能力的同時，推理效率大幅度提升。

（來源：千問）

根據千問官網，千問 3.5 通過訓練穩定優化以及多 token 預測等系列技術，實現了 Qwen3.5 性能比肩 Qwen3-Max 模型，并在此基礎上對推理效率進一步提升：在 32K 上下文場景中，千問 3.5 推理吞吐量可提升 8.6 倍；而在 256K 超長上下文中， Qwen3.5 推理吞吐量最大能實現 19 倍的提升。

這意味著，在長文本分析、復雜推理、Agent 調度等場景中，成本和延遲大幅下降。

圖丨千問 3.5 推理效率大幅提升，最大吞吐量提升至 19 倍（來源：千問）

基于優異的視覺能力，千問 3.5 還突破性地實現了從 Agent 框架到 Agent 應用，尤其是在提升操作效率方面。例如，能夠自主操作手機與電腦，高效完成日常任務，在移動端支持更多主流 APP 與指令，在 PC 端可處理更復雜的多步驟操作，包括跨應用數據整理、自動化流程執行等。

同時，千問團隊還構建了一個可擴展的 Agent 異步強化學習框架，基于此端到端可加速 3 到 5 倍，并將插件式智能體 Agent 支持擴展至百萬級規模。這也是標志千問從對話模型向行動模型過渡轉化。

千問透露，下一階段的重點將從模型規模轉向系統整合：構建具備跨會話持久記憶的智能體、面向真實世界交互的具身接口、自我改進機制。

放眼全球全球的大模型競爭已然不再只是比拼“更大、更準” ，而是“更高效、更可執行” 。千問 3.5 不僅是一次模型的更新，一場關于模型的效率革命，已經開始了。

參考資料：
https://qwen.ai/blog?id=qwen3.5
https://github.com/qiuzh20/gated_attention

排版：劉雅坤

推薦閱讀

上一篇：算力資源“全年緊張”仍坐穩主桌？解密科大訊飛大模型破局之道

下一篇：別光看9000mAh！透過一加Turbo 6，談一點省錢秘訣