剛剛,Cursor 2.0攜自研模型Composer強勢登場,不再只做「殼」

剛剛,Cursor 2.0攜自研模型Composer強勢登場,不再只做「殼」

文章圖片

剛剛,Cursor 2.0攜自研模型Composer強勢登場,不再只做「殼」

文章圖片

剛剛,Cursor 2.0攜自研模型Composer強勢登場,不再只做「殼」

文章圖片

剛剛,Cursor 2.0攜自研模型Composer強勢登場,不再只做「殼」

文章圖片

剛剛,Cursor 2.0攜自研模型Composer強勢登場,不再只做「殼」

文章圖片

剛剛,Cursor 2.0攜自研模型Composer強勢登場,不再只做「殼」

文章圖片

剛剛,Cursor 2.0攜自研模型Composer強勢登場,不再只做「殼」

文章圖片

剛剛,Cursor 2.0攜自研模型Composer強勢登場,不再只做「殼」

文章圖片

剛剛,Cursor 2.0攜自研模型Composer強勢登場,不再只做「殼」

機器之心報道
機器之心編輯部
終于 , Cursor 還是走上了自己訓練大型語言模型的路 。
Cursor 2.0 終于來了!
剛剛 , Cursor 發布了兩項重大更新:首個編碼模型 Composer , 以及用于并行協作多個智能體的新界面 。


此舉意義非凡 。 一直以來 , Cursor 雖然廣受歡迎 , 但終究免不了「AI 時代的 VS Code」的帽子 , 因為它此前只能使用 Claude、GPT 等第三方模型 。 這既是 Cursor 的起點 , 也成了它的瓶頸 。
Composer 的發布 , 堪稱是 Cursor 打破這個瓶頸的「獨立宣言」 , 這也標志著 Cursor 正式從「AI 外殼」向「AI 原生平臺」進化 。
自研模型 Composer
Composer 是一款前沿模型 , 雖然智能程度不敵 GPT-5 等最佳前沿模型 , 但速度確實遙遙領先 , 達到了同等智能模型的 4 倍 。

在基準測試中 , Composer 實現了前沿水平的編碼智能 , 同時生成速度達到每秒 250 個 token—— 大約是領先的快速推理模型的兩倍 , 是同類前沿系統的四倍 。 (注:Cursor 發布的對比將模型分為幾個類別:「最佳開源」(例如 , Qwen Coder、GLM 4.6)、「快速前沿」(Haiku 4.5、Gemini Flash 2.5)、「2025 年 7 月前沿」(年中可用的最強模型)以及「最佳前沿」(包括 GPT-5 和 Claude Sonnet 4.5) 。 Composer 在匹敵中端前沿系統智能水平的同時 , 還在所有測試類別中實現了有記錄以來的最高生成速度 。 )

該模型專為在 Cursor 中進行低延遲的智能體式編碼而打造 , 大多數回合在 30 秒內完成 。 早期測試者認為其快速迭代的能力非常順手 , 并愿意信任它處理多步驟編碼任務 。
官方表示 , Composer 通過一組強大的工具進行訓練 , 包括覆蓋整個代碼庫的語義搜索 , 因此在理解與處理大型代碼庫方面顯著更強 。


具體來說 , 在訓練過程中 , Composer 可使用一套生產級的搜索與編輯工具 , 并被要求高效解決各類棘手問題 。
該模型的研發動力源于 Cursor 團隊在開發 Cursor Tab(自研的補全模型)時的經驗 。
他們發現 , 開發者往往希望使用既足夠智能又能支持交互式使用的模型 , 以保持編碼的專注與流暢 。 在研發過程中 , 他們試驗了一個代號為 Cheetah 的原型智能體模型 , 以更好地理解更高速智能體模型的影響 。 Composer 是該模型的更智能升級版 , 憑借足夠的速度支撐交互式體驗 , 讓編碼始終愉快順滑 。

從架構上來看 , Composer 是一種混合專家(MoE)模型 , 支持長上下文的生成與理解 。 它通過在多樣化的開發環境中進行強化學習 , 針對軟件工程進行了專項優化 。 每次訓練迭代中 , 模型都會接收問題描述 , 并被指示產出最佳響應 , 無論是代碼修改、方案規劃 , 還是信息性回答 。 模型既能使用讀取與編輯文件等簡單工具 , 也能調用更強大的能力 , 例如終端命令和面向整個代碼庫的語義搜索 。
為衡量進展 , 他們構建了一套盡可能貼近軟件開發者實際使用價值的評測 。 新基準測試 Cursor Bench 由 Cursor 的工程師和研究人員提交的真實智能體請求組成 , 并配有人工精心整理的最佳解決方案 。 該評測不僅考察智能體的正確性 , 還評估其對代碼庫既有抽象與軟件工程實踐的遵循程度 。

強化學習使他們能夠有針對性地優化模型 , 以更好地服務高效的軟件工程 。 鑒于響應速度是交互式開發的關鍵 , 他們鼓勵模型在工具使用上做出高效選擇 , 并在可能的情況下最大化并行處理 。 此外 , 他們通過減少不必要的回復、避免無依據的陳述來訓練模型 。 他們還發現 , 在 RL 過程中 , 模型會自發習得一些有用的能力 , 例如執行復雜搜索、修復 linter 錯誤 , 以及編寫并運行單元測試 。

Composer 已經被 Cursor 自己的工程團隊在日常開發中使用 —— 這表明其成熟度和穩定性 。
目前 , Composer 已完全集成到 Cursor 2.0 中 , 這是該公司智能開發環境的一次重大更新 。
多智能體界面
Cursor 的界面設計也進行了更換 。
其博客介紹說 , 這一版本更加聚焦 , 徹底以「智能體」為中心 , 而非傳統的文件結構 。 這樣用戶就能專注于想要的結果 , 而讓智能體處理繁瑣的細節 。 當需要深入代碼時 , 用戶也可以輕松在新布局中打開文件 , 或切換回經典的 IDE 界面 。

Cursor 2.0 能夠輕松并行運行多個智能體 , 它們之間互不干擾 。 這得益于 git worktree 或遠程機器的支持 。 Cursor 表示:「我們甚至發現 , 讓多個模型同時嘗試同一問題并擇優采用 , 能顯著提升最終結果 , 尤其是在更難的任務上 。 」

every.to 博客分享了一些測試示例 , 比如在下面的示例中 , 在頂部欄中 , 可以看到三個不同的模型上運行了相同的任務:Composer 1 Alpha 運行了兩次 , Grok Code 運行了一次:

該博客寫到:「現在 , 開發者可以同時運行多個 AI 智能體 , 每個智能體負責項目的不同部分 , 每個部分被稱為一個工作樹(work tree) 。 這相當于一群實習生各自負責這篇文章的不同章節 , 并同時向我匯報工作 。 」
另外 , Cursor 官方還提到 , 隨著他們更多地使用智能體進行編碼 , 出現了兩個新的瓶頸:代碼評審與變更測試 。
Cursor 2.0 也開始解決這兩個問題 。 支持更快速地審閱智能體的變更 , 并在需要時深入代碼 。
同時 , 他們還構建了原生瀏覽器工具 , 使 Cursor 可以測試其工作并持續迭代 , 直到產出正確的最終結果 。

基礎設施
高效訓練大型 MoE 模型需要在基礎設施與系統研究方面進行大量投入 。 團隊基于 PyTorch 和 Ray 構建了定制化訓練基礎設施 , 以在大規模環境下支持異步強化學習 。 他們通過將 MXFP8 MoE kernels 與專家并行和混合分片數據并行相結合 , 在原生低精度下訓練模型 , 從而以極低的通信開銷將訓練擴展到數千張 NVIDIA GPU 。 此外 , 采用 MXFP8 訓練還能在無需訓練后量化的情況下實現更快的推理速度 。
在進行 RL 時 , 團隊希望模型能夠調用 Cursor Agent 框架中的任意工具 。 這些工具可用于編輯代碼、進行語義搜索、使用 grep 查找字符串 , 以及運行終端命令 。 以 Cursor 的規模 , 要讓模型高效調用這些工具 , 需要在云端并發運行數十萬份隔離的沙盒編碼環境 。 為了承載這類工作負載 , 團隊對既有的 Background Agents 基礎設施進行了改造 , 重寫了虛擬機調度器 , 以適配訓練運行的突發性與規模 。 由此 , 他們將 RL 環境與生產環境實現了無縫統一 。
網友點評
作為明星級 AI 編程工具 , Cursor 的這次大版本更新自然也收獲了無數眼球 。
參與過早期體驗的開發者紛紛給出好評 。 比如 every.to 博客就收集整理了多位開發者的意見反饋 , 其中有好有壞:


X 上也有不少網友分享自己的體驗 。

已經有人玩笑式讓 Cursor 2.0 來構建 AGI 了:

參考鏈接:
https://x.com/cursor_ai/status/1983567619946147967
https://cursor.com/blog/2-0
https://every.to/vibe-check/vibe-check-cursor-2-0-and-composer-1-alpha
https://cursor.com/cn/changelog/2-0
【剛剛,Cursor 2.0攜自研模型Composer強勢登場,不再只做「殼」】文中視頻鏈接:https://mp.weixin.qq.com/s/SOYp-wIq3YE_DbgppqhALg

    推薦閱讀