科學家的超級合伙人來也!星河啟智大圣讓高能動性AI入局真實科研

科學家的超級合伙人來也!星河啟智大圣讓高能動性AI入局真實科研

文章圖片

科學家的超級合伙人來也!星河啟智大圣讓高能動性AI入局真實科研

文章圖片

科學家的超級合伙人來也!星河啟智大圣讓高能動性AI入局真實科研

文章圖片

科學家的超級合伙人來也!星河啟智大圣讓高能動性AI入局真實科研

文章圖片

科學家的超級合伙人來也!星河啟智大圣讓高能動性AI入局真實科研

文章圖片

科學家的超級合伙人來也!星河啟智大圣讓高能動性AI入局真實科研

文章圖片

編輯|+0
任何在通風櫥前熬過夜、被繁瑣的濕實驗折磨過的科研人 , 看到這一幕大概都會心跳加速 。
在星河啟智科學智能開放平臺推出全面升級版本的發布會現場 , 大屏幕上實時展示了這樣一段流程:超級科研合伙人「大圣」在云端給出 AI 模型計算結果與自然語言描述的實驗方案后 , 操作者一鍵點擊「AI 費米」模塊生成儀器的實驗調度排產方案 。 畫面隨即連線遠端的濕實驗室:接收到指令的真實自動化實驗器材 , 已經開始有條不紊地運轉 。

過去幾年 , AI 工具在科研領域爆發式增長 。
文獻助手、代碼助手、分子設計模型、自動化實驗系統不斷涌現 , 單點能力持續刷新上限 。 但在真實實驗室一線 , 許多科學家的直觀感受卻是:工具越多 , 系統反而越碎 , 科研流程并沒有因此變得更輕松 。
原因很簡單:科研從來不是一組松散工具的疊加 , 而是一項高度專業、強約束、長周期演進的系統工程 。
相比通用辦公或內容生產場景 , 科學研究同時要求:對原生結構與物理約束的高保真理解;對多路徑探索過程的持續記憶;對實驗結果的嚴格驗證閉環;以及對高敏數據與知識產權的安全控制 。
問題正在從「模型不夠強」 , 轉向一個更結構性的命題:有沒有一種 AI , 能夠在專業約束下高能動性地組織科研流程、與人類科學家共同進行深度科學探索?
2026 年 3 月 1 日 , 在上海徐匯「模速空間」的發布會上 , 由上??茖W智能研究院(下稱上智院)、復旦大學和無限光年聯合共建的星河啟智平臺宣布全面升級 , 正式推出超級科研合伙人「大圣」 。

本次發布會由上??茖W智能研究院聯合復旦大學主辦 , 來自上海市經信委、科委、國資體系及阿里達摩院等多方代表到場 , 標志著科研范式變革正在集中頂尖學術與官方資源加速推進 。

它試圖回答一個更核心的問題:面向專業嚴謹的科學探索 , 一個超級科研合伙人究竟需要具備怎樣的高能動性與系統級專業能力?
為什么 AI4S 需要
「系統+專業+高能動性」 ,
而不是更多「點狀執行」?
如果把過去兩年的 AI4S 進展粗略分層 , 會看到一個非常典型的演進路徑:先是模型能力躍升 , 再是工具數量爆發 , 而現在 , 瓶頸正在向更深一層轉移 。
在采訪中 , 復旦大學人工智能創新與產業研究院副院長、上智院科研副院長兼星河啟智平臺負責人程遠提到一個一線觀察:科學家并不缺工具 , 缺的是把能力真正「用起來」的組織能力 。 尤其是在面向專業科學探索時 , 科學家需要的不僅是零散的工具 , 更是一套具備推理、決策與實驗閉環能力的專業科研智能體體系 。
這背后 , 是科研場景與通用 AI 使用場景之間一條被長期低估的分界線 。 與通用辦公或內容生成任務中的短鏈路、低耦合不同 , 真實科研更加復雜 。
一個看似簡單的研究問題 , 往往會迅速展開成一條長達數月甚至數年的復雜路徑:文獻檢索 → 假設提出 → 數據處理 → 模型構建 → 仿真 → 濕實驗 → 回流修正 , 而且可能隨時分叉、回滾、重來 。
更關鍵的是 , 科研流程同時帶有三重硬約束:一是模態原生(結構 / 序列 / ?。 ?, 不是文本友好輸入;二是流程長周期強耦合 , 項目級連續研究靠短上下文很難撐?。 蝗墻峁匭牖氐轎錮硎瀾縲W跡骸桿愕枚浴共壞扔凇甘欽嫻摹?。
三者疊加 , 科研需要的是能專業面向科學探索、主動組織流程的高能動性系統 。
這正是「大圣」被定義為「超級科研合伙人」的出發點 。 以「大圣」為核心載體 , 星河啟智平臺構建了多模態科學基礎模型、群體記憶、專家級科學 Skills 與自驅動實驗室等一系列專業前沿的智能體協作研發能力 。
「大圣」四大能力拆解:
認知、行動、記憶、驗證
認知:真正理解科學 , 而不是文本
高能動性的前提 , 是模型真的「看懂科學」 。
過去相當一部分通用大模型的技術路徑 , 本質上是把一切輸入「文本化」:分子結構轉成字符串 , 蛋白序列壓成 token , 譜圖展平成向量 , 然后交由語言模型統一處理 。
這一路徑在很多任務上確實帶來了可觀進展 , 但在嚴肅科研中 , 這條路線開始暴露硬傷:當三維結構被壓成一維序列時 , 其空間結構信息已經損失 , 模型學到的 , 很可能只是「像科學的文本」 , 而不是科學本身 。
但科研里 , 恰恰不能丟的是空間關系與物理約束 。
基于這一判斷 , 「大圣」體系的第一塊基石 , 并不是更大的語言模型 , 而是一個面向科學原生數據構建的多模態基礎模型:「神珍」 。

它試圖解決的核心問題可以概括為一句話:讓模型直接在科學模態空間里思考 , 而不是繞道語言 。
在架構設計上 , 「神珍」采用了三點關鍵策略:

  • 支持結構、序列、場信息的原生輸入 。
  • 輸出直接對齊科學結果形式 。
  • 在系統內部實現多種模態科學 token 對齊(包括語言模態) 。
簡單說 , 自然語言更多負責調度 , 而深度的推理盡量留在科學表示空間完成 。
從公開結果看 , 這一路線已給出早期信號:在 ncRNA 分類任務中準確率達 96.3% , 在 RNA Switch 生成任務中設計精準度約 90%+ , 并完成 Toehold Switch 的實驗閉環 。
這些結果的意義不只在于指標本身 。 更關鍵的是 , 它們驗證了一件事:當模型不再被限制在文本空間時 , AI4S 的能力上限開始被重新打開 。
行動:從 Tools 到科研級 Skills
看懂只是第一步 。 科研一線更現實的問題是:AI 能不能把事穩定做成?
這正是許多科研團隊在過去最真實的落差來源:工具很多 , 但它們之間彼此依賴復雜 , 真正「能自動化跑通全部流程」的能力并不多 。
星河啟智給出的答案 , 是把 Tools 升級成科研級 Skills 。
兩者差別的本質是:Tool 類似于固化的函數 / 工具調用;而 Skill 本質上是一種可被 AI 理解且能自適應調整 / 調度的基礎能力 。
具體而言 , 一個完整 Skill 除了包含一個工具外 , 通常需要內含:標準化輸入輸出約定、工具調用邏輯、以及超參數的含義及范圍等等 。 換句話說 , 從 TOOL 到 SKILL 更像從「各司其職的手工作坊」到「環環相扣的車間流水線」的變化 。
從工程角度看 , 把 AI 能力封裝成科研級 Skills , 至少要同時跨過三道隱形門檻:
  • 遵循學科的基本規律和邏輯 。
  • 路徑必須被真實場景驗證過 。
  • 結果上可評估、可復現、可驗證 。
也正因此 , 程遠在采訪中強調 , 「大圣」的 Skills 體系是圍繞真實科研流程一點點沉淀出來的 , 而不是從通用 Agent 生態直接遷移 。
在系統層 , 「大圣」將這些能力模塊化為可調度 Skills , 并交由多智能體按需編排:拆解科研任務路徑 → 匹配可用 Skills 組合 → 調度算力與模型資源 → 并行推進子任務 → 根據中間結果動態調整路線 。
截至目前 , 平臺已沉淀 300+ 可復用科研 Skills , 覆蓋四大學科群與 20 余類科研場景 , 并已在部分真實項目中實現規?;瘧?。

值得注意的是 , 過去 7 個月間 , 星河啟智平臺模型與工具數量實現翻倍增長 , 入駐科研團隊增長達 1200% , 顯示出科學智能生態正在進入加速擴張階段 。
從一些早期落地案例看 , 這套體系已經開始體現出產業價值:例如在新型補鋰劑分子研發等任務中 , 相關流程實現了千萬級直接轉化 , 并吸引了進一步資本投入 。 同時在人文社科領域 , 通過構建首個萬題級早期中華文明評測集 , 并在此基礎上打造多個學科智能體 , 有效賦能了人文社科研究與通識教育 。

視頻鏈接:https://mp.weixin.qq.com/s/o1EzduR-wWGjXGJSGvwGOw
如果回到更宏觀的視角 , 「大圣」真正試圖接管的 , 不是「工具調用」 , 而是科研中的系統性重復勞動 。
記憶:科研不是一輪對話
當系統真正進入科研深水區 , 一個更隱蔽但更致命的問題會浮現出來:它能不能記得住整個研究過程?
這是通用 Agent 在科研場景中最容易被低估、卻最先暴露瓶頸的一環 。
與短鏈路任務不同 , 科研天然是跨月甚至跨年的連續演進 , 伴隨多假設并行探索和大量失敗路徑回滾 。 傳統對話式記憶很難承載這種項目級復雜度 。
更關鍵的是 , 一旦進入多智能體并行科研 , 傳統記憶方案會迅速暴露結構性問題:假設互相污染、失敗經驗難沉淀、歷史難以結構引用、長期認知容易漂移 。
換句話說 , 問題已經不是「記不記得住」 , 而是:如何治理一整個不斷分叉、生長、回滾的科研認知樹 。
「大圣」的選擇是借鑒軟件開發中 Git 版本的管理思想 , 引入多分支群體記憶架構 , 其核心可以概括為三點:
  • 精準長期記憶(避免認知坍塌 , 實現記憶回滾):以成熟理論為主干認知 , 完整留存多路徑演進軌跡 , 確保長周期科研認知不漂移、不遺忘 , 并支持隨時溯源與路徑回滾 。
  • 多主體保護(共識與非共識雙向保護):每條創新假設在獨立分支并行演進 , 實現記憶與數據的安全隔離;既穩固已驗證的共識基線 , 又讓非共識觀點能在獨立空間中完成從計算到驗證的孵化 。
  • 優勢認知整合(沉淀成功經驗 , 吸收失敗教訓):失敗分支完整保留全過程的探索經驗與優勢認知 , 結合其他分支啟發新方向;成功經驗則通過可控合并機制融入主干 , 實現群體認知的持續升級與跨場景復用 。

這種設計 , 本質上是把科研過程從「對話歷史」 , 升級成了可治理的群體認知系統 。
團隊的目標很明確:讓科研過程第一次具備類似軟件工程的屬性:可追溯、可回滾、可復用、可演進 。
該架構已在上海市科學智能百團百項超寬禁帶半導體研發項目中落地驗證 , 支撐十余個專業智能體有序協同與多路徑并行探索 。

驗證:讓模型全面鏈接物理世界 , 上天入體
對 AI4S 來說 , 檢驗其能否真正落地的黃金標準之一是:能不能回到物理世界被驗證 。
這幾乎是所有科學智能系統共同面對的「物理現實」 , 模型可以在云端秒級生成上萬候選 , 但濕實驗的驗證成本始終難以壓縮 。
在采訪中 , 程遠也明確指出 , 科學智能如果停留在「云上跑通」 , 其價值是有限的;只有當 AI 模型的預測結果能夠被物理實驗持續校準 , 系統才可能形成真正可靠的科學認知閉環 。
這正是「大圣」在第四層能力上重點補齊的一環 。 為此 , 「大圣」把計算與實驗拉進同一條閉環:模型云端高通量預測 → 智能化濕實驗 → 數據回流 → 模型強化更新 。
整個過程盡可能減少人工串行等待 , 將原本割裂的計算的軟階段與實驗的硬階段壓縮進同一條可迭代流程中 , 形成軟硬一體的科學智能閉環 , 讓 AI 在真實物理世界的不斷反饋里持續進化 。
經過團隊驗證 , 這套自動化編排已將上智院的部分科研流程效率提升約 3 倍 , 并顯著減少無效實驗 。
更進一步 , 「大圣」在驗證層的野心并不只停留在單一實驗室自動化 , 而是提出了一套更完整的科學全域覆蓋 , 團隊稱之為「上天入體」:一頭深入生命科學實驗體系(如 siRNA 設計提升成功率、減少無效濕實驗) , 一頭延伸到地球 / 太空觀測 , 用實時數據持續修正模型 。

目前 , 上智院已與復旦大學、之江實驗室完成「空地數據互聯 - 伏羲模型上天 - 星上計算」閉環鏈路驗證 , 并在軌運行一個月 , 接下來計劃與業界伙伴合作共建 AI 氣象星座 。

這一步的象征意義很明確:AI4S 不再只是「在電腦里做科學」 , 而是開始系統性接入真實世界 。
當認知、行動、記憶與驗證四層逐步閉合 , 「大圣」指向的 , 也不再只是一次模型升級 , 而更像是一種面向科研流程的操作系統級躍遷 。
「Scientists in the loop」不是口號
當然 , 程遠在采訪中也反復強調一點:自動化 ≠ 無人化 。 尤其是在異常數據、新規律跡象或關鍵路徑選擇出現時 , 系統會主動觸發科學家介入審核 。
這種設計背后的判斷非??酥?, 也非常現實:AI 適合高通量探索、AI 擅長重復勞動、AI 可以加速收斂 。
但真正的科學洞察、異常意義判斷以及研究方向轉向 , 仍然需要人類科學家在環 。
它重新劃分了一種更清晰的協作邊界:AI 負責規?;剿髋c執行 , 科學家負責關鍵判斷與最終把關 。
也正是在這個意義上 , 「大圣」被團隊比喻為科研取經路上的「孫行者」:不是替代唐僧 , 而是作為具備高能動性的超級合伙人 , 它不僅擁有強大的執行力 , 更具備中心化決策與推理能力 , 能夠調度多智能體協同執行 。
這套高能動性恰恰源自「大圣」嚴密的系統級專業底座:以科學多模態基礎模型為「大腦」保障推理 , 以驗證過的科學 Skills 為「法器」執行任務 , 以多智能體的群體記憶為「識?!怪伍L周期研究 , 最終通過「上天入地」的自驅動實驗室全面鏈接并驗證物理世界 , 形成科研閉環 。
為什么這不是一夜能復制的?
當一個科研智能體開始深入接管流程、調用算力、觸達實驗 , 問題就不再是「能力夠不夠強」 , 而是:科研機構 , 敢不敢把關鍵任務交給它 。
這在 AI4S 領域尤為敏感 。
與通用辦公不同 , 科研數據天然高敏:未公開實驗結果、核心配方、臨床數據、潛在知識產權 , 每一項都對應真實風險成本 。
在采訪中 , 程遠提到 , 很多企業和高校最初的顧慮并不在模型性能 , 而在一個更基礎的問題:數據一旦進入系統 , 是否還可控?
給高能動性的「大圣」套上「金箍」
隨著智能體從被動問答走向主動執行 , 風險模型也在發生變化 。
過去的大模型 , 大多數風險集中在「說錯話」;而高能動性科研智能體 , 一旦具備任務調度與實驗編排能力 , 風險迅速外溢:是否會越權訪問數據?是否會誤觸高成本實驗?是否會造成知識資產泄露?是否能完整追溯決策路徑?
為此 , 「大圣」在系統層引入了一套可信計算與安全協作機制 , 核心思路很直接:
  • 數據不外流:原始數據盡量留在本域處理 。
  • 能力可審計:所有 Agent 調用全程可追溯 。
  • 環境可試錯:提供 Sandbox 支持隔離驗證 。
用團隊的話說 , 就是給越來越強的「大圣」 , 先戴好金箍、配上緊箍咒 , 再放它上場 。

跨組織協作 , 信任如何被生產
一旦進入真實科研協作 , 問題會進一步復雜 。 很多前沿研究本質上是跨機構、跨企業完成的 , 瓶頸往往不在技術 , 而在信任邊界 。
對此 , 星河啟智補了兩層基礎設施:
  • A2A(Agent-to-Agent)服務化協作:合作方以 Agent 服務形式提供能力 , 實現「能力可用、數據不出域」 。
  • Agent on Chain 可確權記錄:關鍵任務拆解與執行軌跡上鏈存證 , 讓協作過程可驗證、可追責 。
這一步的指向已經很明確:當科研進入多智能體時代 , 信任必須被系統化生產 。
【科學家的超級合伙人來也!星河啟智大圣讓高能動性AI入局真實科研】更難復制的 , 其實是「真實科研飛輪」
真正拉開差距的 , 往往是另一層更慢變量的積累:真實科研生態綁定 。
截至目前 , 星河啟智平臺已沉淀:400+ 科學模型與工具;22PB 高價值數據資產;上千科研團隊協作網絡 。
這些資產并不是簡單堆疊出來的 , 而是在真實科研任務中反復打磨形成的能力網絡 。
模型能力可以被快速追趕 , 但深度嵌入科研流程的系統與生態 , 很難一夜復制 。
結語:
跨越工具屬性 ,
重構科研生產關系
在發布會上 , 立足星河啟智平臺 , 上智院和復旦同步發起了第四屆世界科學智能大賽的創新賽道——AI4S 智能體 CNS 挑戰賽 , 將目標直指一項前所未有的硬核考驗:要求智能體在完全無人工干預的條件下 , 跑通頂刊級科研閉環 。
如果說過去兩年的 AI4S 競爭還主要停留在「模型能力」層 , 那么以「大圣」為代表的新一代科研智能體 , 正在把競爭維度推向更重的系統層與基礎設施層 。
當 AI 第一次被要求在零干預條件下跑通頂刊級科研閉環 , 人類在科研體系中的位置 , 是否正在被重新定義?
從采訪釋放出的信號來看 , 團隊的判斷相當克制 。 他們依然反復強調一個前提:Scientists in the loop 是結構設計 , 而不是過渡方案 。
但技術演進的張力 , 恰恰也正在這里悄然積累 。
一方面 , 具備長周期記憶、多智能體協同與干濕閉環能力的系統 , 正在系統性吞噬科研流程中的重復勞動;另一方面 , 人類科學家的角色 , 也在從「親自完成每一步」 , 緩慢轉向「定義問題與最終裁決」 。
這或許意味著 , AI4S 正在從一場工具層面的效率革命 , 悄然邁入一次更深層的變革:科研生產關系的重排 。
如果這一路線持續推進 , 那么未來驅動前沿突破的核心引擎 , 或許將演變為一種全新的深度共生關系:具備頂層洞察力的科學家 , 加持一套不斷進化的系統級高能動性科研智能體 。
而「大圣」 , 則是這場長周期變化中 , 剛剛顯形的一個早期信號 。

    推薦閱讀