虛實共振：模型×終端技術沙龍圓滿舉辦

2026-04-10 人工智能上海市機器人 ai

文章圖片

文章圖片

文章圖片

文章圖片

11月14日，由模力社區、機器之心主辦的「虛實共振：模型×終端技術沙龍」在北京圓滿落幕。本次沙龍緊扣具身智能這一產業高地，聚焦“模型×終端”的深度融合，匯聚來自產業界、投資界的多位專家代表，從世界模型構建、VLA 技術突破、真機評測標準到數據驅動范式等維度展開了前瞻性探討。活動不僅全景式展示了當前技術落地的關鍵路徑，更為構建模型與終端協同演進的未來生態勾勒出清晰的演進圖景。

嘉賓云集，共話行業發展

上海張江科學之門科技發展有限公司副總經理管鳳華
活動伊始，上海張江科學之門科技發展有限公司副總經理管鳳華作為主辦方代表進行推介。她介紹，張江模力社區作為上海人工智能產業的核心集聚區，依托張江科學城三十余年的科創基礎，是國家參與全球科技競爭的重要引擎。其三大先導產業規模達 4700 億元，占上海市 GDP 四分之一，匯聚超 2.4 萬家企業與眾多高新技術主體。社區聚焦垂類人工智能，構建全棧式產業生態，涵蓋算力、模型與語料三大要素，并通過多層次政策支持，包括首年百萬算力補貼及最高兩千萬專項扶持。地理上實現“10 分鐘產業觸達、5 分鐘生活配套” ，并建設 AI 小鎮服務中心，推動技術驗證與商業應用。結合青創政策、全周期金融護航及水綠交融的城市環境，張江致力于打造有溫度的科創高地，助力企業與人才共創未來。未來，模力社區期待與更多企業攜手同行，共建開放協同、繁榮共生的產業生態，共同推動人工智能技術創新與產業躍遷。

北京極佳視界科技有限公司合伙人副總裁毛繼明
北京極佳視界科技有限公司合伙人副總裁毛繼明先生指出，世界模型是構建物理世界通用智能的核心基座，極佳科技在世界模型和具身大腦上的深厚積累就是要成為物理世界通用智能的引領者，成為物理世界的“OpenAI” ，機器人時代的“蘋果” 。具身智能發展可分為三階段：從硬件產業鏈成熟，到通用模型解決“通用大腦”問題，最終實現機器人具備物理世界認知并大規模應用。物理世界通用智能需要融合語言智能與世界模型，其中世界模型可以認為是物理世界通用智能的底層“操作系統” ，將會成為構建物理世界通用智能的核心基座，世界模型未來重要性日益凸顯，將會持續驅動算法從端到端走向世界動作模型的全新范式演進，行業巨頭如英偉達、Google、Tesla、華為、理想等等 Physical AI 公司正在積極布局，共同推動智能時代從“工具延伸”邁向有意識、大規模改造世界的新紀元。

Dexmal 原力靈機創始團隊成員汪天才
在具身智能浪潮下， VLA（視覺-語言-動作）模型面臨兩大挑戰：缺乏統一高效的開源工具箱，以及缺乏大規模公正的真機物理評測。 Dexmal 原力靈機創始團隊成員汪天才先生介紹了一站式 VLA 開源工具箱 Dexbotic ，它整合多種數據格式與構型，提供強預訓練模型，支持快速開發與多仿真器統一評測，顯著提升研發效率 3-7 倍；同時，原力靈機推出全球首個具身智能的真機評測平臺 RoboChallenge ，基于大規模任務集Table30（包含 30 個精心設計的日常任務、2.4 萬段視頻數據）進行公平測試，用戶可在線提交模型并獲得詳盡的性能反?。淮送?，配套開源硬件 DOS-W1 支持模塊化數據采集與即插即用，全面降低研發門檻。 Dexbotic、RoboChallenge 和 DOS-W1 三者正在形成協同效應，從軟件、硬件、標準方面推動 VLA 技術發展與生態共建。

靈御智能創始人金戈
靈御智能創始人金戈先生在演講中提出，具身智能目前面臨“不可能三角”的挑戰——即通用性、可靠性和速度難以兼顧。傳統工業機器人自主性不足，模型驅動方式雖快但泛化能力弱，核心問題在于高質量真機數據的嚴重匱乏。他強調“人在環中”是經過驗證的可靠路徑，通過人類介入收集復雜場景數據，可提升模型魯棒性，例如自動駕駛安全員和智能零售中的實時反饋。漸進式發展路徑主張先部署有人遠程操作的機器人，積累真實數據以迭代優化，逐步實現自主化，類似呼叫中心向AI過渡的歷程。其公司推出的輪臂機器人以可負擔價格，結合低延遲遙操與3D感知技術，已應用于機場清潔等場景，顯著降低成本并推動商業飛輪運轉。這一路徑優先聚焦工業等高容錯需求領域，暫避家庭復雜環境，以數據驅動實現具身智能的務實演進。

智在無界靈巧手團隊負責人袁昊琦
智在無界靈巧手團隊負責人袁昊琦先生提出，利用海量人類視頻數據訓練視覺-語言-動作大模型，是實現機器人泛化操作的新路徑。當前主流方法依賴真機遙操數據，成本高、多樣性差且受限于特定本體。團隊通過收集互聯網人類第一視角操作視頻，構建自動化標注流程，利用自回歸架構實現端到端手部動作預測，使模型在未見過的場景中具有強泛化能力。該方法顯著降低預訓練對機器人真機數據的依賴；結合少量真機數據或仿真數據后訓練，實現真機靈巧手高成功率、泛化的自主操作。團隊開源的模型支持不同本體、不同任務的微調，推動具身智能向高效、可擴展的方向演進，實現“從人類數據中涌現智能”的愿景。
圓桌對話環節，來自貝陪科技創始人兼 CEO 黃纓寧、阿爾法公社合伙人劉罡、影智科技產品負責人錢莊一同圍繞「AI 模型與終端形態的未來圖景」展開討論，由機器之心副主編張倩擔任主持人。

從左向右依次為：機器之心副主編張倩、貝陪科技創始人兼 CEO 黃纓寧、阿爾法公社合伙人劉罡、影智科技產品負責人錢莊
貝陪科技創始人兼 CEO 黃纓寧女士從可豆陪陪在兒童 AI 陪伴產品的實踐出發，深刻詮釋了具身智能的本質在于“物理存在”與真實世界交互的能力。她指出，傳統 AI 多依賴攝像頭采集數據后進行云端判別，而具身智能則通過機器人本體實現即時感知與反饋，形成閉環響應。她強調，未來 AI 不僅是工具，更是與兒童建立情感關系的“伙伴” ，因此產品必須兼顧技術智能性與心理友好性，尤其在兒童發展關鍵期，需深入拆解使用場景、尊重成長規律。其理念體現了從功能導向向關系建構的躍遷，推動 AI 向具備社會屬性的啟蒙角色演進。
阿爾法公社合伙人劉罡先生從早期投資視角系統剖析了具身智能的發展邏輯與趨勢。他認為，具身智能是具備物理載體的人工智能，核心在于實現對物理世界的主動感知與自主交互。相較于上一代判別式 AI ，當前技術更強調從被動識別到主動決策、從單模態處理到多模態融合等。他指出，新一代 AI 硬件產品，先不要關注“形” ，要先關注“神” 。拋開形態，哪些核心技術的攻克，能帶來 10 倍的增長變化，就容易使產品具備規?；芰?。作為 AI 硬件賽道最活躍的投資機構之一，阿爾法公社致力于支持具備前瞻視野和卓越領導力，能夠在市場中定義新品類、創造新規則的非凡創業者，推動 AI 與物理世界交匯的范式轉變。
影智科技產品負責人錢莊先生結合 AI 咖啡機器人的產業實踐，揭示了具身智能的技術驅動力與商業化路徑。他認為，2017 年以語音識別為代表的感官 AI 化是第一波浪潮，而當前大模型驅動的認知生成能力，則使機器具備類人思維與行動整合能力，真正實現“大腦+四肢”的協同。他觀察到， AI 領域正呈現新的“摩爾定律”——算力與算法日新月異，但關鍵挑戰在于如何將前沿技術轉化為大眾可感可用的服務。影智科技通過 AI+ 機器人打造全球領先的咖啡大師，正是將復雜技術封裝為自然交互體驗的典范，展現了具身智能從實驗室走向日常生活的現實圖景。
本次技術沙龍，不僅為行業搭建了開放協作的交流平臺，也是一次思想碰撞與智慧交融的行業活動。嘉賓們的真知灼見，從模型架構、數據閉環、硬件平臺到商業路徑，系統性地勾勒出“虛實共振”的演進脈絡，展現出 AI 從感知理解走向行動干預、從虛擬認知邁向物理交互的宏大趨勢。

【虛實共振：模型×終端技術沙龍圓滿舉辦】

推薦閱讀

上一篇：通過視覺安全提示與深度對齊實現大型視覺語言模型的安全對齊

下一篇：挖走多名AI工程師后 OpenAI又在從蘋果硬件團隊大量挖人