“機器人行業缺的是底層工具創新”，對話新加坡國立大學石凡

2026-04-11 上海市腦機接口

AI、機器人和未來。

石凡與機器人的結緣，始于一個 AI 還遠非熱詞的年代。 2012 年，他還在北京大學讀本科時，對無人駕駛產生濃厚興趣。彼時，谷歌的自動駕駛項目剛剛冒頭。 “那時候機器人整體包括 AI 還是一個非常不火的話題， ”他回憶道， “大多數人都不感興趣。 ”

之后十多年，他的科研軌跡一路跨越北京、東京、蘇黎世和新加坡。從北京大學初識無人駕駛的萌芽時代，到東京大學親歷上一個人形機器人的黃金時期；從蘇黎世聯邦理工學院感受產學研結合的務實風格，再到新加坡國立大學開啟獨立帶團隊的學術生涯。石凡的學術軌跡，幾乎與過去十余年全球機器人技術的發展浪潮同頻共振。

如今，石凡是新加坡國立大學的助理教授，也是 Human-Centered Robotic Lab（HcRL ，以人為本機器人實驗室）的負責人，他獲得了 NUS 校長青年教授獎的支持，其實驗室也先后得到 NVIDIA Academic Grant Award、Google 等科技公司以及新加坡教育部等政府機構的資助。

在采訪中，他的語速平和，思路清晰，偶爾會因一個久未使用的中文詞匯稍作停頓，但話語間流淌的，是跨越了中國、日本、瑞士和新加坡四國科研體系后沉淀下的獨特視角與冷靜思考。

“科研須解決痛點，也必須大膽”

問芯：親歷四個不同的科研體系和文化氛圍，你感受到最大的差異是什么？

石凡：從我的經驗來看，即便在同一個國家內部，不同機構之間往往也存在明顯差異。哪怕是在同一所大學中，不同的實驗室也會有完全不同的文化取向和擅長方向。因此，我的總結難免帶有一定的主觀性。

整體來說，日本科研文化非常強調“創新” ，尤其重視某項工作是否能夠被稱為“世界首次” 。這種追求不僅體現在科研領域，在各類科技活動和展覽中也常常會強調“世界第一次”的概念。

瑞士則呈現出另一種特點：同樣重視創新，但更加注重務實。在瑞士的科研環境中，可以看到許多實驗室與產業緊密關聯，孵化出大量成功的機器人創業公司。我認為，這與瑞士長期以來對產學研鏈條的建設密不可分，這種體系并非一朝一夕建立，而是幾代研究者持續努力的結果。

問芯：你現在做 PI ，覺得自己的風格會更像哪一個科研體系？

石凡：我個人的科研風格更像是幾種體系的綜合體，這主要是因為不同年代有不同的機會與特點。早些年， AI 和機器人并不是熱門領域，那時從事相關研究的人大多仍在學術界，圈子相對封閉。而如今，工業界在這一領域的參與度顯著提高，很多企業甚至擁有比學術界更充足的資源，也深度介入研究前沿。

在不同階段，科研者面臨的機遇與挑戰自然也不同。以當下的時代背景來看，我自己的觀點是：科研必須做到足夠“新” ，同時又必須具有實際意義。如果研究內容不夠突破、不夠大膽，在工業界去推動就好了，在大學里做下去的意義并不大。因為一旦方向趨于保守，企業憑借更強的人力、資金與算力，很容易在同樣的軌道上跑得更快，大學在這樣的競爭中就無法體現自身價值。

但反過來，單純為了“新”而“新”也沒有意義。過去機器人離日常生活較遠，做一些“純創新”的嘗試問題不大；但如今機器人和AI 與現實世界的連接越來越緊密，如果只追求形式上的新穎，就可能偏離更重要的目標，甚至顯得有些舍本逐末——熱鬧一時，卻缺乏長期價值。

問芯：從你的求學經歷中可以看出，你的成長軌跡恰好跨越了機器人和 AI 行業發展的關鍵階段。基于這樣的視角，你怎么看待過去十余年間整個機器人行業所經歷的變化？在這些變化中，哪些突破讓你感到最為振奮？

石凡：我個人經歷的行業發展跨度大約是從 2012 年至今，十多年時間。相較于那些見證了三十年起伏的前輩，這段時間并不算長，但其中的變化依然非常鮮明。

在我看來，首先也是最重要的變化，不是 AI 本身，而是更便宜、更好用的硬件大量涌現。其中相當一部分要歸功于中國企業的努力。以宇樹科技為例，它讓四足機器人平臺變得價格可控、性能可靠；再往前看，大疆及其衍生出來的完整產業鏈，也讓全球重新認識了“中國制造”——不只是便宜，而是好用且價格合理。

硬件民主化之后，能進入機器人研究的人立即變多了。如今，無論是機器人專業的學生，還是環境科學、建筑、化學化工等完全不同學科的研究者，都可以直接購買成熟平臺，開展各自的研究。

除了硬件，軟件的變化同樣重要，而其中最核心的是開源社區的興起。最早的例子是機器人操作系統（ROS）。在我們讀博士時期，幾乎所有機器人都運行在 ROS 上，它為研究者提供了成熟的底層軟件框架，大幅減少重復造輪子的成本，讓不同的機器人平臺能夠迅速適配和開發，從而極大提高科研效率。

近年來， AI 模型和學習方法的開源趨勢進一步加速了整個領域的研發節奏。開源不僅讓工具更加普及，也讓最新成果可以被迅速復用與擴展，使機器人研究的推進速度相比十年前不可同日而語。

“大家都拿同一把錘子，很難敲出不一樣的東西”
問芯：作為研究者，你如何看待當前由資本、媒體以及大模型開源等共同推動的這股機器人熱？它為行業帶來的是實質性的推動，還是在某些方面可能也會引發一定的浮躁？

石凡：從整體和宏觀角度來看，當前機器人行業受到更多關注、大量資金投入，并且吸引越來越多優秀的年輕人加入，我認為對這個領域無疑是一件好事。

當然也確實存在一定的泡沫現象。實際上，不少資深的 AI 從業者也在公開場合提醒大家警惕潛在的泡沫，這種討論在業內是存在的。

對我個人而言，衡量這一波熱度究竟是利大于弊，還是反之，其核心標準仍然是：我們所做的事情是否真正解決了實際需求？以及在解決需求的過程中，是否盡量減少了不必要的負外部性。從更本質的角度說，就是這些技術的發展能否讓人類整體獲得更大的幸福感。我更傾向于以此作為判斷依據。

問芯：回到你實驗室的研究，你希望去解決怎樣的需求？

石凡：我們實驗室名為 Human-Centered Robotics Lab ，中文是“以人為本的機器人實驗室” 。之所以采用這個名字，是因為背后有我們堅守的理念：我們希望機器人能夠真正改善人類的生活，為人帶來更高的幸福感，而不是只是為了競爭更低的用工成本服務于更大的資本利益，從而忽視人的感受加劇不平等。

從研究方法上講，我們并不傾向于做所謂的增量式的小改進。例如別人已經實現了 A ，我們不希望只是把它擴展到 A 的 1.1 或 1.2 。更感興趣的是那些突破性成果：以往大家認為從 A 推到 B 是不可能的，而我們希望通過團隊的努力、創造力和技術積累，搭建出通向 B 的“梯子” ，讓原本不可行的事情變得可能。

同時，我們也希望這些突破不僅有科學意義，更能對機器人學本身，甚至對人類社會，帶來實質性的正向推動。

問芯：能否分享一下實驗室在 2025 年的成果？

石凡：我們確實在過去一年里取得了很多令人振奮的進展，但由于部分成果尚未正式發表，目前還不便詳細公開。不過從整體上講，我們的核心目標依然延續了剛才提到的理念：希望推動一些更大、更本質層面的創新。

那么，這類創新從何而來？創新絕不可能“無米之炊” 。如果希望在應用層面實現重大突破，我們非常堅定地認為，必須首先在底層技術上有所創新。以機器人為例，如果所有人共享同一套底層工具——使用同樣的模擬器、同樣的平臺、同樣的訓練和控制框架——那么在上層要做出真正顛覆性的創新幾乎是不可能的。大家手里握著的都是同一把“錘子” ，自然難以敲出完全不同的成果。

因此，在 2025 年，我們將主要精力投入到底層的關鍵技術突破上。這些成果大多來自實驗室的博士生和博后，他們完成了許多非常出色、也令人激動的工作。基于我們一直堅持的理念——只有先把底層工具煥新，構建出更強大、更高效的基礎設施，才能在此之上產生真正的突破性創新，甚至可能改變大家對于機器人研究的一些基本認知。

問芯：具體指哪些方面？

石凡：關于目前可以公開的進展，我可以簡單介紹一下。今年我們在 SIGGRAPH 2025 以及多個相關研討會上發表了一系列成果，主要集中在仿真——也就是機器人模擬器——這一底層領域。我們實驗室的博士后和博士羅思源和曾子秋等同學在這方面取得了非常重要的突破，尤其是在可變形物體模擬這一長期具有挑戰性的方向上。

我們的最新成果是一款可變形物體模擬器，它在性能和精度上都有非常顯著的提升。這一突破性的底層能力，為我們在安全學習、魯棒控制等上層方向開展更具差異化的研究奠定了堅實基礎，也使得我們在某些方向上具備了短期內難以被復制的先發優勢。隨著其他尚未發布的工作逐步對外公開，我相信在明年初，大家會看到更多能夠支撐上層創新的新成果。

我們相信，這類底層技術的創新將極大推動上層研究的進展，使研究者能夠以全新的視角理解和處理復雜的交互場景，也為未來可能的應用打開更多可能性。

為什么要讓機器人“故意出錯”？
問芯：在之前的研究里，你用強化學習生成對抗性攻擊，讓機器人故意出錯。為什么要做這樣一件事？

石凡：如果結合當時的行業背景來看，在 2019 到 2024 年期間，隨著 ETH 、NVIDIA 等機構的推動，越來越多的工業界團隊開始意識到強化學習對于機器人控制的重要性——無論是四足機器人，還是人形機器人。此后，不少大型公司開始采用強化學習訓練機器人，甚至將強化學習生成的控制器直接作為可商用機器人的核心組件。

換句話說，工業界在那一階段已經全面擁抱了學術界在強化學習方面的研究成果。那么在這種情況下，學術界應該做什么？從我的角度來說，既然工業界已經在積極吸收和使用現有的學術成果，那么學術界就應該提前思考：工業界的下一步需求是什么？

我們當然可以繼續把強化學習的性能推得更高一些，但如果只是延續已有路線，其邊際收益對學術界本身可能并不大，也難以真正為產業創造下一階段的價值。

在與許多工業界同事交流后，我們觀察到一個普遍的擔憂：傳統控制方法可解釋性強，模型結構透明，因此在真實機器人上部署時更容易讓工程師“放心”；但強化學習控制器本質上是大型神經網絡，是典型的“黑箱” ，即使在可控環境下測試表現良好，也難以保證在真實環境或規?；渴鹬胁粫霈F意料之外的問題。

因此，在我看來，學術界此時更應承擔的角色，是為工業界提供一套方法和工具，幫助他們理解、分析并評估這些“黑箱控制器”的安全性，包括識別其中可能存在的潛在風險和漏洞。

如果我們能系統性地發現并揭示這些風險，就能為這些強化學習控制器在真實世界中的大規模產品化部署提供重要的參考和保障。這正是我們當時開展對抗性攻擊研究的重要動機所在。

問芯：汽車行業有碰撞測試，隨著機器人行業的快速發展，你認為機器人在走向市場之前，也需要一套類似的、強制性的壓力測試標準嗎？

石凡：我認為答案是肯定的——機器人行業未來一定會需要一套系統化的安全測試與評估機制，而且其重要性會越來越高。實際上，很多研究者已經意識到，這件事的難度甚至不亞于提升機器人的智能水平本身。

從橫向比較來看，最早進入產品化階段的相關機械系統是無人駕駛汽車。盡管發展多年，無人駕駛至今仍需在大量極端場景上投入巨量的真實道路測試，以確保其安全性。因此，無人駕駛為我們提供了一個重要參照：它更接近實際落地的形態，而即便如此，其安全評估仍然是一項極其復雜且高成本的工程。

相比之下，未來可能進入千家萬戶的具身智能機器人所面臨的環境復雜度會更高。在駕駛場景中，車輛的行為受到道路結構與交通規則的強約束，這在某種程度上縮小了系統的搜索空間，也降低了決策難度。

但家庭服務機器人則完全不同。它可以在家中自由移動，理論上能夠到達任何一個角落；它的手也可能接觸到任何一種物體。這樣的開放環境意味著：任務空間更大、交互情況更不可預測，系統的評估復雜度自然顯著提升。

換言之，機器人的安全評估本身將比提升智能能力更具挑戰。雖然已經有一些具有責任感的研究團隊開始在這方面投入努力，但整體而言，行業普遍認為：這是一個極其困難、充滿挑戰的問題，仍需要長期、跨領域的深入研究。

問芯：我們最終能否實現一個絕對安全的機器人？

石凡：我認為首先必須承認，實現絕對安全本身就是一項極具挑戰性的任務。其次，目前業內對“安全”這個概念的定義其實并不完全統一。原因在于，安全往往不是一個簡單的零與一、非黑即白的判斷。

舉例來說，一個機器人可能會犯錯，例如不小心把一杯水打翻，甚至將玻璃杯摔碎。但更關鍵的是：它是否具備從不安全狀態中恢復的能力？也就是說，它能否及時清理現場、移除潛在危險，并將環境重新恢復到安全狀態。很多時候，這類能力本身也是安全體系的重要組成部分。
【“機器人行業缺的是底層工具創新”，對話新加坡國立大學石凡】
這些問題都需要進一步探討，無論是研究者、產業界，還是未來可能涉及監管的相關機構，都需要共同參與，推動建立更清晰、更可操作的安全標準。

但無論標準如何演進，有一點應當是最基本的原則：機器人在任何情況下都不能對人類造成傷害。

問芯：所以還是存在一個可接受的風險范圍。

石凡：是的，從本質上講，安全是一個相對概念，而非絕對概念，因此本身就極為復雜。如何定義“安全” ，在不同場景下會有完全不同的答案。

以工業機器人為例，由于其任務高度結構化且空間相對封閉，安全標準往往更容易界定。例如給機器人設立安全柵欄、規定人員不得進入作業區等，這些都是可量化、可執行的規則。

但對于能夠在家庭或公共空間自由移動的服務型機器人來說，情況截然不同。這類機器人需要在開放環境中行動，并且常常需要與人進行直接交互。在這樣的場景里，安全的邊界更為模糊，評估難度也顯著增加。

目前行業內已經存在一些如 ISO 等組織制定的相關標準，但我也了解到有越來越多的新標準正在制定過程中。我相信未來這些標準會變得更加完善，在保障安全的前提下，幫助機器人以更智能、更可靠的方式為人類服務。

人形的價值在上半身，腿要看場景
問芯：最近很多科技公司都在談通用機器人，從研究者的視角，你認為真正的通用是否可行？技術和商業上分別需要跨過哪些門檻？

石凡：我認為通用機器人本身是一個非常重要的方向。從整個行業的發展來看，機器人的核心價值就是在于能否真正為人類發揮作用、提供幫助。傳統的專用機器人在許多任務上已經發揮得相當成熟。例如在工廠中，很多機器人只負責執行某個固定的工序或任務，如搬運、焊接、擰緊等。在這些場景里，專用機器人已經把可發揮的價值挖掘得比較充分，這也意味著無論是研究還是產業應用，新的創新機會已經越來越少。

因此，下一步更需要解決的是通用性的問題。尤其是通用機器人作為一種成本較高的設備，只有具備足夠廣泛的用途，才能真正被家庭或商業場景接受。從這個意義上說，無論是完全通用還是有限通用，都是一個非常重要的方向。

但與此同時，實現怎樣的通用，其實是非常棘手的問題。從商業角度看，這將極大考驗參與者對場景、需求和用戶價值的理解與判斷。從技術角度來看，目前的能力距離“像人一樣通用”仍有相當大的差距，短期內也很難看到實現這一目標的可能性。

因此，現實意義上的通用更可能是一種“在限定任務空間內的多能手”——即將多個專用能力有效整合，在一定范圍內實現看似通用的效果。

此外，由于機器人本體結構的限制，要實現真正“人類水平”的通用仍然非常困難。例如，人類的肌肉對應于機器人的自由度和電機數量，目前的機器人在這方面遠少于人類；在人類豐富的感官系統對應的傳感器數量和類型上，機器人同樣存在巨大差距。

問芯：現在很多場景下都在探索人形機器人，你覺得這在未來是一個比較合理的形態嗎？

石凡：這確實是當前行業內頗具爭議的話題。整體而言，我對人形機器人持相對樂觀的態度，尤其是對“人形的上半身”——也就是雙臂結構——更加認可。

原因在于，大量研究者已經發現，許多現實任務在只有單臂的情況下是存在明顯局限性的。設想讓一個人只用一只手完成日常生活中的許多動作，會變得非常困難。因此，具備雙臂的人形上半身結構，正越來越多地被認為是許多任務場景中的“必要條件” 。從這個意義上說，我認為人形機器人的上半身結構是非常重要的。

至于人形的下半身，也就是雙腿結構，我覺得更需要視具體應用場景而定。例如在人類社會中，有些老年人，或使用輪椅的人，雖然沒有雙腿的支持，但依然能夠在生活中完成大量任務。當然，他們也會在某些場景中遇到限制。因此，機器人是否需要雙腿，很大程度上取決于任務環境和目標場景的需求。

同時，我也并不排斥專用機器人。核心標準始終是：只要機器人能在某個場景中發揮作用、改善人的生活，就是好的機器人。例如掃地機器人，它只是一個小圓盤，卻能把家里的衛生打理得非常好，這也是一種成功的人機共生形態。

問芯：你比較看好機器人在哪些場景的應用？

石凡：換個角度來說，如果以 2025 年為例，觀察這一年里出現的一些亮眼機器人公司或應用，其中給我留下最深印象的，是一家名為 Dyna Robotics 的團隊。他們最初的公開 Demo 是“機器人疊衣服” 。這個系統幾乎可以對任意一件衣服進行處理——無論是 T 恤、毛衣，還是結構更復雜的服飾，至少有一半以上的衣物都能被疊得相當不錯。

在今年韓國舉行的 CoRL 大會上，他們進行了現場演示。觀眾可以隨手從包里拿出一件衣服、甚至直接從家里帶來隨身衣物，隨機丟給機器人。對于機器人來說，這是難度極高的挑戰——完全陌生的物品、來源于世界各地、材質和形狀各不相同，但系統仍能在大多數情況下完成質量可接受的疊衣任務。這個場景給現場很多研究者帶來了強烈震撼。

這也正是我認為值得關注的方向：疊衣服只是一個切入點，它代表的是機器人在家居場景中對于復雜物體操作能力的提升。如果這種能力能夠逐步延伸到更多任務，例如酒店后勤、商業清潔，甚至某些工廠的柔性操作環節，那么機器人就能幫助人類處理大量重復、耗時或不受歡迎的工作，從而真正釋放勞動力價值。

問芯：無論落地在哪些場景，從科研到真正的產品始終有一道巨大的鴻溝。你覺得最大的鴻溝在哪里？

石凡：總體來看，機器人真正實現落地，軟硬件缺一不可。即便擁有非常優秀的 AI 或軟件能力，如果沒有相應的硬件承載，許多方案都無法在現實中發揮作用；反之，只有硬件而缺乏匹配的軟件與智能層，也同樣難以形成有意義的產品。在機器人領域尤其如此，因為任何實際應用都必須依賴實體硬件作為基礎。

從模式上看，我認為存在兩種可行路徑。

第一種是類似“蘋果模式”的做法：同時把硬件和軟件做到極致，并進行深度整合，從而形成一個體驗閉環、體系完備的產品。

第二種則更像“安卓模式”：先把硬件做好，然后搭建完整的生態系統，向外部開放接口，包括底層控制接口，讓更多開發者共同參與，利用更廣泛的智慧把這個生態推向成熟。通過開放平臺的方式擴大應用空間，從而與行業共同把整件事情做大。

目前在行業中這兩種模式都能看到。例如在人形機器人領域，有些企業選擇大規模銷售硬件平臺，如宇樹；也有一些公司選擇完全打包軟硬件，以整體系統的形式輸出，例如美國的 1X 等企業。

參考資料：
1.https://nus-hcrl.github.io/

推薦閱讀

上一篇：全面對標蘋果，谷歌準備為安卓開發“通用剪貼板”

下一篇：推出首個短視頻帶貨激勵，微信電商認命了？