家務機器人發展受阻：AI進化面臨的機器人挑戰

2026-04-08 芯片內存條 dram 美光

為什么機器人不能洗碗？其實它可以，但可能做得不如我們希望的那樣好或那樣便宜。我曾多次在機器人文章的開頭提到20世紀末的電視節目《杰森一家》，正如我們感嘆\"我們的飛行汽車在哪里？\"一樣，我們也在感嘆缺乏像動畫片中穿著圍裙的助手那樣的機器人管家或女傭，能夠承擔那些我們認為乏味和繁重的家務活。
但現在，隨著我們第一次真正擁有了大量此類技術，我們對其困難程度有了更清晰的認識。以下是我聽到的一些關于機器人AI局限性的情況，這些都很好地解釋了為什么洗碗自動化設備發展緩慢。
莫拉維克悖論與自然選擇的美妙
我最近第一次了解到這個概念，在研究為什么例如深藍在1997年擊敗了卡斯帕羅夫，但我們仍然沒有機器人來做家務。莫拉維克悖論指出，盡管計算機在純粹的智力方面可以完全超越我們，但在現實世界中做事情仍然是人類的領域。你只需稍微深入了解一下就會發現，像我們自己的馬文·明斯基這樣的知名人士自1980年代以來就熟悉這個概念，當時它被歸因于在卡內基梅隆大學工作的奧地利人漢斯·莫拉維克。
對我來說，背后的推理原因才是最迷人的。為什么？為什么人類如此擅長在現實空間中操縱物體，而機器人卻很難效仿？
答案是查爾斯·達爾文。或者準確地說，是自然選擇原理。這表明我們在很長時間內變得更擅長這些事情——比如說，幾百萬年。
所以我們有巨大的先發優勢。
你認為原始人類的靈巧性較差，還是這更多的是學術理論？
無論如何，莫拉維克悖論在很大程度上解釋了為什么僅僅依靠傳感器不足以讓機器人在現實世界中真正發揮作用。這項挑戰結合了精細運動技能和決策制定、物理學知識和直覺。至于物理學知識，其中很多可能是直覺性的、本能的、內置的——對我們來說。這不是很奇怪嗎？
機器人研究的更多問題
了解實用機器人學局限性的另一種方法是從大語言模型獲取列表。微軟Copilot在提示時簡單地提到了以下幾點：人形機器人的復雜性、市場挑戰、效率不足、技術限制，以及\"投資和耐心\" ，重新提出了ROI的難題，這個問題使許多外圍技術陷入困境，直到它們的時代再次到來。
ChatGPT的回答更為雄辯：
問：\"為什么機器人做家務如此困難？\"
答：\"因為家務是混亂感知+棘手操作+無盡邊緣情況的糟糕組合。機器人必須在變化的光線下識別雜物，圍繞寵物/孩子規劃安全動作，并操縱有彈性、光滑、起皺的東西（洗衣、海綿、垃圾袋）。家庭環境也不標準化。人類輕松泛化；機器人仍然在低成本下難以實現這種穩健性。 \"
是的，你必須處理垃圾袋。還有海綿。但我認為另一部分， \"圍繞寵物/孩子規劃安全動作\"是拼圖的更大一塊。
機器人專家的思考
然后還有來自最近一次TED演講的更多內容， Navid Aghasadeghi ，一位曾為波士頓動力和其他公司從事這些項目的人，指出了構建家務機器人的各種障礙。
\"我們沒有像《杰森一家》中羅西那樣的機器人，可以在房子里走來走去，洗碗、洗衣服，這樣你就可以花更多時間陪伴家人， \"Aghasadeghi說。 \"我應該說，我覺得我至少部分負責這種情況，因為我在機器人學領域工作了15年。 \"
在某些意義上，他爭辯說，這歸結為軟件和硬件的交匯點。
\"你必須讓軟件正確， \"Aghasadeghi補充說。 \"這就是智能。軟件必須告訴機器人如何解釋世界，它還必須告訴機器人采取什么動作序列來實際做一些有用的事情。一旦你有了這些，你顯然需要硬件。所以你需要能夠移動機器人關節的執行器，作為整體，可以移動機器人的整個身體，并讓機器人對環境施加力量并做有用的事情。 \"
然后，他繼續說，你需要大量傳感器來幫助機器人準確感知周圍的世界，你需要大規模地添加所有這些東西。
他也引用了莫拉維克悖論，但然后在最后添加了一個轉折：
\"我們能夠構建一個可以擊敗象棋大師的象棋引擎，而在此之前我們無法構建能夠簡單行走的機器人，或者無法構建能夠抓取不同大小物體、操縱它們并將物體堆疊在一起的機器人， \"他說。 \"這些是一個一兩歲的人類嬰兒很快學會做的事情，機器人長期以來一直在這方面失敗，互聯網上充滿了許多機器人失敗的視頻，直到現在。 \"
這里是關鍵轉折：
\"但事情即將發生變化……\"
進化階段
為了解釋， Aghasadeghi描述了機器人學的三個不同階段，直到今天。
第一個是一類簡單無腦移動的機器人。
\"這些是從位置A到位置B的機器人， \"Aghasadeghi說。 \"它們真的沒有感知能力，所以它們不能真正看到環境。它們只知道如何執行這項任務。因此，它們本質上是不安全的，只能在精確制造且一切都在正確位置的環境中操作。 \"
他識別的第二階段是\"規劃和感知\" ，機器人開始能夠看到和理解周圍的世界，并對多階段任務進行推理。
第三個是他稱為\"AI驅動的機器人\" ，機器人中的AI賦予它們一種不尋常的智能。
\"這些機器人由驅動你的ChatGPT和驅動你的圖像生成技術的同類AI提供動力，這些技術實際上能夠超越任務進行泛化， \"他說。 \"所以本質上，我們現在有了通用學習機器和通用學習算法……驅動你的ChatGPT的同一個大語言模型……現在被植入機器人大腦中。有人可以要求機器人清潔他們的廚房、關閉櫥柜和洗碗，機器人能夠首先理解語言，理解提示計劃，作為一系列動作，它必須做這些來完成任務，然后還要理解環境，作為其功能，決定這些任務序列。 \"
從世界中學習
【家務機器人發展受阻：AI進化面臨的機器人挑戰】\"這是否意味著機器人學已經解決？\"Aghasadeghi反問道。 \"答案是，還沒有，主要問題……是數據問題。 \"
簡而言之， Aghasadeghi建議，盡管ChatGPT可以使用網絡的廣泛覆蓋來學習事實，但現實世界的數據庫還沒有為機器人學習如何握住物體等技能提供支持。他補充說，研究人員正在努力研究\"遠程操作\"任務，為新一代機器人構建此類數據集。
\"這是否意味著我們明年就會有機器人四處奔走為我們做事？\"Aghasadeghi說。 \"我認為我們還沒有到那一步。這里的類比是，機器人現在就像幾年前的Palm Pilot一樣，如果你年齡足夠大還記得的話，機器人學需要iPhone所發生的革命，才能讓機器人學真正能夠圍繞在我們身邊……機器人學實際上可以作為人類的鏡子。因此，通過理解我們必須構建什么技術來增強人類，我們實際上對自己有了更好的理解，這就是我希望的未來，能夠構建……讓我們更加繁榮的技術。 \"
所有這些都是對機器人AI障礙的迷人探索，以及如何大膽自信地向前邁進的建議。總有一天，機器人會洗碗，這樣你就不必洗了。
Q&A
Q1：什么是莫拉維克悖論？它如何解釋機器人做家務的困難？
A：莫拉維克悖論指出，盡管計算機在純粹的智力方面可以完全超越人類，但在現實世界中做事情仍然是人類的領域。這個悖論解釋了為什么深藍能在1997年擊敗卡斯帕羅夫，但我們仍然沒有能夠勝任家務的機器人。人類經過幾百萬年的自然選擇進化，在現實世界的物體操縱方面具有巨大的先發優勢。
Q2：Navid Aghasadeghi提到的機器人學三個發展階段是什么？
A：第一階段是簡單無腦移動的機器人，只能從位置A到位置B ，沒有感知能力，只能在精確制造的環境中操作。第二階段是\"規劃和感知\"階段，機器人開始能夠看到和理解周圍世界，并對多階段任務進行推理。第三階段是\"AI驅動的機器人\" ，由類似ChatGPT的大語言模型驅動，具有通用學習能力。
Q3：為什么現在的機器人仍然不能很好地做家務？主要障礙是什么？
A：主要障礙是數據問題。雖然ChatGPT可以使用網絡的廣泛覆蓋來學習事實，但現實世界的數據庫還沒有為機器人學習如何握住物體等實際技能提供足夠支持。此外，家務涉及混亂感知、精細操作和無數邊緣情況的復雜組合，需要處理不標準化的家庭環境以及圍繞寵物和孩子的安全規劃。

推薦閱讀

上一篇：存儲市場競爭白熱化，大普微靠什么“出圈”？

下一篇：「豆包手機」為何能靠超級Agent火遍全網,我們聽聽AI學者們怎么說