騰訊機器人要做什么、不做什么,張正友一次講清楚了|WAIC2025

騰訊機器人要做什么、不做什么,張正友一次講清楚了|WAIC2025

文章圖片

騰訊機器人要做什么、不做什么,張正友一次講清楚了|WAIC2025

文章圖片




騰訊一口氣發布3個具身模型 , 包括動態感知、規劃、感知行動聯合模型 , 分別對應人類的左腦、右腦和小腦 。


騰訊想要把模型和算力賣給機器人公司;


人類的雙足是為了適應復雜環境而進化 , 而今天的人居環境或許可以讓我們暢想不同于雙足機器人的其他形態;


具身智能的iPhone時刻或許還要三到五年 。


7月27日 , 騰訊在世界人工智能大會(WAIC2025)上發布了3個具身模型:多模態感知模型、規劃大模型以及感知行動聯合大模型 , 以及一個囊括了這3個具身模型和云計算能力的Tairos平臺 。 這些模型的發布 , 有望結束行業里機器人靠遙控才能行走的歷史 。
自2018年成立機器人實驗室Robotics X起 , 騰訊在機器人領域就時有產品形態消息傳出 , 先是2021年發布了首個名為Max的機器狗產品 , 然后是去年9月 , 騰訊又展示了一個叫「小五」的接近人形的機器人 , 它有著接近人的上半身 , 但下身是個有著4條腿的輪式結構 。
進入2025年以來 , 騰訊又投資了至少2家具身智能的機器人公司 , 包括3月領投智元機器人、6月參投宇樹科技 , 此前 , 騰訊還投資過上一代機器人公司樂聚機器人和優必選 。
包括京東、美團在內的互聯網大廠也都在布局具身智能和人形機器人 。 但7月27日的發布會表明 , 騰訊會以不一樣的方式加入具身智能賽道 。
騰訊首席科學家、騰訊Robotics X實驗室主任、福田實驗室主任張正友 。
7月27日的模型和Tairos平臺發布結束后 , 騰訊首席科學家、騰訊Robotics X實驗室主任、福田實驗室主任張正友接受了包括第一財經「新皮層」在內的采訪 。
這是騰訊首次對外闡述它設立機器人實驗室7年來的探索和認知 , 以及在騰訊的機器人戰略中 , 它想要在這一新終端設備中扮演什么角色——它想做的是機器人大腦 , 而不是本體 , 而且 , 它想把大腦以及算力賣給機器人公司 。無論它此前向外界展示過多少機器人硬件形態 , 那些都是騰訊機器人實驗室為探索理想的機器人形態制作的原型機 , 目標不是推向市場賣給用戶 。
機器人時代會有機器人的基礎設施、操作系統出現 , 騰訊似乎想要扮演這樣的角色 。 不過張正友認為 , 就目前階段而言 , 無論機器人的具身模型還是硬件形態 , 都還處在探索階段 , 他認為 , 完全類人的雙足、自然語言口語交互設計 , 并不是最優的 。 采訪中 , 他闡述了騰訊在機器人領域會做什么 , 以及不做什么 。
以下是張正友與包括第一財經「新皮層」在內的媒體采訪記錄 , 經編輯:


機器人公司負責本體 , 騰訊提供大腦
提問:跟其他競品比 , Tairos平臺的優勢和特點是什么?
張正友:一個是模塊化 , 每個廠家都可以選取它自己想要的模塊, 因為每個廠商可能有它自己的特長 , 它擅長的模塊 , 就不需要我們這個平臺了 。 比如有的廠商有感知模塊 , 但長程規劃做得不夠好 , 那就可以用我們的規劃模型 。
另一個特點是 , 我們這個平臺是比較完整的 , 包括左腦、右腦和小腦 , 廠商只需要很少量的數據(就能用得起來) 。

提問:Tairos平臺目前收到了多少合作需求?騰訊在這個方向上的節奏是怎樣的?
張正友:我們調研了全國的機器人廠家 , 不光是上海、華東地區 , 還有深圳、北京、西部地區的成都等 。 去年年底 , 我們開始做這個事(注:做開放平臺)之前 , 先認真調研了行業 , 差不多跑過六十幾家企業 , 發現中國大量的機器人公司其實很難同時在軟件和硬件層都做得很好 , 因為具身智能本身投入非常大 。
騰訊2022年發布的新一代機器狗Max 2.0 。
騰訊Robotics X機器人團隊成立已經超過7年了 , 調研發現 , 大家對我們做這個事(具身智能平臺)都非常歡迎 。 所以一開始 , 我們主動出擊去選取了一些高配合度的機器人企業 , 然后我們跟它們深度地結合去做一些case 。
我們上半年的想法就是先去找一些企業去打磨產品 , 這也是我們過去做產品的思路 , 1.0版本一定要去找幾個企業深入落地 。 到7月我們把平臺發布出來 , 以及參加這次展會 , 是處在一部分產品標準化了之后慢慢開始鋪量的階段 。
我們做事情的節奏就是穩扎穩打 , 今天發布了3個模型 , 還有仿真平臺 , 機器人公司已經可以把它們的機器人放到仿真器里試試看行不行 。 我們的模型既可以在真實機器人上運作 , 也可在虛擬環境用 。
提問:現階段重點還是模型能力?
張正友:模型能力還有仿真環境 , 這里面其實要解決的問題挺多的 。 比方說在操作智能里面 , 機器人對力的感知和觸覺感知是非常重要的 , 但這類數據的質量還沒有標準化 , 這類數據差不多要達到一毫米左右的空間分辨率 , 但目前仿真環境還不能很好地支持這一點 。
另外 , 每個模塊 , 無論感知、規劃、大腦、小腦、數據采集……每個環節都有很多需要提升的空間 。 從大的技術角度看 , 模型對3D的世界認知 , 動態世界包括物體材料等各方面如何建模 , 也就是世界模型 , 其實還屬于初步階段 。因為機器人的世界是要能夠在真實、虛擬空間里操作的 , 比如你拍張照 , 上面有個茶杯 , 你根據這個照片建立一個3D模型 , 看起來很真實 , 但機器人能不能根據這個3D模型把杯子抓起來 , 是個問題 。
大語言模型也能做一些規劃 , 但它是通過文本來理解世界 , 對3D世界的理解沒那么深 , 現實世界的很多東西用文字是描述不出來的 。 比方說動物沒有語言 , 但它還是能在3D世界活得很好 。 規劃不一定需要語言 , 沒有對3D世界的理解 , 就很難在運動中做規劃 。
提問:騰訊今天發布了3個模型 , 一個動態感知、一個規劃、一個感知行動聯合模型 , 哪個模型是更核心的?技術成熟度有沒有一個排序?跟同行比 , 騰訊在哪個模型上可以跟同行拉開代際差異?
張正友:這三個模型都需要 , 就像我們的左腦、右腦和小腦 , 三個必不可少 。 但如果每個模型你都要去開發 , 就需要很多算力、數據和各方面的資源 , 開發速度也是一個問題 。 我們的目的不是說要超越所有機器人公司的模型 , 而是提升一些公司的機器人智能 , 而且我們目前的模型是比較全的 。

騰訊意在取得具身智能前沿技術 , 而非商業化
提問:騰訊一向對商業化謹慎 , 為什么在具身智能上商業化積極?
張正友:騰訊Robotics X 2018年年初成立 , 那時候是沒有商業化目的的 。 那時候都找不到一個能夠做機器人的硬件廠家 。 所以我們必須要自己從頭去組建硬件 , 全部都要做 。
2023年下半年開始 , 整個行業有很大變化 , 因為GPT開始有很多機器人企業出來 。 我們現在的方向是通過跟第三方合作來幫助他們形成一個更完整的機器人產品 ,其實要區分產品化和商業化 , 商業化聽起來就是要賺錢 , 但我們不是以賺錢為目的的 , 我們希望我們的模型變成一個比較穩定的產品 , 來賦能機器人這個行業 。
提問:推出Tairos平臺后 , 騰訊自己的機器人產品還繼續開發嗎?
張正友:我們本來就沒有產品線 , 我們之前開發的機器人都是研究原型 , 無論是最早的機器狗Max、養老機器人小五 , 都是原型 , 都是為了研究和驗證 。 比如做養老機器人 , 是因為這是個很難的場景 , 里面的安全性、魯棒性挑戰都很大 。 做機器狗是為了探索地面不平的復雜環境 。 我們用比較難的場景驅動研發 , 目的不是把它們變成一個產品或者商業化 。
騰訊2024年展示的「養老機器人」小五 。
我們更大的目標是把機器人的智能水平和本體里的某些核心技術 , 比如數據傳感器技術評估 , 把這些能力繼續往前推進 。假如一開始你就停留在了Max上 , 后面就會沒有精力去做其他東西 。
提問:騰訊為什么不做雙足的人形機器人?
張正友:我不是對雙足人形機器人有什么仇恨 , 只是雙足人形這個形態已經在那里了 , 你不需要花更大精力去思考 , 只需要去控制它就行了 , 這是其中一個思路 。
另外一個思路是 , 我們人的雙足是在幾百萬年進化里產生的 , 是一個讓我們能夠在復雜環境里活下來的形態 , 但今天我們的人居環境已經跟以前不一樣 , 今天的人居環境里大部分都是平地 , 你沒必要操作效率很低的雙足 。 所以為什么我們去做Max , 這個機器狗是既有輪子又有腿 , 它不是為了仿生 , 而是要去想有沒有更好的形態能夠高效地在人居環境中行動 。我感興趣的是人居環境 , 不是去荒野 , 人居環境里是不是會有更高效、更理想、更佳的機器人形態 , 這是我們要去探索的 。
第三個原因是 , 假如我們以人形作為機器人的標準 , 我們人沒有進化出一個屏幕出來 , 但機器人如果有一個屏幕 , 它在交互信息時會非???。 用語言交互可能一分鐘智能講100個字 , 但用屏幕可能它一下子就可以在屏幕上呈現300個字 , 交互效率就會提升3倍 。 那你為什么不把現在的技術用到機器人上面?為什么一定要用語言去對話?
機器人的形態還有很多需要探索的 。
提問:騰訊已經在機器人領域探索了七八年 , 過程中也有很多階段性成果 , 但一直沒有像今天一樣做商業化或產品化 , 你們如何判斷一項技術是否可以商業化了?
張正友:現在這個時間點(開始產品化或商業化)可能跟整個行業的發展有比較大關系 , 8年以前 , 我們實驗室剛成立的時候 , 大家知道有哪家機器人公司?那個時候整個機器人行業都還處在上一個階段 , 主要做工業機器人的階段 。 當時我們實驗室做的很多事情都是非常超前的 。
不做硬件 , 是騰訊對合作機器人廠商的承諾 。
從2023年開始 , 整個機器人行業發生變化 , 市場出現了大量機器人公司 , 尤其是本體公司 , 我們發現我們之前很多東西能夠逐漸用得上 , 在這個時間點上 , 我們考慮把過去的一些成果給產品化 , 更多還是來自于行業的需求 。
但是我們不會放棄前沿技術的探索 , 還是會繼續往前推進 , 因為假如我們停留在眼前這個階段半年 , 感知模型、規劃模型或者感知行動模型就會落后 , 我們還要繼續往前推出更前沿的版本出來 。
提問:騰訊是否會通過投資的方式促進生態合作?
張正友:投資不是我管的 , 但是通過投資讓整個生態發展起來 , 這是最重要的 。
【騰訊機器人要做什么、不做什么,張正友一次講清楚了|WAIC2025】提問:距離具身智能的iPhone時刻預計還有多久?
張正友:這個很難估計 , 我估計可能還要三五年 。 我2018年做的就是一個10年規劃 。
提問:對于騰訊在機器人領域的角色 , 7年前你們在想機器人這個事的時候 , 跟今天的想法相似嗎?
張正友:那時候沒有(成為具身智能平臺)這樣的想法 , 那時候只是在考慮前沿技術的研究 。 就是說研究是不能被產品化去引導的 , 通過產品引導研究是做不成的 , 你的技術不可能成功 。

    推薦閱讀