人形機器人在迎來 GPT 時刻前 " 沿途下蛋 "
AI 一天,人間一年。不管是機器人,還是手機、電腦等硬件,都被 AI 重塑了一遍。AI 與機器人的合體產物——具身智能正在走進每個人的生活。
每個人都在等待具身智能的 GPT 時刻,可以想象一下具身智能 " 拎包入住 " 后的生活:家里有各種各樣的機器人,它們各司其職,把主人的生活照顧得面面俱到。有一個房間專門用來放大大的服務器,機器人產生的數據都在本地處理和存儲,數據不出域,保護主人的隱私。
在 11 月 1 日至 2 日舉行的機器人開發者生態全球性技術大會 ROSCon China2025 上,天工機器人、智元機器人、魔法原子、加速進化、縱深科技等 " 機器人天團 " 同臺競技。臺下觀點交鋒,在碰撞中還原了 2025 年人形機器人的希望與困惑:在具身智能的 GPT 時刻來臨之前,擁擠的機器人賽道到了艱難的 " 賽點 ",價格卷至底價,訂單從哪里來?面對數據和標準 " 雙缺 " 的境地,該走哪一條技術路徑?
年銷 2 萬臺,機器人價格卷至底價
去年,人形機器人全國銷量只有幾百臺。從行業預測來看,今年,銷量預估將達到 2 萬臺。即便量產剛剛開始,還沒有大規模上市銷售,但是人形機器人已經卷入了價格戰。
"目前價格逼近原材料成本,導致很多創新企業負擔過重,沒有機會去拓展新的應用場景。" 古月居聯合創始人顧強認為,現在人形機器人的發展階段,相當于手機剛開始出現的形態——大哥大,當時售價動輒上萬元,大部分人買不起這樣時髦的產品。規?;箝_始降價,即便會有賣得很貴的機器人,但也會出現可以進入千家萬戶的經濟型機器人。
人形機器人身處黎明,在制造行業,每 10000 名員工約擁有 400 臺機器人,整體滲透率只有 4% 左右。
深圳市機器人協會秘書長譚維佳表示,在規模效應沒有顯現之前,機器人進入每一個領域的二次開發和實施成本都特別高,如果高到沒有行業典型客戶愿意為此買單,機器人就不得不進入相對成熟的領域,從而陷入死卷價格的艱難階段。
" 很多機器人都在虧本擴展市場,幾乎已經是底價,這不利于行業發展。人形機器人能為我們的生活帶來附加價值,比如情緒價值,這是無法用純硬件成本來衡量的。" 國家地方共建具身智能機器人創新中心關節負責人、天工機器人負責人劉益彰認為。
沿途下蛋,等待具身智能的 GPT 時刻
今年 7 月,全球首家機器人 6S 店在深圳市龍崗區落地,匯集了上百款機器人,不僅可租可售,還可進行個性化定制。8 月,在北京亦莊,機器人 4S 店 Robot Mall 開業了。站在這一 4000 多平方米的空間里,仿佛走進了科幻世界,這里集合了全國 40 多家廠商的 50 多款機器人,包括天工、宇樹、優必選等,堪稱 " 具身智能天團 "。
"近期,機器人 4S 店會像汽車 4S 店一樣慢慢普及,在商場里逛街就能看到越來越多專門售賣機器人的店鋪。未來人形機器人很有可能比人類還要多。" 劉益彰表示。
" 在消費者關注買不買得起之前,會先考慮有沒有用。" 國家地方共建人形機器人創新中心感知與自主系統技術專家朱華章認為,人形機器人還在 " 散裝 " 階段,功夫機器人只會打功夫,后空翻機器人只會后空翻,疊衣服機器人只負責疊衣服,大語言模型被困在揚聲器內與人對話,機器人們還不能勝任 " 保姆 " 這類復雜工作,幫助人類處理繁重的工作。
一直以來,居家養老陪護被認為是人形機器人的殺手級場景,可能在 10 年以內會實現。
當下的機器人訂單在哪里?在劉益彰看來,目前最熱賣的機器人集中于科研、教育和二次開發等場景。接下來,最有可能規模應用的是巡檢導覽、工廠搬運等場景,特別是幫助人類完成危險的工作。
落地場景將直接影響機器人的形態,回到行業的普遍問題:人形是不是必選項?
人形機器人來到人類的生存環境,可以拎包入住,我們不需要為它們搭建特定軌道或運動場景。比如,在室外巡檢時,雙足行走的機器人的地形通過能力更強,輪式底盤容易在沙石地面上打滑,也不能爬樓梯。
" 在具身智能的 GPT 時刻到來之前,也有‘沿途下蛋’創造商業價值的可能性。" 在深圳市機器人協會秘書長譚維佳看來,商業化落地需要產業鏈各方合力推動的,比如場景服務的系統集成商、場景所有方,才最了解這個場景的 know-how(技術訣竅),而不是靠機器人整機開發廠商把所有落地工作都做了。
路徑之爭,爆火的 VLA 困于數據與標準
人形機器人馬拉松、格斗賽,今年各地紛紛組織機器人大賽,倒地不起、現場噴霧降溫等故障頻出,暴露出負責控制的小腦和負責感知決策的大腦能力不足的問題。
如何讓人形機器人更強更聰明?
目前主要有兩條路徑之爭,一條是大量預采集數據訓練的 VLA(視覺—語言—動作)路線,另一條是小樣本高泛化的路徑。
"VLA 是基礎,是讓機器人動起來的第一步,但可能不能依靠它來解決所有的問題,未來會整合更多模態的信息。" 非夕科技創新業務技術負責人施豐鳴說道,就像一個只有視覺和規劃能力,但沒有觸覺或肌肉微調能力的人,在執行任務的時候可能會把螺絲擰壞,把杯子捏壞,或推倒物體。也就是說,純靠 VLA,可能無法實現精細操作,泛化性有限。
VLA 是一條高度依賴數據的路線,現在全國各地正在建立機器人數采中心,大多靠真人來訓練機器人,所以這種數據采集方式需要投入大量成本,各家、各行業之間不愿意共享,甚至缺乏數據采集的標準。
地瓜機器人具身負責人何泳澔提到,VLA 的泛化能力與通用性有限,跟智能駕駛相比,機器人行業的數據規模較小,而且硬件構型百花齊放,沒有標準,一定程度上為數據的收集帶來很大困難。
機器人行業還處于標準制定期,各地正在積極解決數據不足和標準缺乏的問題。
在今年 9 月舉行的 2025 浦江創新論壇上," 浦江 X 具身智能標準化數據集平臺(穹頂 -DOME)" 正式落地,實現了數據采集、治理、訓練、驗證的全鏈路閉環,率先完成多模態數據的標準化生產、可信治理與高效流通,提供統一接口與質量基準,為產業鏈上下游提供統一的數據語言,為全球產業破解 " 技術突破與產業落地脫節 " 難題提供了上海方案。
劉益彰所在的北京國地中心正在牽頭制定機器人的工藝流程、測試標準、性能標準與關鍵模組接口標準等。
譚維佳也提到,深圳作為全球硬件之都,將基于產業鏈彈性優勢,形成硬件開發和制造的范式,幫助全球開發者驗證并落地。
最后回到終極問題,當人形機器人真正進入我們的生活,它會不會擠壓人類的生存空間?
"新的時代應該接納先進的生產工具。AI 和機器人淘汰的不是人類,而是不會用 AI、不會操控機器人的人類。" 朱華章樂觀地展望道。
來源:IT時報
