星動紀元創始人、清華大學交叉信息研究院助理教授 陳建宇
關于究竟該發展 VLA 模型,還是深耕世界模型,如今似乎已有了新的判斷方向。
8 月 12 日消息,2025 世界機器人大會(WRC)主論壇演講上,星動紀元創始人、清華大學交叉信息研究院助理教授陳建宇表示,通用人形機器人一定是未來 AI 技術的一個趨勢。由于機器人有更強大、更通用的移動和操作能力,未來必將給人類生產力和社會服務能力帶來革新。
" 我們如何構建一個通用人形機器人?最短的路徑就是直接向人學習,因為人類是現實世界中唯一存在的通用的具身智能體。" 陳建宇表示,通用大腦、通用本體相融合,使得我們能夠找到一個構建通用人形機器人的范式。
會后媒體群訪中,陳建宇對筆者表示,VLA 被認為是一個更廣泛的概念,只要機器人用到視覺感知、語言、行為動作,我們都認為是一個 VLA 模型。因此,從整個意義上來說,世界模型是 VLA 技術的一個路徑。
" 我們認為,下一個范式的 VLA,更傾向于說更廣義上的 VLA 模型,不局限于某一個 VLA 模型架構,只要是端到端的模型,它能夠跟人進行語言交互、視覺感知,可以在物理世界里面干活,它就是一個 VLA 的模型。只不過,世界模型會在現有狹義 VLA 模型范式上進一步通過技術(包括 RL 強化學習等),改進它的精細化操作、泛化、認知能力等。" 陳建宇稱。
對于數據和模型目前孰重孰輕,陳建宇表示,相比數據瓶頸,現階段大家應該更關注模型。
" 未來迭代模型需要的數據絕對數量肯定越來越大,但我強調的是數據利用效率,在同樣的情況下,只需要更少的數據,讓數據利用效率更高,但數據量仍需要很大,因為現在數據量還是不夠。" 陳建宇稱,大家關注數據,其實更上層是模型,如果只關注一個的話,應該先關注模型。
陳建宇強調,未來五年,可能是家用機器人爆發的時間點。" 掃地機器人等產品已逐步進入家庭。未來幾年將很快出現相對簡單形態的機器人進入到家庭里面,也可能有少部分的高凈值人士家庭,會直接用到比較通用的人形機器人以嘗鮮使用。"
據悉,星動紀元成立于 2023 年 8 月,最初是清華大學交叉信息研究院的孵化項目。從成立起,星動紀元便堅持軟硬一體的技術路線,致力于打造物理世界中的通用智能體,讓 AI 從思考走向行動,實現機器人賦能千行百業、走進千家萬戶的愿景。星動紀元創始人陳建宇,目前還是上海期智研究院 PI,清華大學交叉信息研究院助理教授。
融資層面,在成立不到兩年里,星動紀元已完成 3 輪融資,背后集結了眾多知名投資方,包括聯想創投、海爾創投、華映資本等產業資本與專業投資機構。今年 7 月初,公司宣布完成近 5 億元 A 輪融資,由鼎暉 VGC 和海爾資本聯合領投。
產品層面,星動紀元主要在通用大腦、通用本體等多個方面進行具身智能機器人的研發和落地。
其中,通用大腦側,星動紀元提出融合理解與生成的 VLA 模型 ERA-42,將視覺、理解、預測、行動等功能統一到一個端到端的模型中,目前星動紀元機器人產品,通過語音命令即可完成上百種復雜操作,包括柔性物品分揀、掃碼,使用螺釘槍、移液器等。此外,星動紀元還構建了物理世界 AI" 模型 - 本體 - 場景數據 ",進一步提升具身智能機器人的交互能力。
通用本體側,星動紀元自研人形機器人在性能上逼近人類身體,并作為與物理世界交互的 " 通用接口 "。其中,星動 L7 是一款全尺寸雙足人形機器人,采用模塊化設計思路,能更靈活地適配不同場景的落地需求,尤其是物流領域的分揀、掃碼等任務,通過自研端到端的 VLA 模型直接控制機器人精準完成操作;另一款產品星動 Q5,是公司面向服務業打造的人形機器人。這讓它在生活化服務場景中更具優勢,比如完成遞水等日常操作,或是實現高度擬人化的交互溝通。目前星動 Q5 已在零售門店等場景中推進落地探索。
此外,星動紀元還自研靈巧手 XHand 1,具備 12 個主動自由度和內置的觸覺傳感器,能夠實現高度精確地控制,能完成上千個靈巧動作。
陳建宇認為,人形機器人是具身智能發展的終極形態。這是因為人形機器人不僅在數據獲取方面有顯著優勢,能夠直接從人類行為中更自然地學習,還具備高效的雙足移動與雙手操作能力,極大地擴展了機器人的應用邊界。星動紀元正通過結合具身智能模型與創新硬件,逐步實現人形機器人的通用性與實用性。
對于為何難以實現端到端 VLA,陳建宇表示,主要有兩點:一是世界模型需要融入到生成式模型當中,實現對未來的預測、認知和生成式行為;二是 RL,即 VLA 的強化學習、運動控制模型,提升機器人的通用泛化能力,這將成為通用范式。
" 王興興總這邊提到的,其實也是我們想說的。世界模型這一板塊,其實我們做出來了全球首個融合世界模型和生成式模型工作,去年就陸續發布好幾篇論文,在業內也形成比較多的討論。所以,現在已經有不少同行開始關注合作(世界模型)這塊,我們認為,未來很快就會形成一個新的共識。" 陳建宇表示,目前星動紀元已開源了全球第一個做出運控強化學習的算法以及 VLA 生成式模型,后續公司還會做開源,因為具身智能還是需要整個生態共同努力和繁榮,實現更多突破。
對于商業化,陳建宇曾表示,星動紀元將優先聚焦 B 端場景落地,無論是工業制造領域的自動化作業,還是服務業中的場景化服務,都會以 B 端市場為切入點,逐步滲透并驗證商業價值。
今天群訪中,陳建宇補充稱,在一些真實工業場景中,目前智能機器人已經達到人類 70% 的效率,明年能達到 90% 左右。未來是軟件和硬件的打磨階段和過程,也是發揮端到端模型的優勢——能實時反饋、實時控制。" 假以時日,我相信(機器人)能達到人類的水平。"
陳建宇近期還表示,具身智能行業尚未出現所謂的 " 泡沫 "。在他看來,行業估值規模未達到智能汽車同等量級,原因在于周期更長且尚未找到核心規模化商業應用的閉環,未來一旦頭部企業(如特斯拉等)實現規模化商業落地,行業有可能將迎來第二波大的資本爆發。
陳建宇強調,人形機器人的 " 殺手級 " 應用場景,最終還是要進入家庭。但是前期,大家需要在一些企業(B)端場景里面落地先行,并且磨煉機器人數據積累等整套技術,讓機器人產業飛輪先轉起來。
" 但人形機器人最終殺手級的應用,我認為一定在家庭里面。" 陳建宇稱。
來源:鈦媒體