如何定義具身智能“ChatGPT時刻”？宇樹科技王興興：機器人能在陌生場景中完成80%的任務

2025-11-05 21:13:35

每經記者｜朱成祥每經編輯｜黃博文

11月5日，在第八屆虹橋國際經濟論壇“人形機器人創新發展合作”分論壇上，宇樹科技創始人兼首席執行官王興興發表了主題演講。

王興興認為，今年機器人產業非常火熱。不過，他也指出，機器人大模型進展比想象中緩慢，還沒有達到臨界值。王興興表示，具身智能大模型、端到端技術的進步，總體上非常快，但是比他想象的稍微慢一點點。

對于什么才是具身智能發展的臨界點，即具身智能“ChatGPT時刻”，王興興認為，在陌生的場景中，給機器人發送語音或文字，若機器人能夠完成80%左右的任務。這便是突破性技術，基本可以達到“ChatGPT時刻”。

那么，為了早日實現“ChatGPT時刻”，更應該研究模型，還是收集更多的數據？王興興表示，目前在模型結構上大家做了很多嘗試，發現泛化能力不夠，還需要創新。大家也需要收集更大規模的數據、質量更好的數據。但目前，對數據的采集、對數據質量的評判還非常困難。

王興興提出，模型和數據需要相輔相成，而不是一股腦采集大量數據，或者一股腦把模型做大。

目前，具身智能主流模型有VLA（視頻語言動作）+RL（強化學習）模型和基于視頻生成的世界模型。王興興表示，前者可以用仿真環境做訓練，或者用真實場景做訓練，但泛化能力相對來說不是特別夠。因此，他更喜歡基于視頻生成的世界模型。

然而，王興興也認為，該模型面臨比較大的挑戰。因為基于視頻生成的世界模型對算力的需求非常大，需要的算力卡比較多，所以中小型人形機器人公司往往“跑不動”，反而是一些大型AI公司、互聯網公司視頻模型的資源更加豐富，做出該模型的概率更大。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

上一篇文章

華仁藥業：公司實際控制人變更事項目前尚處于籌劃過程中

下一篇文章

美國10月ADP就業人數增加4.2萬人，預期增加3萬人，前值減少3.2萬人

熱文精選

點擊排行

歡迎關注每日經濟新聞APP