咨詢電話
021-80392549

5月29日,自變量機器人發布全球首個具備“事件級預測能力”的世界模型WALL-WM,這意味著具身智能開始跳出沿用數十年的“按時間均勻采樣”傳統范式,首次將現實中的“事件”作為世界模型的基本思考單位。
過去三年,VLA(視覺—語言—動作)架構是全球具身智能領域的絕對主流,但隨著機器人真機部署規模擴大,VLA的結構性缺陷日益凸顯。自變量團隊指出,文本、視覺、動作本質上不在同一流形,直接聯合優化會嚴重損耗視頻基礎模型的先驗能力。
此次WALL-WM的突破在于,它在世界模型基礎上徹底拋棄了“固定時間長度動作塊”的人為定義,提出“以動作為中心的語義事件”作為最小學習單元。伸手、抓取、提起等連貫行為片段,既能被語言精確描述,也能被視頻覆蓋和動作執行,成為連接三種模態的天然樞紐。
自變量今年4月底剛完成近20億元B輪融資,由小米戰投與紅杉中國聯合領投,成為國內唯一同時獲字節跳動、美團、阿里巴巴、小米四家互聯網巨頭投資的具身智能企業。
TrendForce集邦咨詢數據顯示,2026年下半年全球人形機器人產業將進入商業化關鍵期,全年中國人形機器人產量預計同比增長94%。頭部企業加速上市和商業化落地,宇樹科技將于6月1日沖刺科創板“人形機器人第一股”。
天使投資人郭濤表示,具身智能行業已呈現四大明確趨勢:一是真實場景泛化能力成為核心競爭錨點;二是高質量多維度數據集與精細化處理體系構筑長期壁壘;三是AI大模型、機器人控制、多目傳感等多學科深度融合成為必然;四是商業化進程加速,應用場景從家用向工業、醫療等領域延伸。
