“技術(shù)路線正在經(jīng)歷一場(chǎng)深刻的收斂?!痹?025世界機(jī)器人大會(huì)的現(xiàn)場(chǎng),星動(dòng)紀(jì)元?jiǎng)?chuàng)始人兼首席執(zhí)行官陳建宇面對(duì)“具身智能技術(shù)路線升級(jí)”的提問(wèn)時(shí)給出了這樣的答案。
這位年輕的科學(xué)家兼創(chuàng)業(yè)者所錨定的方向,正是席卷整個(gè)機(jī)器人領(lǐng)域的“端到端”VLA(Vision-Language-Action)范式革命。
從爭(zhēng)議到共識(shí):VLA成為智能底座
具身智能領(lǐng)域曾充滿技術(shù)路線之爭(zhēng)。就在一兩年前,業(yè)界還在激烈辯論:機(jī)器人智能的核心究竟該依賴傳統(tǒng)基于模型的控制方法,還是擁抱新興的“l(fā)earning base”學(xué)習(xí)范式?更具體到操作層面,是采用分層模型,還是大膽嘗試端到端的VLA模型?
陳建宇坦言,這種爭(zhēng)論如今正快速平息?!拔覀兛吹剑瑹o(wú)論國(guó)內(nèi)國(guó)外,包括一些友商,都展現(xiàn)出了不錯(cuò)的VLA能力。”他回憶道,星動(dòng)紀(jì)元自創(chuàng)立之初就堅(jiān)定選擇了這條路徑,“從第一性原理出發(fā),我們相信這就是最終的方式?!碑?dāng)端到端VLA模型在實(shí)踐中不斷被證明有效,懷疑正迅速轉(zhuǎn)化為行業(yè)共識(shí)。
VLA的廣義內(nèi)涵在陳建宇的解讀中尤為關(guān)鍵。他認(rèn)為,VLA并非一個(gè)狹隘的具體模型架構(gòu),而是一個(gè)覆蓋“感知(Vision)-理解(Language)-行動(dòng)(Action)”的完整閉環(huán)。只要機(jī)器人能進(jìn)行視覺感知、語(yǔ)言交互并在物理世界執(zhí)行任務(wù),就屬于VLA范疇。而近期備受關(guān)注的“世界模型”,則被他視為VLA范式下的重要演進(jìn)方向,旨在提升機(jī)器人的精細(xì)化操作、泛化與認(rèn)知能力。
軟硬協(xié)同攻堅(jiān):效率瓶頸的破局之道
當(dāng)前人形機(jī)器人執(zhí)行效率仍與人類存在差距,陳建宇對(duì)此卻持樂(lè)觀態(tài)度。他透露,在部分工業(yè)場(chǎng)景中,其機(jī)器人效率已達(dá)人類的70%以上,預(yù)計(jì)明年將提升至90%。
“端到端的架構(gòu)能實(shí)現(xiàn)實(shí)時(shí)反饋與控制,打破傳統(tǒng)分階段(識(shí)別-規(guī)劃-執(zhí)行)的遲滯,這是效率躍升的關(guān)鍵?!彼忉?,配合硬件本體的性能提升,人形機(jī)器人達(dá)到甚至超越人類操作水平“并非不可能”。
軟硬件的深度協(xié)同,正是星動(dòng)紀(jì)元的攻堅(jiān)重點(diǎn)。在硬件端,靈巧手成為突破口。陳建宇介紹,其自研靈巧手已實(shí)現(xiàn)穩(wěn)定量產(chǎn),成本大幅下降。更重要的是,其VLA模型已能端到端直接控制每個(gè)手指關(guān)節(jié)的高頻動(dòng)作。在整機(jī)層面,星動(dòng)紀(jì)元堅(jiān)持“雙腿運(yùn)載雙手”的理念,并深度自研核心零部件,如關(guān)節(jié)電機(jī)、減速器等,“只有軟硬一體打磨,才能盡快形成閉環(huán)。”
殺手級(jí)應(yīng)用:從B端到家庭的漸進(jìn)之路
當(dāng)談及人形機(jī)器人的殺手級(jí)應(yīng)用,陳建宇描繪了一條清晰的路徑:先B端,后家庭?!肮I(yè)場(chǎng)景是必經(jīng)階段?!彼J(rèn)為,企業(yè)級(jí)應(yīng)用既能驗(yàn)證技術(shù)、積累數(shù)據(jù),也能推動(dòng)產(chǎn)業(yè)飛輪加速運(yùn)轉(zhuǎn)。
而真正的爆發(fā)點(diǎn)終將回歸家庭服務(wù),“未來(lái)五年,可能是家用機(jī)器人爆發(fā)的關(guān)鍵窗口期。”他預(yù)測(cè),簡(jiǎn)單形態(tài)的家用機(jī)器人將很快普及,高凈值家庭甚至可能率先嘗試通用人形機(jī)器人。
生態(tài)共建:開源的力量
面對(duì)行業(yè)共識(shí)未成、軟硬件路線交織的現(xiàn)狀,陳建宇更傾向“軟件定義硬件”的邏輯?!澳P褪浅橄蟮?,可適配不同硬件。但硬件決定模型能力上限。”他舉例,靈巧手采用直驅(qū)設(shè)計(jì),正是因?yàn)槠淇焖夙憫?yīng)特性利于高質(zhì)量數(shù)據(jù)收集和強(qiáng)化學(xué)習(xí)建模。
推動(dòng)生態(tài)共建,開源成為星動(dòng)紀(jì)元的主動(dòng)選擇。其開源的仿人機(jī)器人強(qiáng)化學(xué)習(xí)框架“Humanoid Gym”及生成式大模型“VPP”,已在社區(qū)獲得廣泛關(guān)注?!癆I領(lǐng)域的高速發(fā)展離不開開源?!标惤ㄓ钐寡裕_源雖帶有商業(yè)考量,但本質(zhì)是相信生態(tài)共榮才能帶來(lái)突破,“別人改進(jìn)我們的工作并再次開源,最終我們也會(huì)受益。”
在陳建宇的規(guī)劃中,世界級(jí)成果仍是進(jìn)行時(shí)。這位四年前受訪時(shí)立志“做出世界級(jí)成果”的科學(xué)家,如今將實(shí)驗(yàn)室的理想熔鑄于產(chǎn)業(yè)化實(shí)踐。當(dāng)被問(wèn)及是否已實(shí)現(xiàn)目標(biāo),他依然謙遜:“以我的標(biāo)準(zhǔn),還未達(dá)到。”
星動(dòng)紀(jì)元,陳建宇