臥安機(jī)器人(HK6600)(OneRobotics,6600.HK)正式發(fā)布自研世界動(dòng)作模型 OneModel 1.7 FrontoStria-RL,該模型面向真實(shí)家庭與服務(wù)機(jī)器人場(chǎng)景部署,旨在推動(dòng)具身智能規(guī)?;涞亍?/p>
在具身智能權(quán)威評(píng)測(cè)基準(zhǔn) LIBERO 中,OneModel 1.7 平均任務(wù)成功率達(dá)到 99.0%,領(lǐng)先于 π0.5、GR00T-N1.5、OpenVLA-OFT 等主流公開模型,展現(xiàn)出面向真實(shí)部署的領(lǐng)先性能。
圖1:標(biāo)準(zhǔn) LIBERO 平均成功率對(duì)比
從“看見并執(zhí)行”到“理解并完成”
傳統(tǒng)端到端 VLA 模型讓機(jī)器人實(shí)現(xiàn)了"看見并執(zhí)行"——將視覺觀測(cè)和語言指令直接映射為動(dòng)作。但在真實(shí)家庭場(chǎng)景中,這一范式面臨多重挑戰(zhàn):泛化能力不足、長(zhǎng)任務(wù)穩(wěn)定性有限、Skill 難以復(fù)用,以及對(duì)環(huán)境變化的適應(yīng)能力較弱。
物體擺放、光照變化、空間布局和初始位姿偏差等因素,均容易導(dǎo)致任務(wù)成功率下降。World Model 提升了機(jī)器人對(duì)環(huán)境狀態(tài)、空間關(guān)系和動(dòng)作后果的理解能力,但"理解世界"并不等于"穩(wěn)定執(zhí)行動(dòng)作"。從高層世界理解到底層動(dòng)作執(zhí)行之間,仍需要任務(wù)規(guī)劃、Skill 調(diào)度和動(dòng)作策略傳導(dǎo)這一關(guān)鍵中間層。
為解決這一問題,臥安機(jī)器人(HK6600)提出 RL-LWAM(RL-Latent World Action Model)架構(gòu),旨在打通世界理解與動(dòng)作執(zhí)行之間的鏈路——讓機(jī)器人從"看見并執(zhí)行"升級(jí)為"理解并完成"。
RL-LWAM:打通世界理解與動(dòng)作執(zhí)行的完整閉環(huán)
圖2:OneModel 1.7 FrontoStria-RL 完整架構(gòu);Predictive Policy Latent 作為核心傳導(dǎo)機(jī)制,連接 World Model、Understand Expert 與 Action Expert OneModel 1.7 FrontoStria-RL 通過 RL-LWAM 架構(gòu)構(gòu)建完整的具身智能閉環(huán)。其中,World Model 負(fù)責(zé)構(gòu)建環(huán)境的泛化表征,理解物體關(guān)系、空間結(jié)構(gòu)和任務(wù)狀態(tài);Predictive Policy Latent 將 World Model 對(duì)場(chǎng)景結(jié)構(gòu)和運(yùn)動(dòng)趨勢(shì)的理解,以隱式方式傳導(dǎo)至下游模塊;Understand Expert 負(fù)責(zé)任務(wù)分解、階段識(shí)別與 Skill 調(diào)度;Action Expert 進(jìn)一步生成精準(zhǔn)動(dòng)作并完成執(zhí)行。
在執(zhí)行層之外,系統(tǒng)還構(gòu)建了持續(xù)優(yōu)化的反饋閉環(huán):執(zhí)行結(jié)果進(jìn)入強(qiáng)化學(xué)習(xí)循環(huán),用于持續(xù)修正動(dòng)作策略;成功完成的動(dòng)作片段被寫入 Success Memory,在后續(xù)相似任務(wù)中檢索和復(fù)用;同時(shí)引入人在環(huán)監(jiān)督(Human-in-the-Loop)作為安全層,確保系統(tǒng)行為可審計(jì)、可干預(yù),形成兼顧性能與安全的部署機(jī)制。
四大核心技術(shù)創(chuàng)新:讓世界動(dòng)作模型走向真實(shí)落地
圖3:OneModel 1.7 FrontoStria-RL 四大核心技術(shù)創(chuàng)新點(diǎn)
1.Predictive Policy Latent OneModel 1.7 通過隱式物理推理表征替代顯式未來圖像或目標(biāo)坐標(biāo),使 World Model 對(duì)場(chǎng)景結(jié)構(gòu)和運(yùn)動(dòng)趨勢(shì)的理解,以更高效、低冗余的方式傳遞給下游模塊。相比傳統(tǒng)顯式生成方式,該機(jī)制減少了像素冗余與生成噪聲,更適合真實(shí)機(jī)器人實(shí)時(shí)控制。
2.Understand Expert + Skill體系
Understand Expert 在 World Model 與 Action Expert 之間引入任務(wù)規(guī)劃層,使機(jī)器人能夠識(shí)別任務(wù)階段、確定子目標(biāo)依賴,并調(diào)度對(duì)應(yīng) Skill。對(duì)于疊衣服、洗碗機(jī)操作等長(zhǎng)流程任務(wù),模型不再只是直接輸出動(dòng)作,而是能夠保持任務(wù)結(jié)構(gòu)和執(zhí)行邏輯。
3.MCF-Proto 動(dòng)作參數(shù)化
OneModel 1.7 采用 MCF-Proto(Motion-Centric Action Frame) 技術(shù),圍繞門軸、滑軌、孔位、折疊線等局部運(yùn)動(dòng)結(jié)構(gòu)組織動(dòng)作原型,而不是直接在固定世界坐標(biāo)系下預(yù)測(cè)位移。這使模型在相機(jī)視角變化、機(jī)器人初始位姿偏差等真實(shí)擾動(dòng)下,仍能保持更高穩(wěn)定性。
4.RL閉環(huán) + Success Memory OneModel 1.7 將強(qiáng)化學(xué)習(xí)、成功記憶與人在環(huán)監(jiān)督結(jié)合起來。模型不僅能夠通過真實(shí)任務(wù)反饋優(yōu)化策略,還能將成功完成的動(dòng)作片段寫入記憶庫(kù),在相似任務(wù)中檢索并復(fù)用已驗(yàn)證經(jīng)驗(yàn),無需重新訓(xùn)練即可提升成功率。
從標(biāo)準(zhǔn)評(píng)測(cè)到真機(jī)實(shí)測(cè):實(shí)測(cè)領(lǐng)先能力獲驗(yàn)證
OneModel 1.7 已完成標(biāo)準(zhǔn)評(píng)測(cè)、擾動(dòng)魯棒性與真機(jī)任務(wù)等多維驗(yàn)證。在具身操作領(lǐng)域最廣泛引用的評(píng)測(cè)基準(zhǔn) LIBERO 中,OneModel 1.7 平均任務(wù)成功率達(dá)到 99.0%;在 LIBERO-plus 七類擾動(dòng)測(cè)試中,MCF-Proto 在六類擾動(dòng)中取得更優(yōu)結(jié)果,驗(yàn)證了模型在環(huán)境變化下的穩(wěn)定性。
圖4:日常操作與高精度任務(wù)真機(jī)驗(yàn)證
在真實(shí)機(jī)器人實(shí)測(cè)中,OneModel 1.7 日常操作任務(wù)平均成功率約 99%,高精度任務(wù)平均成功率約 97%。除了以接觸操作為主的任務(wù),OneModel 1.7 還在真人對(duì)打乒乓球場(chǎng)景中進(jìn)行了驗(yàn)證,接球成功率達(dá)到 91.2%。乒乓球任務(wù)對(duì)實(shí)時(shí)感知、軌跡預(yù)測(cè)和快速動(dòng)作生成要求極高,體現(xiàn)模型在高動(dòng)態(tài)交互場(chǎng)景下的響應(yīng)能力。
圖5:真人對(duì)打乒乓球動(dòng)態(tài)場(chǎng)景驗(yàn)證
面向“一腦多形”,構(gòu)建可規(guī)?;桓兜木呱碇悄艿鬃?/strong>
OneModel 1.7 FrontoStria-RL 并不服務(wù)于單一機(jī)器人形態(tài)。作為臥安機(jī)器人(HK6600)"一腦多形"技術(shù)體系的核心模型底座,其能力正在復(fù)用于 onero 家庭保姆機(jī)器人、Acemate 網(wǎng)球機(jī)器人及 Kata Friends 陪伴機(jī)器人等多類具身產(chǎn)品。
OneModel 1.7 將泛化理解、動(dòng)作成功率和真實(shí)反饋學(xué)習(xí)整合進(jìn)同一套世界動(dòng)作模型系統(tǒng),覆蓋從家庭日常操作到高精度、高動(dòng)態(tài)交互的廣譜場(chǎng)景。它不是單點(diǎn)演示,而是一套經(jīng)過 Benchmark(BHE) 與真機(jī)實(shí)測(cè)共同驗(yàn)證、面向規(guī)?;桓兜哪P推脚_(tái)。
隨著 OneModel 1.7 FrontoStria-RL 的發(fā)布,臥安機(jī)器人(HK6600)將繼續(xù)推進(jìn)具身智能在真實(shí)家庭與服務(wù)機(jī)器人場(chǎng)景中的部署,讓機(jī)器人真正具備進(jìn)入日常生活、理解復(fù)雜任務(wù)并穩(wěn)定完成任務(wù)的能力。
