在人工智能向物理世界拓展的進程中,具身智能作為關(guān)鍵形態(tài),正引領(lǐng)著機器人朝著自主理解與行動的方向邁進。然而,當(dāng)前廣泛應(yīng)用的“視覺—語言—動作”模型,在應(yīng)對復(fù)雜連續(xù)任務(wù)時面臨諸多挑戰(zhàn)。這類模型在短任務(wù)中表現(xiàn)尚可,但在開放環(huán)境中,局部觀測的局限性、環(huán)境擾動的干擾以及動作累積誤差的影響,使得階段性動作雖合理,卻常常導(dǎo)致整體目標偏離,嚴重限制了其在復(fù)雜場景下的穩(wěn)定執(zhí)行與泛化應(yīng)用。
針對這一難題,中國科學(xué)院重慶綠色智能技術(shù)研究院的研究團隊展開了深入探索,并提出了一種面向長程任務(wù)的按需搜索方法。該方法獨具創(chuàng)新,將目標偏移看作采樣過程中的系統(tǒng)性誤差。通過精準識別不確定性變化的關(guān)鍵節(jié)點,引入軌跡重采樣與一致性校驗機制。在全局目標的嚴格約束下,它能夠?qū)蜻x動作序列進行高效篩選,有效降低因局部最優(yōu)決策而引發(fā)的長程任務(wù)偏移風(fēng)險,為解決復(fù)雜任務(wù)中的目標偏離問題提供了新的思路。
為了驗證該方法的有效性,研究團隊開展了一系列實驗。實驗結(jié)果顯示,該方法在多個長程機器人任務(wù)基準上均取得了優(yōu)異成績。在LIBERO - Long基準上,平均成功率高達97.6%,展現(xiàn)出強大的性能優(yōu)勢;在RoboTwin 1.0基準上,相較于π0模型,成功率提升了15.2%;在RoboTwin 2.0基準上,較RDT模型更是提高了31.6%。這些數(shù)據(jù)充分證明了該方法在長程機器人任務(wù)中的卓越表現(xiàn)和顯著效果。
目前,該研究成果已在國際知名學(xué)術(shù)期刊Expert Systems with Applications上發(fā)表,并且被ICML 2026、ACL 2026等重要學(xué)術(shù)會議收錄,彰顯了其在學(xué)術(shù)領(lǐng)域的重要價值和廣泛影響力。















