小米技術(shù)團(tuán)隊(duì)近日宣布,正式推出名為Xiaomi OneVL的一步式潛空間語(yǔ)言視覺推理框架,并同步開源該模型的權(quán)重、訓(xùn)練及推理代碼。這一舉措旨在吸引全球開發(fā)者與研究人員共同參與,推動(dòng)自動(dòng)駕駛領(lǐng)域大模型技術(shù)的創(chuàng)新發(fā)展。
作為小米今年3月發(fā)布XLA認(rèn)知大模型架構(gòu)后的又一技術(shù)突破,Xiaomi OneVL通過(guò)潛空間推理技術(shù),首次將視覺語(yǔ)言動(dòng)作(VLA)、世界模型與潛空間推理三大核心方向整合至統(tǒng)一框架中。該設(shè)計(jì)顯著提升了模型在復(fù)雜場(chǎng)景下的推理效率,為自動(dòng)駕駛系統(tǒng)的決策能力提供了新的技術(shù)路徑。
據(jù)小米董事長(zhǎng)雷軍介紹,Xiaomi OneVL在推理、規(guī)劃等關(guān)鍵基準(zhǔn)測(cè)試中,已全面超越現(xiàn)有潛在推理方法的性能表現(xiàn)。其開源策略不僅降低了技術(shù)門檻,更通過(guò)開放協(xié)作模式加速了行業(yè)生態(tài)建設(shè)。開發(fā)者可基于公開代碼進(jìn)行二次開發(fā),探索自動(dòng)駕駛大模型在多模態(tài)感知、動(dòng)態(tài)環(huán)境建模等領(lǐng)域的潛在應(yīng)用。















