在人工智能領(lǐng)域,阿里巴巴再次展現(xiàn)出強勁的技術(shù)實力。近日,其自主研發(fā)的世界模型ABot-PhysWorld在國際權(quán)威評測平臺WorldArena上脫穎而出,成功登頂榜首。這一成績距離阿里巴巴另一款模型HappyHorse在Artificial Analysis榜單奪冠還不到半個月,標(biāo)志著該公司在AI模型研發(fā)方面持續(xù)取得突破。
WorldArena評測體系由清華大學(xué)牽頭,聯(lián)合普林斯頓大學(xué)、新加坡國立大學(xué)、北京大學(xué)、香港大學(xué)、中國科學(xué)院、上海交通大學(xué)和中國科學(xué)技術(shù)大學(xué)等八所頂尖學(xué)府共同建立。該平臺通過16項核心指標(biāo)和3大實際應(yīng)用任務(wù),對模型在感知精度、物理規(guī)律理解、三維空間認(rèn)知以及動作預(yù)測等維度進(jìn)行全面評估,被視為世界模型領(lǐng)域的"試金石"。
ABot-PhysWorld的突出優(yōu)勢在于其對物理規(guī)律的深度掌握和長程動態(tài)預(yù)測能力。與傳統(tǒng)模型只能生成短時靜態(tài)畫面不同,該模型能夠精準(zhǔn)模擬物體在復(fù)雜交互中的運動軌跡,包括滑動、傾倒、堆疊等物理現(xiàn)象,甚至能預(yù)測流體變化過程。在多步因果推理測試中,其表現(xiàn)出的邏輯一致性顯著優(yōu)于同類產(chǎn)品。
這種突破性能力使ABot-PhysWorld具備實際應(yīng)用價值。在工業(yè)自動化場景中,模型可提前預(yù)判設(shè)備異常;在機器人控制領(lǐng)域,能夠?qū)崿F(xiàn)更精準(zhǔn)的任務(wù)規(guī)劃;在自動駕駛系統(tǒng)里,則能提升對復(fù)雜路況的應(yīng)對能力。相較于僅停留在視覺展示層面的技術(shù),該模型真正實現(xiàn)了從"看懂"到"理解"的跨越。
據(jù)評測數(shù)據(jù)顯示,ABot-PhysWorld在流體動力學(xué)模擬、多物體交互預(yù)測等關(guān)鍵指標(biāo)上領(lǐng)先第二名超過15%。特別是在需要連續(xù)推理的復(fù)雜場景中,其準(zhǔn)確率達(dá)到92.7%,創(chuàng)下該評測體系的新紀(jì)錄。參與評測的專家指出,這種級別的物理引擎模擬能力,標(biāo)志著具身智能發(fā)展進(jìn)入新階段。
此次雙模型連續(xù)登頂國際榜單,印證了阿里巴巴在基礎(chǔ)模型研發(fā)領(lǐng)域的持續(xù)投入已見成效。從語言大模型到世界模型,該公司正構(gòu)建覆蓋感知、認(rèn)知、決策的全鏈條AI技術(shù)體系,為人工智能技術(shù)在實體經(jīng)濟的落地應(yīng)用奠定基礎(chǔ)。









