国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

螞蟻數(shù)科開源數(shù)據(jù)分析智能體關(guān)鍵技術(shù) 登頂BIRD-SQL并規(guī)劃持續(xù)開源新能力模塊

   時間:2025-12-15 23:46 來源:互聯(lián)網(wǎng)作者:楊凌霄

在第二屆CCF中國數(shù)據(jù)大會上,螞蟻數(shù)科宣布了一項重要舉措:正式開源其數(shù)據(jù)智能體核心技術(shù)Agentar SQL的全套資料,涵蓋論文、代碼、模型以及詳細(xì)的使用指南。這一技術(shù)旨在讓非專業(yè)人士也能通過自然語言輕松完成商業(yè)數(shù)據(jù)的查詢與分析,為企業(yè)數(shù)字化轉(zhuǎn)型提供更加精準(zhǔn)、實用的智能數(shù)據(jù)分析基礎(chǔ)。

作為首期開源內(nèi)容,螞蟻數(shù)科推出了實時文本轉(zhuǎn)化結(jié)構(gòu)化查詢語言(Text-to-SQL)框架,為開發(fā)者提供了一套即插即用的數(shù)據(jù)查詢解決方案,顯著提升了文本與數(shù)據(jù)庫查詢之間的交互效率。未來,該公司計劃在2026年陸續(xù)開源更多技術(shù)框架,包括數(shù)據(jù)庫理解與挖掘、行業(yè)知識挖掘以及實時多輪交互技術(shù),覆蓋從意圖理解到業(yè)務(wù)理解再到數(shù)據(jù)理解的全鏈路數(shù)據(jù)能力。

由該技術(shù)支持的螞蟻數(shù)科數(shù)據(jù)分析智能體Agentar-Scale-SQL,已在全球權(quán)威的自然語言轉(zhuǎn)結(jié)構(gòu)化查詢語言(NL2SQL)評測基準(zhǔn)BIRD-SQL中脫穎而出,力壓Google等國內(nèi)外知名企業(yè),登頂排行榜。目前,該智能體在執(zhí)行準(zhǔn)確率和執(zhí)行效率兩大榜單上均保持領(lǐng)先地位,持續(xù)領(lǐng)跑超過兩個月。BIRD-SQL評測要求AI模型將自然語言查詢精準(zhǔn)轉(zhuǎn)換為SQL,并在真實復(fù)雜的大規(guī)模生產(chǎn)級數(shù)據(jù)庫中穩(wěn)定運行。其數(shù)據(jù)集涵蓋金融、電力、醫(yī)療等37個行業(yè)場景,總量達33GB,包含超過1萬條高復(fù)雜度查詢?nèi)蝿?wù),被公認(rèn)為全球最具挑戰(zhàn)性的NL2SQL測試。

研究機構(gòu)數(shù)據(jù)顯示,全球商業(yè)智能市場規(guī)模預(yù)計在2025年達到474.8億美元,而中國商業(yè)智能與分析軟件市場規(guī)模則有望達到12億美元。到2028年,中國商業(yè)智能軟件市場規(guī)模預(yù)計將增長至17.9億美元,未來五年年復(fù)合增長率(CAGR)為12.7%,成為企業(yè)智能技術(shù)投資的重要領(lǐng)域。

當(dāng)前,中國企業(yè)在商業(yè)智能與分析產(chǎn)品的應(yīng)用深度上存在較大差異,多數(shù)企業(yè)仍集中在數(shù)據(jù)可視化和簡單分析需求,如報表、駕駛艙、儀表板等。然而,如何在保證準(zhǔn)確性的前提下,提升技術(shù)在真實生產(chǎn)環(huán)境中的可用性,仍是NL2SQL在產(chǎn)業(yè)中規(guī)模化落地的普遍難題。

螞蟻數(shù)科AI技術(shù)負(fù)責(zé)人章鵬在會上指出,NL2SQL在實際應(yīng)用中面臨四大挑戰(zhàn):理解人類口語的模糊多義性、注入龐大的行業(yè)專業(yè)知識、解析復(fù)雜的數(shù)據(jù)庫結(jié)構(gòu)與關(guān)聯(lián),以及生成準(zhǔn)確無誤的復(fù)雜SQL語句。這些挑戰(zhàn)表明,簡單的模型“套殼”無法滿足企業(yè)級應(yīng)用的可靠性與準(zhǔn)確性要求。

以金融領(lǐng)域為例,從業(yè)者需要結(jié)合復(fù)雜業(yè)務(wù)規(guī)則與多條件組合進行數(shù)據(jù)查詢,以有效分析產(chǎn)品數(shù)據(jù)。而在業(yè)務(wù)管理中,非專業(yè)數(shù)據(jù)分析人員的口語化提問,則需要產(chǎn)品能夠準(zhǔn)確理解行業(yè)術(shù)語和詢問意圖,并與數(shù)據(jù)庫字段精準(zhǔn)匹配,才能生成真實準(zhǔn)確的結(jié)果。

章鵬強調(diào),BIRD-SQL主要評測SQL的復(fù)雜度生成能力(在線擴展OnlineScaling),但要實現(xiàn)產(chǎn)業(yè)可用的NL2SQL乃至數(shù)據(jù)智能體技術(shù),必須構(gòu)建更完整的能力棧。除了在線擴展,還需包括離線擴展(Offline Scaling),即對數(shù)據(jù)庫的深度理解與知識結(jié)構(gòu)化;人機交互(Human Interaction),即智能體識別自身不確定性,主動與用戶澄清意圖,實現(xiàn)白盒化、可糾錯的協(xié)作;以及自我進化(Self Evolution),即通過“記憶”優(yōu)化、工具(如UDF)創(chuàng)建與復(fù)用等“免調(diào)優(yōu)”技術(shù),使智能體能夠從錯誤中學(xué)習(xí),持續(xù)提升,降低對大量標(biāo)注數(shù)據(jù)和專家調(diào)優(yōu)的依賴。

螞蟻數(shù)科計劃逐步開源這些更全面的能力模塊,如理解數(shù)據(jù)庫的Agentar Profiling-SQL、實現(xiàn)免調(diào)優(yōu)進化的Agentar TuningFree-SQL等。目前,首期在線擴展框架Agentar-Scale-SQL的開源內(nèi)容已發(fā)布在arXiv、GitHub、ModelScope及Hugging Face等平臺,供開發(fā)者免費使用。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群