黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

螞蟻數(shù)科開(kāi)源數(shù)據(jù)分析智能體關(guān)鍵技術(shù) 登頂BIRD-SQL并規(guī)劃持續(xù)開(kāi)源新能力模塊

   時(shí)間:2025-12-15 23:46 來(lái)源:互聯(lián)網(wǎng)作者:楊凌霄

在第二屆CCF中國(guó)數(shù)據(jù)大會(huì)上,螞蟻數(shù)科宣布了一項(xiàng)重要舉措:正式開(kāi)源其數(shù)據(jù)智能體核心技術(shù)Agentar SQL的全套資料,涵蓋論文、代碼、模型以及詳細(xì)的使用指南。這一技術(shù)旨在讓非專(zhuān)業(yè)人士也能通過(guò)自然語(yǔ)言輕松完成商業(yè)數(shù)據(jù)的查詢(xún)與分析,為企業(yè)數(shù)字化轉(zhuǎn)型提供更加精準(zhǔn)、實(shí)用的智能數(shù)據(jù)分析基礎(chǔ)。

作為首期開(kāi)源內(nèi)容,螞蟻數(shù)科推出了實(shí)時(shí)文本轉(zhuǎn)化結(jié)構(gòu)化查詢(xún)語(yǔ)言(Text-to-SQL)框架,為開(kāi)發(fā)者提供了一套即插即用的數(shù)據(jù)查詢(xún)解決方案,顯著提升了文本與數(shù)據(jù)庫(kù)查詢(xún)之間的交互效率。未來(lái),該公司計(jì)劃在2026年陸續(xù)開(kāi)源更多技術(shù)框架,包括數(shù)據(jù)庫(kù)理解與挖掘、行業(yè)知識(shí)挖掘以及實(shí)時(shí)多輪交互技術(shù),覆蓋從意圖理解到業(yè)務(wù)理解再到數(shù)據(jù)理解的全鏈路數(shù)據(jù)能力。

由該技術(shù)支持的螞蟻數(shù)科數(shù)據(jù)分析智能體Agentar-Scale-SQL,已在全球權(quán)威的自然語(yǔ)言轉(zhuǎn)結(jié)構(gòu)化查詢(xún)語(yǔ)言(NL2SQL)評(píng)測(cè)基準(zhǔn)BIRD-SQL中脫穎而出,力壓Google等國(guó)內(nèi)外知名企業(yè),登頂排行榜。目前,該智能體在執(zhí)行準(zhǔn)確率和執(zhí)行效率兩大榜單上均保持領(lǐng)先地位,持續(xù)領(lǐng)跑超過(guò)兩個(gè)月。BIRD-SQL評(píng)測(cè)要求AI模型將自然語(yǔ)言查詢(xún)精準(zhǔn)轉(zhuǎn)換為SQL,并在真實(shí)復(fù)雜的大規(guī)模生產(chǎn)級(jí)數(shù)據(jù)庫(kù)中穩(wěn)定運(yùn)行。其數(shù)據(jù)集涵蓋金融、電力、醫(yī)療等37個(gè)行業(yè)場(chǎng)景,總量達(dá)33GB,包含超過(guò)1萬(wàn)條高復(fù)雜度查詢(xún)?nèi)蝿?wù),被公認(rèn)為全球最具挑戰(zhàn)性的NL2SQL測(cè)試。

研究機(jī)構(gòu)數(shù)據(jù)顯示,全球商業(yè)智能市場(chǎng)規(guī)模預(yù)計(jì)在2025年達(dá)到474.8億美元,而中國(guó)商業(yè)智能與分析軟件市場(chǎng)規(guī)模則有望達(dá)到12億美元。到2028年,中國(guó)商業(yè)智能軟件市場(chǎng)規(guī)模預(yù)計(jì)將增長(zhǎng)至17.9億美元,未來(lái)五年年復(fù)合增長(zhǎng)率(CAGR)為12.7%,成為企業(yè)智能技術(shù)投資的重要領(lǐng)域。

當(dāng)前,中國(guó)企業(yè)在商業(yè)智能與分析產(chǎn)品的應(yīng)用深度上存在較大差異,多數(shù)企業(yè)仍集中在數(shù)據(jù)可視化和簡(jiǎn)單分析需求,如報(bào)表、駕駛艙、儀表板等。然而,如何在保證準(zhǔn)確性的前提下,提升技術(shù)在真實(shí)生產(chǎn)環(huán)境中的可用性,仍是NL2SQL在產(chǎn)業(yè)中規(guī)模化落地的普遍難題。

螞蟻數(shù)科AI技術(shù)負(fù)責(zé)人章鵬在會(huì)上指出,NL2SQL在實(shí)際應(yīng)用中面臨四大挑戰(zhàn):理解人類(lèi)口語(yǔ)的模糊多義性、注入龐大的行業(yè)專(zhuān)業(yè)知識(shí)、解析復(fù)雜的數(shù)據(jù)庫(kù)結(jié)構(gòu)與關(guān)聯(lián),以及生成準(zhǔn)確無(wú)誤的復(fù)雜SQL語(yǔ)句。這些挑戰(zhàn)表明,簡(jiǎn)單的模型“套殼”無(wú)法滿足企業(yè)級(jí)應(yīng)用的可靠性與準(zhǔn)確性要求。

以金融領(lǐng)域?yàn)槔?,從業(yè)者需要結(jié)合復(fù)雜業(yè)務(wù)規(guī)則與多條件組合進(jìn)行數(shù)據(jù)查詢(xún),以有效分析產(chǎn)品數(shù)據(jù)。而在業(yè)務(wù)管理中,非專(zhuān)業(yè)數(shù)據(jù)分析人員的口語(yǔ)化提問(wèn),則需要產(chǎn)品能夠準(zhǔn)確理解行業(yè)術(shù)語(yǔ)和詢(xún)問(wèn)意圖,并與數(shù)據(jù)庫(kù)字段精準(zhǔn)匹配,才能生成真實(shí)準(zhǔn)確的結(jié)果。

章鵬強(qiáng)調(diào),BIRD-SQL主要評(píng)測(cè)SQL的復(fù)雜度生成能力(在線擴(kuò)展OnlineScaling),但要實(shí)現(xiàn)產(chǎn)業(yè)可用的NL2SQL乃至數(shù)據(jù)智能體技術(shù),必須構(gòu)建更完整的能力棧。除了在線擴(kuò)展,還需包括離線擴(kuò)展(Offline Scaling),即對(duì)數(shù)據(jù)庫(kù)的深度理解與知識(shí)結(jié)構(gòu)化;人機(jī)交互(Human Interaction),即智能體識(shí)別自身不確定性,主動(dòng)與用戶(hù)澄清意圖,實(shí)現(xiàn)白盒化、可糾錯(cuò)的協(xié)作;以及自我進(jìn)化(Self Evolution),即通過(guò)“記憶”優(yōu)化、工具(如UDF)創(chuàng)建與復(fù)用等“免調(diào)優(yōu)”技術(shù),使智能體能夠從錯(cuò)誤中學(xué)習(xí),持續(xù)提升,降低對(duì)大量標(biāo)注數(shù)據(jù)和專(zhuān)家調(diào)優(yōu)的依賴(lài)。

螞蟻數(shù)科計(jì)劃逐步開(kāi)源這些更全面的能力模塊,如理解數(shù)據(jù)庫(kù)的Agentar Profiling-SQL、實(shí)現(xiàn)免調(diào)優(yōu)進(jìn)化的Agentar TuningFree-SQL等。目前,首期在線擴(kuò)展框架Agentar-Scale-SQL的開(kāi)源內(nèi)容已發(fā)布在arXiv、GitHub、ModelScope及Hugging Face等平臺(tái),供開(kāi)發(fā)者免費(fèi)使用。

 
 
更多>同類(lèi)內(nèi)容
推薦圖文
無(wú)人直播3.0時(shí)代:智享AI直播矩陣如何以低成本撬動(dòng)流量增長(zhǎng)?實(shí)戰(zhàn)指南來(lái)了 原創(chuàng)設(shè)計(jì)為翼,淘寶助力:HEFANG等中國(guó)珠寶品牌揚(yáng)帆全球市場(chǎng)
米哈游月入4.2萬(wàn)真實(shí)嗎?薪資揭秘:高薪背后的高強(qiáng)度與現(xiàn)實(shí)考量 2025廣州車(chē)展:長(zhǎng)安啟源Q05以7.99萬(wàn)起售 激光雷達(dá)加身續(xù)航超500km
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號(hào)
ITBear微信賬號(hào)

微信掃一掃
加微信拉群
電動(dòng)汽車(chē)群
科技數(shù)碼群