黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

斯坦福MIT聯(lián)合推出ReCAP推理框架,長(zhǎng)任務(wù)性能躍升開啟AI新篇

   時(shí)間:2025-12-05 16:07 來源:快訊作者:顧雨柔

斯坦福大學(xué)與麻省理工學(xué)院(MIT)聯(lián)合研究團(tuán)隊(duì)近日宣布,推出全新AI推理框架ReCAP,在長(zhǎng)上下文任務(wù)處理領(lǐng)域?qū)崿F(xiàn)重大突破。該框架通過創(chuàng)新性架構(gòu)設(shè)計(jì),成功解決大語言模型(LLM)在復(fù)雜任務(wù)中普遍存在的目標(biāo)偏移、上下文斷裂和計(jì)算成本激增三大難題,多項(xiàng)基準(zhǔn)測(cè)試顯示其性能顯著超越現(xiàn)有主流框架ReAct。

自2022年ReAct框架問世以來,AI推理領(lǐng)域涌現(xiàn)出眾多復(fù)雜架構(gòu),但多數(shù)因結(jié)構(gòu)冗余導(dǎo)致跨任務(wù)適配性差。研究團(tuán)隊(duì)指出,現(xiàn)有框架在更換評(píng)測(cè)場(chǎng)景時(shí)往往需要重構(gòu)示例,而ReAct憑借其簡(jiǎn)潔的示例設(shè)計(jì)和即插即用特性,在三年間成為行業(yè)事實(shí)標(biāo)準(zhǔn)。然而,隨著任務(wù)復(fù)雜度提升,ReAct在長(zhǎng)序列推理中逐漸暴露出目標(biāo)遺忘、上下文丟失等瓶頸問題。

針對(duì)這些挑戰(zhàn),ReCAP創(chuàng)新性地融合序列推理與層級(jí)推理優(yōu)勢(shì),構(gòu)建出具備動(dòng)態(tài)記憶能力的遞歸樹結(jié)構(gòu)。其核心機(jī)制包含三大模塊:計(jì)劃前瞻分解機(jī)制通過動(dòng)態(tài)生成子任務(wù)列表實(shí)現(xiàn)目標(biāo)聚焦;結(jié)構(gòu)化上下文再注入機(jī)制確保跨層級(jí)信息連貫性;滑動(dòng)窗口記憶機(jī)制則有效控制內(nèi)存占用,避免計(jì)算成本指數(shù)級(jí)增長(zhǎng)。這種設(shè)計(jì)使模型既能保持長(zhǎng)期目標(biāo)一致性,又能根據(jù)執(zhí)行反饋實(shí)時(shí)優(yōu)化后續(xù)計(jì)劃。

在具身推理基準(zhǔn)Robotouille測(cè)試中,ReCAP展現(xiàn)驚人性能提升:同步任務(wù)成功率達(dá)70%(較ReAct提升84.2%),異步任務(wù)成功率達(dá)53%(提升112.5%)。在代碼編輯基準(zhǔn)SWE-bench Verified上,其44.8%的成功率同樣優(yōu)于ReAct基線的39.58%。值得注意的是,所有測(cè)試均嚴(yán)格遵循pass@1原則,即不依賴重試或投票機(jī)制,這證明其性能提升源于架構(gòu)本質(zhì)創(chuàng)新而非優(yōu)化技巧。

研究團(tuán)隊(duì)坦言,ReCAP的計(jì)算成本約為ReAct的三倍,主要源于計(jì)劃前瞻分解機(jī)制需要額外調(diào)用LLM。但在需要高精度執(zhí)行的醫(yī)療診斷、金融分析等關(guān)鍵領(lǐng)域,這種成本增加完全在可接受范圍內(nèi)。更關(guān)鍵的是,其通用性突破使同一架構(gòu)能同時(shí)勝任具身推理和代碼編輯等差異巨大的任務(wù)類型,這在現(xiàn)有框架中極為罕見。

該成果引發(fā)學(xué)界廣泛關(guān)注。有專家指出,遞歸結(jié)構(gòu)的引入為AI推理系統(tǒng)提供了類似人類思維的動(dòng)態(tài)規(guī)劃能力。當(dāng)這種能力與空間智能技術(shù)結(jié)合時(shí),可能催生出真正具備自主決策能力的智能體。例如在復(fù)雜軟件工程中,ReCAP可管理百萬行級(jí)代碼庫的依賴關(guān)系;在科研領(lǐng)域,其能自主追蹤跨學(xué)科文獻(xiàn)脈絡(luò)并生成綜合報(bào)告。

隨著研究團(tuán)隊(duì)即將開源核心代碼,這場(chǎng)由遞歸結(jié)構(gòu)引發(fā)的推理框架革新,或?qū)⑼苿?dòng)AI從"單步執(zhí)行者"向"長(zhǎng)期規(guī)劃者"轉(zhuǎn)型。這種轉(zhuǎn)變不僅意味著技術(shù)能力的躍遷,更可能重新定義人機(jī)協(xié)作的邊界——在需要精密控制與長(zhǎng)期記憶的場(chǎng)景中,AI將真正成為可靠的智能伙伴。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號(hào)
ITBear微信賬號(hào)

微信掃一掃
加微信拉群
電動(dòng)汽車群
科技數(shù)碼群