黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

阿里通義DeepResearch開(kāi)源來(lái)襲,以輕量之姿攻克博士級(jí)難題,引領(lǐng)AI研究新潮流

   時(shí)間:2025-09-19 02:16 來(lái)源:ITBEAR作者:柳晴雪

阿里旗下人工智能團(tuán)隊(duì)近日宣布,開(kāi)源深度研究智能體模型通義DeepResearch,引發(fā)全球AI領(lǐng)域高度關(guān)注。該模型在多項(xiàng)權(quán)威基準(zhǔn)測(cè)試中表現(xiàn)卓越,不僅超越OpenAI等國(guó)際頂尖團(tuán)隊(duì),更以輕量化架構(gòu)實(shí)現(xiàn)高性能突破。

在人類終極考試基準(zhǔn)HLE測(cè)試中,通義DeepResearch以32.9%的準(zhǔn)確率登頂全球榜首,領(lǐng)先第二名DeepSeek-V3.1達(dá)3.1個(gè)百分點(diǎn),較OpenAI同類模型高出6.3個(gè)百分點(diǎn)。該模型在BrowseComp開(kāi)源榜單上同樣表現(xiàn)驚艷,43.4%的準(zhǔn)確率刷新行業(yè)紀(jì)錄。值得注意的是,如此強(qiáng)勁的性能僅需30B參數(shù)規(guī)模,實(shí)際激活參數(shù)僅3B,開(kāi)創(chuàng)了輕量化模型實(shí)現(xiàn)深度研究的新范式。

研發(fā)團(tuán)隊(duì)同步公開(kāi)了核心技術(shù)體系,包括智能體合成數(shù)據(jù)生成框架和雙模式推理架構(gòu)。在數(shù)據(jù)構(gòu)建層面,創(chuàng)新性地采用AgentFounder方法,通過(guò)整合知識(shí)圖譜、網(wǎng)頁(yè)數(shù)據(jù)和工具使用軌跡,構(gòu)建出覆蓋開(kāi)放世界的記憶庫(kù)。后訓(xùn)練階段開(kāi)發(fā)的WebSailor V2系統(tǒng),能夠自動(dòng)生成包含迷霧設(shè)置和跨學(xué)科難題的高質(zhì)量數(shù)據(jù)集,數(shù)據(jù)質(zhì)量較人工標(biāo)注提升顯著。

該模型獨(dú)創(chuàng)的ReAct與Heavy雙模式推理機(jī)制,有效解決了長(zhǎng)程任務(wù)中的認(rèn)知過(guò)載問(wèn)題。Heavy模式通過(guò)迭代重構(gòu)工作空間,將復(fù)雜任務(wù)分解為多個(gè)研究輪次,確保在超長(zhǎng)上下文中保持推理質(zhì)量。實(shí)驗(yàn)數(shù)據(jù)顯示,采用Research-Synthesis框架的并行研究模式,可使模型在復(fù)雜基準(zhǔn)上的性能提升12%-15%。

技術(shù)實(shí)現(xiàn)層面,團(tuán)隊(duì)構(gòu)建了全棧式強(qiáng)化學(xué)習(xí)基礎(chǔ)設(shè)施。通過(guò)離線維基百科和定制工具套件搭建的仿真環(huán)境,配合工具沙盒的緩存重試機(jī)制,使訓(xùn)練效率提升3倍以上?;贕RPO算法的優(yōu)化策略,結(jié)合token級(jí)損失函數(shù)和留一法篩選,成功將策略熵維持在高位,確保模型持續(xù)進(jìn)化能力。

實(shí)際應(yīng)用場(chǎng)景中,該技術(shù)已深度賦能高德地圖和法律智能體。在高德V16版本中,集成Deep Research能力的POI推理Agent可精準(zhǔn)處理地理區(qū)域、交通約束等復(fù)雜需求,用戶輸入"西湖邊4.5分以上帶兒童餐的浙菜館,距地鐵站1公里內(nèi)"等條件時(shí),系統(tǒng)能瞬間生成最優(yōu)方案。法律領(lǐng)域落地的通義法睿,通過(guò)迭代規(guī)劃架構(gòu)實(shí)現(xiàn)多步查詢,在案例引用和法條匹配質(zhì)量上超越國(guó)際主流模型。

開(kāi)源項(xiàng)目上線后迅速引發(fā)開(kāi)發(fā)者熱潮,GitHub倉(cāng)庫(kù)已收獲7.2k星標(biāo),Hugging Face和ModelScope平臺(tái)模型下載量持續(xù)攀升。斯坦福NLP實(shí)驗(yàn)室等權(quán)威機(jī)構(gòu)第一時(shí)間轉(zhuǎn)發(fā)技術(shù)報(bào)告,稱贊其"重新定義了輕量模型的深度研究邊界"。隨著端到端訓(xùn)練框架和合成數(shù)據(jù)體系的全面公開(kāi),AI社區(qū)正迎來(lái)新一輪研究范式變革。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號(hào)
ITBear微信賬號(hào)

微信掃一掃
加微信拉群
電動(dòng)汽車群
科技數(shù)碼群