黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

阿里千問Qwen3-Coder-Next發(fā)布:以低推理成本解鎖高效編程智能體新可能

   時間:2026-02-04 09:44 來源:天脈網(wǎng)作者:江紫萱

阿里巴巴旗下千問團(tuán)隊近日正式發(fā)布全新語言模型Qwen3-Coder-Next,這款專為編碼代理和本地開發(fā)場景設(shè)計的開放權(quán)重模型,通過創(chuàng)新架構(gòu)與訓(xùn)練方法在編程智能體領(lǐng)域展現(xiàn)出顯著優(yōu)勢。該模型基于Qwen3-Next-80B-A3B-Base構(gòu)建,采用混合注意力機(jī)制與專家混合(MoE)架構(gòu),在保持低推理成本的同時實現(xiàn)了強(qiáng)大的編程能力。

在訓(xùn)練方法上,研究團(tuán)隊突破傳統(tǒng)參數(shù)擴(kuò)展模式,重點強(qiáng)化智能體訓(xùn)練信號的擴(kuò)展性。通過構(gòu)建包含大規(guī)??沈炞C編程任務(wù)和可執(zhí)行環(huán)境的訓(xùn)練體系,模型能夠直接從環(huán)境反饋中學(xué)習(xí)優(yōu)化。具體訓(xùn)練流程涵蓋四個階段:首先在代碼與智能體相關(guān)數(shù)據(jù)上進(jìn)行持續(xù)預(yù)訓(xùn)練,隨后利用高質(zhì)量智能體軌跡數(shù)據(jù)進(jìn)行監(jiān)督微調(diào),接著針對軟件工程、QA測試、Web/UX設(shè)計等領(lǐng)域開展專家訓(xùn)練,最終將多領(lǐng)域?qū)<夷芰φ麴s整合到單一可部署模型中。這種訓(xùn)練范式特別強(qiáng)化了長程推理、工具調(diào)用和錯誤恢復(fù)能力,這些特性對現(xiàn)實編程場景至關(guān)重要。

性能評估顯示,該模型在多個權(quán)威編程智能體基準(zhǔn)測試中表現(xiàn)突出。在SWE-Bench系列測試中,使用SWE-Agent框架時模型在Verified版本上取得超過70%的準(zhǔn)確率,在多語言版本和更具挑戰(zhàn)性的Pro版本中仍保持競爭力。特別值得注意的是,盡管激活參數(shù)規(guī)模僅30億,其性能已可媲美激活參數(shù)多10-20倍的開源模型。在TerminalBench 2.0和Aider等基準(zhǔn)測試中,模型同樣展現(xiàn)出優(yōu)異表現(xiàn)。

效率分析圖表揭示,Qwen3-Coder-Next在性能與資源消耗間實現(xiàn)了更優(yōu)平衡。在SWE-Bench-Pro測試中,30億激活參數(shù)版本的性能與參數(shù)量大數(shù)十倍的模型相當(dāng),展現(xiàn)出顯著的成本優(yōu)勢。雖然全注意力架構(gòu)的專有模型在絕對性能上仍占優(yōu)勢,但該模型在低成本智能體部署場景中已處于領(lǐng)先位置,特別適合資源受限環(huán)境下的編程任務(wù)處理。

技術(shù)文檔顯示,模型開發(fā)團(tuán)隊將持續(xù)優(yōu)化推理決策能力,計劃擴(kuò)展對更多編程任務(wù)類型的支持,并建立快速迭代機(jī)制根據(jù)用戶反饋持續(xù)改進(jìn)。目前該模型已通過ModelScope和Hugging Face平臺開源,開發(fā)者可自由獲取模型權(quán)重及訓(xùn)練代碼進(jìn)行二次開發(fā)。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群