黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

阿里千問Qwen3-Coder-Next發(fā)布:以低推理成本解鎖高效編程智能體新可能

   時間:2026-02-04 10:56 來源:快訊作者:陸辰風

阿里巴巴旗下千問團隊近日發(fā)布了一款名為Qwen3-Coder-Next的全新語言模型,該模型專為編碼代理和本地開發(fā)場景設(shè)計,采用開放權(quán)重架構(gòu),旨在為開發(fā)者提供更高效的編程工具。與傳統(tǒng)的參數(shù)擴展模式不同,Qwen3-Coder-Next通過創(chuàng)新訓(xùn)練方法,在降低推理成本的同時顯著提升了編程和智能體能力。

該模型基于Qwen3-Next-80B-A3B-Base構(gòu)建,引入了混合注意力機制與專家混合(MoE)架構(gòu)。訓(xùn)練過程中,團隊采用大規(guī)??蓤?zhí)行任務(wù)合成、環(huán)境交互和強化學(xué)習(xí)技術(shù),使模型能夠直接從環(huán)境反饋中學(xué)習(xí)。具體訓(xùn)練方法包括:在代碼與智能體數(shù)據(jù)上進行持續(xù)預(yù)訓(xùn)練,利用高質(zhì)量智能體軌跡數(shù)據(jù)進行監(jiān)督微調(diào),針對軟件工程、QA、Web/UX等領(lǐng)域進行專家訓(xùn)練,最終將專家能力蒸餾到單一可部署模型中。這種訓(xùn)練方式特別強調(diào)長程推理、工具使用和錯誤恢復(fù)能力,這些特性對現(xiàn)實編程場景至關(guān)重要。

在性能評估方面,Qwen3-Coder-Next在多個權(quán)威編程智能體基準測試中表現(xiàn)優(yōu)異。使用SWE-Agent框架時,該模型在SWE-Bench Verified基準上取得超過70%的成績,在多語言設(shè)置和更具挑戰(zhàn)性的SWE-Bench-Pro測試中也保持競爭力。值得注意的是,盡管其激活參數(shù)規(guī)模較小,但在多項評測中仍能媲美甚至超越參數(shù)規(guī)模大10-20倍的開源模型。

效率與性能的平衡是該模型的另一大亮點。測試數(shù)據(jù)顯示,Qwen3-Coder-Next(3B激活參數(shù))在SWE-Bench-Pro測試中的表現(xiàn)可與參數(shù)量大數(shù)十倍的模型相提并論。雖然全注意力模型在絕對性能上仍具優(yōu)勢,但Qwen3-Coder-Next在低成本智能體部署領(lǐng)域展現(xiàn)出明顯的效率優(yōu)勢,處于帕累托前沿位置。這種特性使其特別適合需要快速響應(yīng)和資源優(yōu)化的開發(fā)場景。

目前,Qwen3-Coder-Next已通過ModelScope和Hugging Face平臺開源,開發(fā)者可以自由獲取模型權(quán)重和相關(guān)文檔。千問團隊表示,后續(xù)將持續(xù)優(yōu)化模型的推理決策能力,擴展支持的任務(wù)類型,并根據(jù)用戶反饋進行快速迭代,為編程智能體領(lǐng)域帶來更多創(chuàng)新解決方案。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群