黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領先的互聯(lián)網科技媒體

螞蟻開源全球首個萬億參數(shù)混合線性思考模型 性能躍升達IMO金牌水準

   時間:2026-02-14 03:30 來源:天脈網作者:江紫萱

螞蟻集團近日宣布開源全球首個基于混合線性架構的萬億參數(shù)思考模型Ring-2.5-1T,標志著AI大模型領域在長文本處理與復雜任務規(guī)劃能力上取得突破性進展。該模型在生成效率、推理深度和長時程任務執(zhí)行能力三大核心指標上實現(xiàn)顯著提升,尤其在數(shù)學競賽、代碼生成和智能體任務執(zhí)行等場景中展現(xiàn)出開源模型領先水平。

在數(shù)學推理能力驗證中,Ring-2.5-1T在國際數(shù)學奧林匹克競賽(IMO 2025)自測中取得35分(滿分42分),中國數(shù)學奧林匹克(CMO 2025)自測中更以105分遠超金牌線78分和國家隊集訓隊選拔線87分。對比前代模型Ring-1T,新模型在推理邏輯嚴謹性、高級數(shù)學證明技術應用和答案完整性方面均有顯著優(yōu)化。在編程能力測試中,該模型在LiveCodeBench-v6代碼生成基準中超越所有對比模型,展現(xiàn)出強大的工程化落地潛力。

技術架構層面,Ring-2.5-1T基于創(chuàng)新的Ling 2.5混合線性注意力架構,通過將傳統(tǒng)GQA(分組查詢注意力)升級為MLA(多頭線性注意力)與Lightning Linear結構的1:7混合比例,在保持63B激活參數(shù)規(guī)模的同時,將內存訪問開銷降低至前代的1/10。實驗數(shù)據(jù)顯示,在32K以上長文本生成場景中,模型生成吞吐量提升超3倍,且隨著序列長度增加,效率優(yōu)勢持續(xù)擴大。在配備8塊H200 GPU的測試環(huán)境中,當生成長度超過16K tokens時,其解碼吞吐量較傳統(tǒng)架構模型高出40%以上。

針對復雜任務執(zhí)行場景,研究人員通過大規(guī)模完全異步智能體強化學習訓練,使模型具備跨應用工具協(xié)作能力。在智能體搜索任務Gaia2-search中,Ring-2.5-1T在規(guī)劃生成和多步工具調用準確率上達到開源模型最優(yōu)水平,較Kimi-K2.5-Thinking等競品提升23%。該模型已實現(xiàn)與Claude Code智能體編程框架和OpenClaw個人AI助手的快速適配,支持多步驟工具調用與動態(tài)規(guī)劃生成。

在開源生態(tài)建設方面,螞蟻集團同步在Hugging Face、ModelScope等平臺發(fā)布模型權重與推理代碼,并計劃于近期上線官方Chat體驗頁和API服務。對比測試顯示,在AIME 26數(shù)學推理、HMMT 25競賽數(shù)學等高難度基準測試中,Ring-2.5-1T均實現(xiàn)開源模型最佳性能,在SWE-Bench Verified軟件工程任務執(zhí)行基準中更以87.6%的通過率領先第二名14個百分點。這些突破為金融、科研、工業(yè)等領域處理超長文檔、復雜業(yè)務流程提供了新的技術路徑。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群