人人妻人人澡人人爽精品欧美,欧美av一区二区在线播放,午夜成人亚洲理伦片在线观看

螞蟻開源全球首個萬億參數(shù)混合線性思考模型性能躍升達IMO金牌水準

時間：2026-02-14 03:30 來源：天脈網作者：江紫萱

螞蟻集團近日宣布開源全球首個基于混合線性架構的萬億參數(shù)思考模型Ring-2.5-1T，標志著AI大模型領域在長文本處理與復雜任務規(guī)劃能力上取得突破性進展。該模型在生成效率、推理深度和長時程任務執(zhí)行能力三大核心指標上實現(xiàn)顯著提升，尤其在數(shù)學競賽、代碼生成和智能體任務執(zhí)行等場景中展現(xiàn)出開源模型領先水平。

在數(shù)學推理能力驗證中，Ring-2.5-1T在國際數(shù)學奧林匹克競賽（IMO 2025）自測中取得35分（滿分42分），中國數(shù)學奧林匹克（CMO 2025）自測中更以105分遠超金牌線78分和國家隊集訓隊選拔線87分。對比前代模型Ring-1T，新模型在推理邏輯嚴謹性、高級數(shù)學證明技術應用和答案完整性方面均有顯著優(yōu)化。在編程能力測試中，該模型在LiveCodeBench-v6代碼生成基準中超越所有對比模型，展現(xiàn)出強大的工程化落地潛力。

技術架構層面，Ring-2.5-1T基于創(chuàng)新的Ling 2.5混合線性注意力架構，通過將傳統(tǒng)GQA（分組查詢注意力）升級為MLA（多頭線性注意力）與Lightning Linear結構的1:7混合比例，在保持63B激活參數(shù)規(guī)模的同時，將內存訪問開銷降低至前代的1/10。實驗數(shù)據(jù)顯示，在32K以上長文本生成場景中，模型生成吞吐量提升超3倍，且隨著序列長度增加，效率優(yōu)勢持續(xù)擴大。在配備8塊H200 GPU的測試環(huán)境中，當生成長度超過16K tokens時，其解碼吞吐量較傳統(tǒng)架構模型高出40%以上。

針對復雜任務執(zhí)行場景，研究人員通過大規(guī)模完全異步智能體強化學習訓練，使模型具備跨應用工具協(xié)作能力。在智能體搜索任務Gaia2-search中，Ring-2.5-1T在規(guī)劃生成和多步工具調用準確率上達到開源模型最優(yōu)水平，較Kimi-K2.5-Thinking等競品提升23%。該模型已實現(xiàn)與Claude Code智能體編程框架和OpenClaw個人AI助手的快速適配，支持多步驟工具調用與動態(tài)規(guī)劃生成。

在開源生態(tài)建設方面，螞蟻集團同步在Hugging Face、ModelScope等平臺發(fā)布模型權重與推理代碼，并計劃于近期上線官方Chat體驗頁和API服務。對比測試顯示，在AIME 26數(shù)學推理、HMMT 25競賽數(shù)學等高難度基準測試中，Ring-2.5-1T均實現(xiàn)開源模型最佳性能，在SWE-Bench Verified軟件工程任務執(zhí)行基準中更以87.6%的通過率領先第二名14個百分點。這些突破為金融、科研、工業(yè)等領域處理超長文檔、復雜業(yè)務流程提供了新的技術路徑。

更多>同類內容

螞蟻開源全球首個萬億參數(shù)混合線性思考模型	科大訊飛星火X2大模型來襲！通用能力升級，
微信私域運營全攻略：4步閉環(huán)+避坑指南，讓	科大訊飛新專利：內存復用技術助力AI應用，

螞蟻開源全球首個萬億參數(shù)混合線性思考模型 性能躍升達IMO金牌水準

螞蟻開源全球首個萬億參數(shù)混合線性思考模型性能躍升達IMO金牌水準