黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

小米MiMo-V2-Flash新模型發(fā)布:創(chuàng)新架構(gòu),性能超絕性價比拉滿

   時間:2025-12-18 00:04 來源:快訊作者:蘇婉清

小米近日正式推出全新開源大模型MiMo-V2-Flash,憑借3090億總參數(shù)與150億活躍參數(shù)的規(guī)模,采用專家混合架構(gòu)(MoE)設(shè)計,在性能表現(xiàn)上與DeepSeek-V3.2、Kimi-K2等頭部開源模型形成有力競爭。該模型最引人注目的突破在于將推理速度提升至每秒150 tokens,同時將輸入成本壓縮至每百萬token僅0.1美元,輸出成本0.3美元,在性價比維度樹立了新標桿。

在基準測試中,MiMo-V2-Flash展現(xiàn)驚人實力:AIME 2025數(shù)學競賽與GPQA-Diamond科學知識測試均位列開源模型前兩名,編程能力尤為突出——在SWE-bench Verified真實軟件修復測試中取得73.4%的得分,超越所有開源競品,直逼GPT-5-High水平。多語言編程測試SWE-Bench Multilingual中,該模型以71.7%的解決率證明其跨語言開發(fā)能力。智能體任務(wù)測試顯示,其在通信類任務(wù)獲得95.3分,零售類79.5分,航空類66.0分,搜索代理任務(wù)在啟用上下文管理后得分從45.4躍升至58.3。

技術(shù)團隊通過兩項核心創(chuàng)新實現(xiàn)性能突破?;旌匣瑒哟翱谧⒁饬C制采用5層滑動窗口與1層全局注意力的激進配比,滑動窗口固定為128 token長度,使KV緩存存儲量減少近6倍,卻仍能支持256k超長上下文窗口。項目負責人羅福莉特別指出,實驗發(fā)現(xiàn)128窗口大小是性能與效率的最佳平衡點,盲目擴大窗口反而導致性能下降,同時強調(diào)實施該機制時sink values的必要性。另一項輕量級多Token預測(MTP)技術(shù)則打破傳統(tǒng)逐token生成模式,通過原生集成模塊實現(xiàn)并行預測,實測平均接受2.8-3.6個連續(xù)token,推理速度提升2-2.6倍,有效解決強化學習中長尾樣本導致的GPU空轉(zhuǎn)問題。

訓練階段采用FP8混合精度技術(shù),在27萬億token數(shù)據(jù)上完成預訓練,原生支持32k序列長度。后訓練階段創(chuàng)新提出多教師在線策略蒸餾(MOPD),通過學生模型自主采樣、多專家教師實時反饋的方式,將訓練算力需求降至傳統(tǒng)方法的1/50。該架構(gòu)支持動態(tài)接入新教師模型,形成"教學相長"的閉環(huán)進化系統(tǒng)。智能體強化學習擴展方面,研究團隊基于真實GitHub問題構(gòu)建超10萬個驗證任務(wù),在Kubernetes集群部署并發(fā)超萬個Pod,環(huán)境部署成功率達70%,并開發(fā)多模態(tài)驗證器通過視頻錄制確保代碼執(zhí)行準確性。

對于開發(fā)者群體,MiMo-V2-Flash提供256k上下文窗口支持數(shù)百輪智能體交互,可無縫集成Claude Code、Cursor等主流開發(fā)環(huán)境。模型權(quán)重已在Hugging Face平臺以MIT協(xié)議開源,包含完整技術(shù)報告與推理代碼。目前該模型已通過API Platform限時免費開放,所有優(yōu)化經(jīng)驗同步分享至LMSYS博客,相關(guān)代碼貢獻給SGLang社區(qū)。這種全鏈條開源策略在國內(nèi)科技企業(yè)中實屬罕見,為行業(yè)技術(shù)演進提供了重要參考。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群