国产在线视频一区二区三区欧美图片,亚洲香蕉伊在人在线观婷婷,91真实国产门事件免费看

小米MiMo-V2-Flash新模型發(fā)布：創(chuàng)新架構(gòu)，性能超絕性價比拉滿

時間：2025-12-18 00:04 來源：快訊作者：蘇婉清

小米近日正式推出全新開源大模型MiMo-V2-Flash，憑借3090億總參數(shù)與150億活躍參數(shù)的規(guī)模，采用專家混合架構(gòu)（MoE）設(shè)計，在性能表現(xiàn)上與DeepSeek-V3.2、Kimi-K2等頭部開源模型形成有力競爭。該模型最引人注目的突破在于將推理速度提升至每秒150 tokens，同時將輸入成本壓縮至每百萬token僅0.1美元，輸出成本0.3美元，在性價比維度樹立了新標桿。

在基準測試中，MiMo-V2-Flash展現(xiàn)驚人實力：AIME 2025數(shù)學競賽與GPQA-Diamond科學知識測試均位列開源模型前兩名，編程能力尤為突出——在SWE-bench Verified真實軟件修復測試中取得73.4%的得分，超越所有開源競品，直逼GPT-5-High水平。多語言編程測試SWE-Bench Multilingual中，該模型以71.7%的解決率證明其跨語言開發(fā)能力。智能體任務(wù)測試顯示，其在通信類任務(wù)獲得95.3分，零售類79.5分，航空類66.0分，搜索代理任務(wù)在啟用上下文管理后得分從45.4躍升至58.3。

技術(shù)團隊通過兩項核心創(chuàng)新實現(xiàn)性能突破?；旌匣瑒哟翱谧⒁饬C制采用5層滑動窗口與1層全局注意力的激進配比，滑動窗口固定為128 token長度，使KV緩存存儲量減少近6倍，卻仍能支持256k超長上下文窗口。項目負責人羅福莉特別指出，實驗發(fā)現(xiàn)128窗口大小是性能與效率的最佳平衡點，盲目擴大窗口反而導致性能下降，同時強調(diào)實施該機制時sink values的必要性。另一項輕量級多Token預測（MTP）技術(shù)則打破傳統(tǒng)逐token生成模式，通過原生集成模塊實現(xiàn)并行預測，實測平均接受2.8-3.6個連續(xù)token，推理速度提升2-2.6倍，有效解決強化學習中長尾樣本導致的GPU空轉(zhuǎn)問題。

訓練階段采用FP8混合精度技術(shù)，在27萬億token數(shù)據(jù)上完成預訓練，原生支持32k序列長度。后訓練階段創(chuàng)新提出多教師在線策略蒸餾（MOPD），通過學生模型自主采樣、多專家教師實時反饋的方式，將訓練算力需求降至傳統(tǒng)方法的1/50。該架構(gòu)支持動態(tài)接入新教師模型，形成"教學相長"的閉環(huán)進化系統(tǒng)。智能體強化學習擴展方面，研究團隊基于真實GitHub問題構(gòu)建超10萬個驗證任務(wù)，在Kubernetes集群部署并發(fā)超萬個Pod，環(huán)境部署成功率達70%，并開發(fā)多模態(tài)驗證器通過視頻錄制確保代碼執(zhí)行準確性。

對于開發(fā)者群體，MiMo-V2-Flash提供256k上下文窗口支持數(shù)百輪智能體交互，可無縫集成Claude Code、Cursor等主流開發(fā)環(huán)境。模型權(quán)重已在Hugging Face平臺以MIT協(xié)議開源，包含完整技術(shù)報告與推理代碼。目前該模型已通過API Platform限時免費開放，所有優(yōu)化經(jīng)驗同步分享至LMSYS博客，相關(guān)代碼貢獻給SGLang社區(qū)。這種全鏈條開源策略在國內(nèi)科技企業(yè)中實屬罕見，為行業(yè)技術(shù)演進提供了重要參考。

更多>同類內(nèi)容

萬寧將關(guān)閉中國內(nèi)地全部門店及線上商城網(wǎng)	京東硬折扣超市北京首店啟幕，探索本土化路
跳出短期博弈陷阱：汽車設(shè)計如何從“點綴”	小紅書2026雙旦營銷：以“小跨越”為名，打

小米MiMo-V2-Flash新模型發(fā)布：創(chuàng)新架構(gòu)，性能超絕性價比拉滿

小米MiMo-V2-Flash新模型發(fā)布：創(chuàng)新架構(gòu)，性能超絕性價比拉滿