MiniMax M3大模型開源：MSA技術優化計算，綜合智能指數居全球開源模型首位

發布時間：2026-06-17 16:37 來源：快訊作者：柳晴雪

稀宇科技近日宣布開源其新一代AI大模型MiniMax M3的模型權重，并同步發布MSA（MiniMax Sparse Attention）技術論文，全面公開該架構的設計原理與工程實現細節。這一舉措標志著業內首款從零開始完成多模態混合訓練的開源模型正式進入開發者生態，為全球技術社區提供了可復用的技術框架。

作為原生多模態架構，MiniMax M3總參數量達4280億，但通過動態參數激活機制將實際運算參數量控制在230億規模。該模型在訓練階段即采用文本、圖像、音頻等多類型數據交叉訓練模式，構建了統一的跨模態語義表示空間。這種設計使其在理解復雜指令、生成跨模態內容以及處理長周期任務時表現出顯著優勢，尤其在處理超長文本序列時，通過MSA技術將計算資源消耗降低40%以上。

技術團隊透露，模型研發過程中重點優化了三個核心維度：邏輯推理能力、長文本處理效率和多模態交互質量。通過引入動態注意力機制和分層記憶架構，M3在保持輕量化部署優勢的同時，實現了接近千億參數模型的性能表現。目前該模型已支持中英文雙語環境下的復雜對話、多模態內容生成等場景，在Artificial Analysis智能指數評測中連續兩周位居全球開源模型榜首。

面對開源后激增的訪問需求，開發團隊在兩周內完成三次性能迭代，將模型輸出速度從初始的30TPS提升至80TPS，并計劃通過架構優化再提升30%-40%的處理效率。配套上線的資源監控看板可實時顯示調用量、Token消耗等關鍵指標，幫助用戶精準控制使用成本。據平臺數據顯示，當前用戶最關注模型在持續高負載運行下的穩定性表現，以及大規模部署時的成本效益比。

隨著AI技術向生產環境深度滲透，行業對模型的要求已從單一性能指標轉向綜合效能評估。MiniMax M3通過開源策略降低了企業級應用門檻，其動態參數激活技術為降低推理成本提供了新思路。目前已有超過200家企業參與模型測試，覆蓋智能客服、內容創作、工業質檢等多個領域，實際場景中的Token消耗量較傳統模型降低35%以上。

更多>同類內容