一款來自中國的AI模型MiniMax M3,近期在全球科技圈引發了不小的震動。這款模型不僅得到了硅谷重量級人物的公開推薦,更在開發者社區中掀起了一場關于其真實能力的激烈討論。
Vercel的CEO Guillermo Rauch,在社交媒體上罕見地為MiniMax M3站臺,這一舉動迅速吸引了大量關注。Rauch的推薦,讓這款原本默默無聞的中國模型,一夜之間成為了全球開發者熱議的焦點。然而,與海外社區的熱烈討論形成鮮明對比的是,國內社區對于M3的評價卻顯得褒貶不一,甚至有些“吵鬧”。
國內社區的爭議焦點,主要集中在M3的Token Plan價格調整上。不少老用戶感到自己的權益受到了影響,紛紛在評論區表達不滿,一時間,吐槽聲四起。而與此同時,海外開發者則更關注M3的技術細節,如架構參數、稀疏注意力機制以及訓練數據規模等。他們更希望了解這款模型在實際應用中的表現,而不僅僅是價格問題。
面對外界的種種評價,MiniMax官方迅速做出了反應。他們不僅發布了補償方案,確保老用戶的權益不受影響,還為新用戶提供了額外的周限額加贈。這一舉措在一定程度上平息了國內社區的爭議,也讓人們的注意力重新回到了M3本身的技術實力上。
為了驗證M3的真實性能,全球開發者們自發組織了一場“硬核驗貨”活動。他們通過盲測的方式,將M3與其他知名模型進行對比。在一項讓AI生成動畫的測試中,M3的表現讓網友們大跌眼鏡。原本被認為表現平平的M3,最終卻以出色的動畫效果贏得了多數網友的認可。
另一場測試中,開發者JAZII要求M3和另一款知名模型用Three.js在HTML中從零開始創建一個《我的世界》的克隆版。雖然M3在耗時上略長一些,但最終的代碼運行結果卻與對手“Super close”,幾乎不相上下。這一結果再次證明了M3的強大實力。
除了這些盲測實驗外,還有開發者對M3的多模態和Agentic Coding能力進行了極限測試。他們讓M3制作一個復雜的游戲,過程中需要理解復雜的視覺手勢并完成超長程的邏輯代碼編寫。令人驚訝的是,M3不僅成功完成了任務,而且Token的消耗量僅為同類模型的20%。
AI測評人Thomas Wiegold在第一時間對M3進行了實測,并發布了一篇長達3000字的報告。他在報告中稱贊M3是“今年測過的最有意思的模型之一”,對其性能給予了高度評價。
為了更深入地了解M3的能力邊界,有開發者專門設計了一系列高難度測試。其中一項測試是讓M3梳理一篇長達50頁的技術報告中的核心工程邏輯。M3不僅成功完成了任務,還把實現路徑拆解得明明白白,邏輯鏈條毫無斷點。另一項測試則要求M3根據一張結構圖找到對應的數學公式,并解釋圖中的隱藏約束。M3同樣給出了精準的解析和詳細的拆解。
在另一項更具挑戰性的測試中,M3被要求觀看一場長達近2小時的英偉達GTC大會主題演講視頻,并根據規范撰寫一篇深度報道。面對如此龐大的原始視頻數據,M3不僅成功完成了任務,還交出了一份初稿質量相當高的報道。雖然距離專業發稿水平還有一定差距,但已經足夠作為一個高質量的起點。
M3之所以能夠取得如此出色的表現,得益于其三項核心能力的同時到位:前沿級編程、1M上下文窗口以及原生多模態。這些能力的基底是一個全新的注意力架構——MiniMax Sparse Attention(MSA)。MSA通過塊級稀疏的方式解決了傳統注意力機制在處理百萬級上下文時的計算量爆炸問題,顯著提高了計算效率和性能。
在多模態方面,M3同樣表現出色。它從訓練之初就將文本、圖片、視頻混合在一起進行訓練,重構了整條數據管線,并將預訓練規模直接拉到了100T量級。這使得M3在多個綜合智能指數榜上取得了優異成績,甚至在某些榜單上超越了知名閉源模型。
隨著M3的權重與完整技術報告即將在十天內開源,全球開發者們正翹首以盼。他們期待著用真實項目來檢驗這款模型的實力,并探索其無盡的應用可能性。而M3的出色表現,也無疑為中國AI模型在國際舞臺上贏得了一席之地。















