在人工智能領域,馬斯克及其團隊近期動作頻頻,引發(fā)了廣泛關注。此前,xAI解散及創(chuàng)始成員大規(guī)模離職的消息曾讓外界對Grok的未來產生擔憂,但如今看來,這一項目不僅沒有停滯,反而迎來了重要進展。
據馬斯克透露,參數量高達1.5T的Grok基礎模型V9-Medium已完成訓練,且評估結果表現(xiàn)優(yōu)異。目前,該模型正處于微調階段,預計幾天后將進入強化學習階段,并有望在兩到三周內正式對外發(fā)布。這一消息無疑為關注Grok的開發(fā)者們注入了一劑強心針。
馬斯克坦言,現(xiàn)有的承載Grok生產流量的v8-small模型(即外部測試版本Grok 4.2)在訓練數據質量、全面性和比例上存在明顯不足。而新發(fā)布的V9-Medium模型不僅將參數規(guī)模擴大至前代的3倍,還針對Blackwell架構GPU進行了優(yōu)化,預計在各項能力上都將有顯著提升,特別是在處理復雜編程任務方面將展現(xiàn)出更強的實力。
更令人期待的是,現(xiàn)有的0.5T模型計劃于年底前開源,這意味著開發(fā)者們將能夠在本地運行、微調或基于該模型構建應用,進一步拓展其應用場景。
在模型訓練數據的獲取上,馬斯克團隊也展現(xiàn)出了獨到的眼光。今年4月,SpaceX宣布獲得收購AI代碼編輯器Cursor的權利,這一舉動當時曾引發(fā)外界質疑。然而,隨著Grok新模型訓練中大量Cursor數據的加入,這一收購的價值逐漸顯現(xiàn)。Cursor作為開發(fā)者實際使用的工具,其數據包含了真實的工作流信息,如寫代碼、調試、迭代和修復bug等,這些數據是“人類開發(fā)者如何思考”的直接映射,對于提升模型對真實開發(fā)者工作方式的理解具有獨特價值。
除了新模型的發(fā)布,馬斯克近期還推出了首款編碼智能體Grok Build,這一產品被外界視為馬斯克版的“Claude Code”。Grok Build是一個直接運行在命令行中的AI程序員,能夠讀取代碼、制定計劃、修改文件并運行測試。其獨特的Plan Mode(計劃模式)允許用戶在需求描述后,先審閱、修改甚至重寫結構化的執(zhí)行計劃,再批準執(zhí)行,所有改動以diff形式呈現(xiàn),大大提高了代碼修改的準確性和可控性。
Grok Build還支持并行子智能體(最多8個同時工作)、Arena Mode(讓多個候選方案內部競爭)以及原生支持MCP和ACP等功能,且支持無界面運行,這些設計使其在開發(fā)者群體中迅速獲得了好評。
在終端原生編程智能體領域,Grok Build的加入使得原本的三強格局(Anthropic的Claude Code、OpenAI的Codex CLI、Google的Gemini-powered Antigravity)變?yōu)樗膹姞幇浴1M管馬斯克此前曾承認xAI在編程能力上落后,但Grok Build的發(fā)布無疑是一次“補課式入場”,試圖通過功能架構上的快速追平和差異化機制實現(xiàn)彎道超車。
然而,目前的Grok Build底層仍運行在grok-code-fast-1上,其256K-token的上下文窗口在競爭對手面前顯得捉襟見肘。對于大型單一代碼庫和長時間運行的Agent會話來說,這一限制無疑將成為瓶頸。不過,隨著Grok V9-Medium模型的發(fā)布和Cursor真實工作流數據的注入,Grok Build有望獲得更強大的底層支持,從而在未來的Agent戰(zhàn)局中占據一席之地。















