剛被SpaceX收購的Cursor發(fā)布新模型：1.5萬億+參數(shù)，10萬塊GPU預(yù)訓(xùn)練

發(fā)布時(shí)間：2026-06-17 15:33 來源：快訊作者：周偉

在舊金山舉行的首屆 Cursor Compile 大會(huì)上，Cursor 宣布推出一款擁有超過 1.5 萬億參數(shù)的新模型，引發(fā)了人工智能領(lǐng)域的廣泛關(guān)注。這款模型在超過 10 萬塊 GPU 上進(jìn)行了預(yù)訓(xùn)練，規(guī)模與 Opus 和 GPT 系列相當(dāng)，甚至更大。

Cursor 年僅 25 歲的 CEO Michael Truell 在會(huì)上表示，新模型的規(guī)模與 Opus 4.5 到 4.8 以及 GPT-5 到 GPT-5.5 相當(dāng)，但這些知名模型的參數(shù)規(guī)模實(shí)際上都低于 2 萬億。他指出，以當(dāng)前 GPT-5.5 和 Opus 4.8 的性能水平，開源模型完全有可能達(dá)到類似的效果。

Michael 認(rèn)為，在現(xiàn)階段，規(guī)模化擴(kuò)展是唯一能夠形成競(jìng)爭優(yōu)勢(shì)的關(guān)鍵因素。他特別提到，Anthropic 是目前唯一成功將模型規(guī)模擴(kuò)展至約 10 萬億參數(shù)的 AI 實(shí)驗(yàn)室。相比之下，OpenAI 要在年底前追上 Anthropic 的步伐將面臨巨大挑戰(zhàn)。

對(duì)于其他頭部 AI 實(shí)驗(yàn)室，Michael 也發(fā)表了自己的看法。他認(rèn)為 Google 的模型規(guī)模尚未達(dá)到同等水平，且在稀疏化路線上過于激進(jìn)，后訓(xùn)練和強(qiáng)化學(xué)習(xí)能力尚未充分轉(zhuǎn)化為穩(wěn)定、實(shí)用的產(chǎn)品體驗(yàn)。OpenAI 則仍在消化 GPT-4.5 之后的路線調(diào)整壓力，而 xAI 和 meta 仍在為下一階段的大模型競(jìng)爭做準(zhǔn)備。

拋開外界的爭議，Cursor 此次宣布的新模型計(jì)劃確實(shí)值得關(guān)注。與過去不同，Cursor 不再滿足于調(diào)用現(xiàn)成模型，而是開始系統(tǒng)性地訓(xùn)練自己的底座模型。Michael 在演講中首次詳細(xì)披露了這一計(jì)劃。

這款新模型有三個(gè)顯著特點(diǎn)。首先，它的規(guī)模是 Cursor 迄今為止訓(xùn)練過的最大的模型，已接近前沿大模型公司的水準(zhǔn)。其次，它是從零開始訓(xùn)練的，而非基于開源模型進(jìn)行微調(diào)。Michael 強(qiáng)調(diào)，盡管他們依然支持開源，但從零訓(xùn)練可以讓團(tuán)隊(duì)更完整地控制模型行為，使其更貼合開發(fā)者的實(shí)際需求。最后，此次訓(xùn)練使用的算力規(guī)模比以往提升了 10 到 20 倍，為模型能力的提升提供了有力支持。

更重要的是，Cursor 的目標(biāo)不僅僅是讓 AI 具備代碼生成能力，而是希望模型具備更通用的智能。Michael 表示，Cursor 的愿景是讓任何人都能通過 AI 構(gòu)建自己想要的東西，而不僅僅是寫好代碼。為此，新模型需要具備使用工程師常用工具、進(jìn)行規(guī)劃、測(cè)試軟件、檢查界面交互等能力，甚至能夠清晰地向用戶展示修改內(nèi)容。

據(jù)悉，這款新模型的訓(xùn)練已經(jīng)啟動(dòng)，預(yù)計(jì)將在未來幾周內(nèi)發(fā)布。Michael 透露，模型的訓(xùn)練得到了外部算力或基礎(chǔ)設(shè)施的支持，外界普遍猜測(cè)這背后的支持者可能是 SpaceX。不過，真正的答案還需等待模型發(fā)布后才能揭曉。

更多>同類內(nèi)容