在舊金山舉行的首屆 Cursor Compile 大會(huì)上,Cursor 宣布推出一款擁有超過 1.5 萬億參數(shù)的新模型,引發(fā)了人工智能領(lǐng)域的廣泛關(guān)注。這款模型在超過 10 萬塊 GPU 上進(jìn)行了預(yù)訓(xùn)練,規(guī)模與 Opus 和 GPT 系列相當(dāng),甚至更大。
Cursor 年僅 25 歲的 CEO Michael Truell 在會(huì)上表示,新模型的規(guī)模與 Opus 4.5 到 4.8 以及 GPT-5 到 GPT-5.5 相當(dāng),但這些知名模型的參數(shù)規(guī)模實(shí)際上都低于 2 萬億。他指出,以當(dāng)前 GPT-5.5 和 Opus 4.8 的性能水平,開源模型完全有可能達(dá)到類似的效果。
Michael 認(rèn)為,在現(xiàn)階段,規(guī)模化擴(kuò)展是唯一能夠形成競(jìng)爭優(yōu)勢(shì)的關(guān)鍵因素。他特別提到,Anthropic 是目前唯一成功將模型規(guī)模擴(kuò)展至約 10 萬億參數(shù)的 AI 實(shí)驗(yàn)室。相比之下,OpenAI 要在年底前追上 Anthropic 的步伐將面臨巨大挑戰(zhàn)。
對(duì)于其他頭部 AI 實(shí)驗(yàn)室,Michael 也發(fā)表了自己的看法。他認(rèn)為 Google 的模型規(guī)模尚未達(dá)到同等水平,且在稀疏化路線上過于激進(jìn),后訓(xùn)練和強(qiáng)化學(xué)習(xí)能力尚未充分轉(zhuǎn)化為穩(wěn)定、實(shí)用的產(chǎn)品體驗(yàn)。OpenAI 則仍在消化 GPT-4.5 之后的路線調(diào)整壓力,而 xAI 和 meta 仍在為下一階段的大模型競(jìng)爭做準(zhǔn)備。
拋開外界的爭議,Cursor 此次宣布的新模型計(jì)劃確實(shí)值得關(guān)注。與過去不同,Cursor 不再滿足于調(diào)用現(xiàn)成模型,而是開始系統(tǒng)性地訓(xùn)練自己的底座模型。Michael 在演講中首次詳細(xì)披露了這一計(jì)劃。
這款新模型有三個(gè)顯著特點(diǎn)。首先,它的規(guī)模是 Cursor 迄今為止訓(xùn)練過的最大的模型,已接近前沿大模型公司的水準(zhǔn)。其次,它是從零開始訓(xùn)練的,而非基于開源模型進(jìn)行微調(diào)。Michael 強(qiáng)調(diào),盡管他們依然支持開源,但從零訓(xùn)練可以讓團(tuán)隊(duì)更完整地控制模型行為,使其更貼合開發(fā)者的實(shí)際需求。最后,此次訓(xùn)練使用的算力規(guī)模比以往提升了 10 到 20 倍,為模型能力的提升提供了有力支持。
更重要的是,Cursor 的目標(biāo)不僅僅是讓 AI 具備代碼生成能力,而是希望模型具備更通用的智能。Michael 表示,Cursor 的愿景是讓任何人都能通過 AI 構(gòu)建自己想要的東西,而不僅僅是寫好代碼。為此,新模型需要具備使用工程師常用工具、進(jìn)行規(guī)劃、測(cè)試軟件、檢查界面交互等能力,甚至能夠清晰地向用戶展示修改內(nèi)容。
據(jù)悉,這款新模型的訓(xùn)練已經(jīng)啟動(dòng),預(yù)計(jì)將在未來幾周內(nèi)發(fā)布。Michael 透露,模型的訓(xùn)練得到了外部算力或基礎(chǔ)設(shè)施的支持,外界普遍猜測(cè)這背后的支持者可能是 SpaceX。不過,真正的答案還需等待模型發(fā)布后才能揭曉。















