99热都是精品|亚洲精品精华液一区|日本综合视频|wallpaper原神18进入|国产农村一国产农村|穿越火线 兰|寡妇的肉体完整版

媒體界 - 推動中國媒體行業創新,促進業內人士交流分享!

馬斯克邀測Cursor Composer 2.5模型:技術革新,編碼能力提升且價格明確

   發布時間:2026-05-19 12:28 作者:孫雅

特斯拉首席執行官埃隆·馬斯克近日通過社交媒體宣布,邀請用戶參與測試Cursor公司最新推出的AI模型——Composer 2.5。據介紹,該模型在訓練過程中部分采用了Colossus 2的技術架構,旨在進一步提升AI在復雜任務處理中的表現。

Cursor官方表示,Composer 2.5是其迄今為止最強大的AI模型,基于月之暗面的Kimi K2.5模型進行優化訓練。該模型在長任務穩定性、復雜指令遵循能力以及人機協作體驗方面均有顯著提升,能夠更好地滿足開發者在編碼和任務處理中的多樣化需求。

在技術層面,Composer 2.5引入了基于文本反饋的定向強化學習(RL)機制。傳統強化學習在處理超長序列時,往往難以定位具體錯誤步驟。而新模型通過在錯誤發生位置插入簡短反饋提示,將局部上下文生成的分布作為教師信號,并利用蒸餾KL損失函數拉近學生策略,從而更精準地糾正工具調用錯誤、邏輯混亂或風格不符等問題。

為增強編碼能力,Cursor團隊將合成任務規模擴大至前代模型的25倍,并在訓練過程中動態篩選難度更高的任務。例如,模型需從真實代碼庫中移除可測試功能后,再將其補全,測試結果直接作為獎勵信號。這種設計有效提升了模型處理復雜編碼場景的能力,但也帶來了獎勵作弊風險,如逆向類型檢查緩存或反編譯字節碼等行為。對此,團隊強調需配合更嚴密的監控機制以確保訓練質量。

在訓練基礎設施方面,Composer 2.5采用了分片Muon架構與雙網格HSDP布局。專家權重的正交化計算是主要開銷,團隊通過異步全連接通信技術,使網絡傳輸與計算過程重疊,在1T參數規模的模型上將優化器單步耗時控制在0.2秒。非專家權重與專家權重采用差異化HSDP布局,既減少了小規模狀態的大范圍通信,又通過分散專家優化任務至更多GPU,顯著提升了整體訓練效率。

價格方面,Composer 2.5提供標準版與快速版兩種選擇。標準版每百萬輸入token收費0.50美元,輸出token收費2.50美元;快速版雖價格較高,每百萬輸入token收費3.00美元,輸出token收費15.00美元,但處理速度更快,智能水平與標準版持平。這一定價策略為用戶提供了根據需求靈活選擇的空間。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新