黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

GPT-5.4來襲:原生操控電腦能力升級,多維度突破重塑AI工作助手新體驗

   時間:2026-03-06 16:47 來源:快訊作者:楊凌霄

OpenAI 近日正式推出新一代大模型 GPT-5.4,這款被定位為“專業(yè)領(lǐng)域最強前沿模型”的產(chǎn)品,在上下文處理能力、推理性能及多模態(tài)交互方面實現(xiàn)突破性升級。該模型不僅支持單次處理百萬級 token 的超長文本,更首次集成原生計算機操控功能,標志著通用人工智能向復(fù)雜任務(wù)自動化邁出關(guān)鍵一步。

在核心參數(shù)方面,GPT-5.4 將上下文窗口擴展至 100 萬 token,較前代提升近 4 倍。不過當輸入超過 27.2 萬 token 時,費用將按階梯式計費——輸入價格翻倍至每百萬 token 5 美元,輸出成本增加 50%。盡管基礎(chǔ)輸入單價較 GPT-5.2 上漲 43%,OpenAI 強調(diào)模型效率提升使實際使用成本可能不升反降,其 Pro 版本定價甚至高于 Anthropic 同級別產(chǎn)品 Claude Opus 4.6。

性能測試數(shù)據(jù)顯示顯著進步:在 OSWorld-Verified 基準測試中,該模型以 75% 的成功率超越人類專家 72.4% 的表現(xiàn);電子表格建模任務(wù)準確率從 68.4% 躍升至 87.3%;BrowseComp 網(wǎng)頁信息檢索能力提升 17 個百分點,Pro 版本達 89.3%。更引人注目的是其原生計算機操控能力,通過 Playwright 庫或屏幕截圖指令,模型可自主完成“構(gòu)建-運行-驗證-修復(fù)”的完整工作流,在演示中僅憑單條提示詞即生成包含路徑規(guī)劃、設(shè)施建造的樂園模擬游戲。

針對開發(fā)者痛點,新引入的 Tool Search 機制實現(xiàn)工具檢索動態(tài)化。模型僅需加載輕量級工具列表,使用時再實時調(diào)取完整定義,在 MCP Atlas 基準測試中使 token 消耗降低 47%,同時保持準確率。這項優(yōu)化使構(gòu)建大型智能體系統(tǒng)的成本顯著下降,響應(yīng)速度提升 30% 以上。

金融行業(yè)成為首批重點應(yīng)用場景。配套發(fā)布的 ChatGPT for Excel 測試版,可直接嵌入電子表格完成復(fù)雜財務(wù)模型構(gòu)建與分析。通過與 FactSet、MSCI 等數(shù)據(jù)服務(wù)商的深度集成,模型可自動化執(zhí)行盈利預(yù)覽、DCF 分析等標準化任務(wù)。內(nèi)部測試顯示,其在投資銀行基準測試中的表現(xiàn)從 43.7% 飆升至 88%,較前代提升近一倍。

盡管整體性能提升顯著,模型仍存在特定領(lǐng)域短板。在 HealthBench 醫(yī)療評測中得分 62.6%,較前代下降 0.7 個百分點;平均回復(fù)長度增加 24% 雖提升信息密度,但也可能導(dǎo)致冗余。早期測試者指出,其前端設(shè)計能力弱于 Claude Opus 4.6,且在現(xiàn)實場景理解方面偶發(fā)失誤,如規(guī)劃旅行時推薦熱門景點導(dǎo)致體驗下降。

該模型采用差異化授權(quán)策略:標準版 GPT-5.4 Thinking 面向 Plus 用戶開放,Pro 版本僅限月費 200 美元的 ChatGPT Pro 和 Enterprise 訂閱者使用。免費用戶僅在系統(tǒng)自動路由時可能體驗基礎(chǔ)功能。OpenAI 表示,此次升級標志著 AI 從單一任務(wù)處理向跨應(yīng)用工作流管理的范式轉(zhuǎn)變,為智能體框架提供更強大的底層引擎。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群