黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

智譜GLM-4.7強(qiáng)勢登場:代碼推理多模態(tài)全升級,國產(chǎn)開源模型新標(biāo)桿

   時間:2025-12-23 19:51 來源:快訊作者:任飛揚(yáng)

在人工智能領(lǐng)域,國產(chǎn)開源大模型GLM-4.7的發(fā)布引發(fā)了廣泛關(guān)注。這款由智譜推出的模型,憑借其卓越的技術(shù)表現(xiàn),在全球開源模型中脫穎而出,成為開發(fā)者們熱議的焦點(diǎn)。從技術(shù)指標(biāo)到實(shí)際應(yīng)用,GLM-4.7都展現(xiàn)出了強(qiáng)大的競爭力,被視為國產(chǎn)模型在智能體工具方向上的重要突破。

在專業(yè)編碼盲測榜單Code Arena上,GLM-4.7在Web開發(fā)方向排名第六,成為全球排名最高的開源模型,超越了GPT-5.2與Claude Sonnet 4.5,穩(wěn)居國產(chǎn)模型榜首。這一成績的取得,得益于GLM-4.7在代碼、工具調(diào)用和推理能力三個方面的顯著升級。在代碼能力測試中,它在SWE-bench?Verified和LiveCodeBench?V6兩項(xiàng)基準(zhǔn)上分別取得了73.8%和84.9%的高分,整體水平與Claude Sonnet 4.5相當(dāng),處于開源模型的第一梯隊。在復(fù)雜推理任務(wù)中,GLM-4.7在HLE(“人類最后的考試”)測試中,工具輔助條件下成績達(dá)到42.8%,較GLM?4.6提升超過12個百分點(diǎn),甚至超過了GPT?5.1 High。工具調(diào)用能力方面,GLM?4.7在τ2?Bench中拿到87.4%的成績,BrowseComp在開啟上下文管理后提升至67.5%,在多輪網(wǎng)頁任務(wù)和交互式工具調(diào)用場景中表現(xiàn)穩(wěn)定,進(jìn)一步鞏固了其“智能體向”模型的定位。

GLM?4.7的內(nèi)部思考機(jī)制也進(jìn)行了重要調(diào)整。在“交錯思考”的基礎(chǔ)上,引入了保留式思考與輪級思考控制。模型會在每次生成和工具調(diào)用前進(jìn)行推理,并在多輪任務(wù)中自動保留已有的思考結(jié)果,避免反復(fù)從零開始推導(dǎo)。開發(fā)者還可以按輪次決定是否啟用推理過程,在簡單請求中降低時延,在復(fù)雜任務(wù)中提高穩(wěn)定性。這種設(shè)計增強(qiáng)了長任務(wù)執(zhí)行中的一致性和可控性,為模型在代碼智能體、終端任務(wù)和工具協(xié)同類基準(zhǔn)上的整體躍升提供了支撐。模型還針對前端美學(xué)、長文本穩(wěn)定性、網(wǎng)頁生成結(jié)構(gòu)等細(xì)節(jié)進(jìn)行了優(yōu)化。

為了驗(yàn)證GLM?4.7在實(shí)際開發(fā)任務(wù)中的表現(xiàn),智譜進(jìn)行了100個真實(shí)編程任務(wù)的對比測試,覆蓋前端開發(fā)、后端邏輯和指令遵循三個核心方向。結(jié)果顯示,在前端任務(wù)中,GLM?4.7相較4.6版本勝率提升至64.6%,在指令遵循場景中達(dá)到58.3%,在后端方向勝率穩(wěn)定在46.7%。除了單點(diǎn)生成能力,GLM?4.7還強(qiáng)化了多技能聯(lián)動能力。在Z.ai平臺上線的全棧技能環(huán)境中,GLM-4.7接入了全新的Skills模塊,支持調(diào)用ASR語音識別、TTS語音合成、GLM?4.6V視覺模型等多個模塊進(jìn)行統(tǒng)一調(diào)度,實(shí)現(xiàn)了工具之間的“調(diào)度邏輯”打通。

在實(shí)際測試中,GLM?4.7的表現(xiàn)同樣令人印象深刻。在3D控制任務(wù)中,GLM?4.7輸出了一段可直接運(yùn)行的HTML代碼,構(gòu)建了一個由5000多個粒子構(gòu)成的立體圣誕樹場景,并集成了手勢識別與UI反饋邏輯。用戶可以通過手勢控制圣誕樹的炸開與收攏,形成照片墻的旋轉(zhuǎn)動畫,整個過程流暢自然。在UI生成任務(wù)中,GLM?4.7成功復(fù)刻了iOS主界面,圖標(biāo)可點(diǎn)擊,功能頁可交互,計算器還能進(jìn)行基礎(chǔ)運(yùn)算,整體體驗(yàn)流暢,圖標(biāo)風(fēng)格和顏色搭配也具備基本審美。在前端代碼實(shí)現(xiàn)任務(wù)中,GLM?4.7生成了一個完整的雙人格斗游戲界面,高度還原Switch主機(jī)的Joy-Con手柄配色和布局,角色邏輯和按鍵響應(yīng)完整,具備真實(shí)游戲的框架感。

GLM?4.7的發(fā)布,不僅提升了國產(chǎn)開源模型在全球的競爭力,也為開發(fā)者提供了更強(qiáng)大的工具。其開源代碼在全球社區(qū)中已被下載超6000萬次,付費(fèi)API使用量長期居于OpenRouter全球前十,逐步進(jìn)入開發(fā)者的實(shí)際工具列表。在智譜即將登陸港交所的背景下,GLM?4.7的上線標(biāo)志著國產(chǎn)大模型企業(yè)正從科研模型、開源生態(tài)向“真實(shí)使用”與“市場驗(yàn)證”過渡,開源國產(chǎn)模型正從“對標(biāo)國際”邁向“領(lǐng)跑、實(shí)用”,GLM?4.7無疑是這一進(jìn)程中的重要代表。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群