黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

ClawBench大模型榜單揭曉:智譜字節(jié)小米四款模型強(qiáng)勢(shì)躋身全球前十

   時(shí)間:2026-03-31 23:04 來(lái)源:天脈網(wǎng)作者:鐘景軒

評(píng)測(cè)機(jī)構(gòu)ClawBench近日公布了最新一期全球大型模型排行榜,北京三家人工智能企業(yè)的四款模型成功躋身全球前十,展現(xiàn)出中國(guó)AI領(lǐng)域的技術(shù)實(shí)力。其中,智譜科技研發(fā)的GLM-5-Turbo以93.9分的成績(jī)登頂榜首,字節(jié)跳動(dòng)旗下的豆包模型Doubao-Seed-2.0-lite緊隨其后位列第二,同時(shí)憑借最低的使用成本成為全榜單中最具性價(jià)比的選擇。

小米公司在此次榜單中表現(xiàn)尤為亮眼,其MiMo-V2系列兩款模型同時(shí)上榜。MiMo-V2-Omni以第九名的成績(jī)?nèi)脒x,在運(yùn)行速度測(cè)試中展現(xiàn)出顯著優(yōu)勢(shì);另一款升級(jí)版MiMo-V2-Pro雖未進(jìn)入前十,但在復(fù)雜邏輯推理、長(zhǎng)指令執(zhí)行和多輪對(duì)話穩(wěn)定性等專項(xiàng)測(cè)試中表現(xiàn)突出,在Model Rank專業(yè)排名中位居全球第五。據(jù)小米技術(shù)團(tuán)隊(duì)透露,該模型通過(guò)優(yōu)化注意力機(jī)制和知識(shí)蒸餾技術(shù),顯著提升了長(zhǎng)文本處理能力。

在反映企業(yè)綜合研發(fā)實(shí)力的LabRank實(shí)驗(yàn)室評(píng)價(jià)體系中,小米同樣取得突破性進(jìn)展。其Text Arena(ArenaExpert)項(xiàng)目位列全球第四,代碼生成專項(xiàng)Code Arena排名第五,綜合技術(shù)實(shí)力已躋身國(guó)際第一梯隊(duì),與Anthropic、OpenAI、谷歌等頭部企業(yè)形成直接競(jìng)爭(zhēng)。該評(píng)價(jià)體系通過(guò)模擬真實(shí)開(kāi)發(fā)環(huán)境,對(duì)模型在代碼生成、數(shù)學(xué)推理、多語(yǔ)言處理等20余個(gè)維度進(jìn)行綜合評(píng)估。

ClawBench榜單的權(quán)威性源于其獨(dú)特的評(píng)測(cè)機(jī)制。關(guān)聯(lián)的Text Arena榜單采用雙盲測(cè)試模式,所有參與評(píng)測(cè)的模型均隱藏身份信息,由全球超過(guò)5萬(wàn)名真實(shí)用戶根據(jù)回答質(zhì)量直接投票。這種設(shè)計(jì)有效避免了針對(duì)特定數(shù)據(jù)集的優(yōu)化行為,確保評(píng)測(cè)結(jié)果更貼近實(shí)際應(yīng)用場(chǎng)景。據(jù)機(jī)構(gòu)負(fù)責(zé)人介紹,本輪評(píng)測(cè)共收集有效投票樣本超200萬(wàn)份,覆蓋金融、醫(yī)療、教育等12個(gè)專業(yè)領(lǐng)域。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號(hào)
ITBear微信賬號(hào)

微信掃一掃
加微信拉群
電動(dòng)汽車群
科技數(shù)碼群