99热都是精品|亚洲精品精华液一区|日本综合视频|wallpaper原神18进入|国产农村一国产农村|穿越火线 兰|寡妇的肉体完整版

媒體界 - 推動(dòng)中國(guó)媒體行業(yè)創(chuàng)新,促進(jìn)業(yè)內(nèi)人士交流分享!

百度文心大模型5.1發(fā)布:多榜單登頂,以6%成本實(shí)現(xiàn)同級(jí)領(lǐng)先性能

   發(fā)布時(shí)間:2026-05-09 15:27 作者:楊凌霄

百度近日宣布,其最新迭代的文心大模型5.1已正式上線。該版本在繼承前代知識(shí)體系的基礎(chǔ)上,通過(guò)架構(gòu)創(chuàng)新實(shí)現(xiàn)預(yù)訓(xùn)練成本大幅壓縮,總參數(shù)量縮減至前代的約三分之一,激活參數(shù)量減少約一半,僅需同類模型6%的預(yù)訓(xùn)練資源即可達(dá)到同級(jí)別領(lǐng)先性能。這一突破標(biāo)志著大模型技術(shù)進(jìn)入更高效、更經(jīng)濟(jì)的階段。

在性能評(píng)估方面,文心5.1展現(xiàn)強(qiáng)勁競(jìng)爭(zhēng)力。國(guó)際權(quán)威榜單Arena Search最新數(shù)據(jù)顯示,該模型以1223分位列全球第四,在中國(guó)模型中穩(wěn)居榜首。在智能體能力專項(xiàng)測(cè)試中,其τ3-bench和SpreadsheetBench-Verified成績(jī)超越DeepSeek-V4-Pro,接近國(guó)際頂尖閉源模型水平。數(shù)學(xué)推理能力方面,在AIME26競(jìng)賽基準(zhǔn)測(cè)試中取得99.6分,僅以微弱差距落后于Gemini 3.1 Pro。

知識(shí)應(yīng)用與創(chuàng)作維度同樣表現(xiàn)突出。GPQA和MMLU-Pro測(cè)試顯示,其世界知識(shí)掌握程度與頭部閉源模型相當(dāng);內(nèi)部評(píng)估中創(chuàng)意寫作能力已接近Gemini 3.1 Pro標(biāo)準(zhǔn)。深度搜索能力作為核心優(yōu)勢(shì),在Search Arena排行榜的專項(xiàng)評(píng)分中持續(xù)保持領(lǐng)先地位。

技術(shù)實(shí)現(xiàn)層面,研發(fā)團(tuán)隊(duì)構(gòu)建了"一次訓(xùn)練,處處部署"的彈性訓(xùn)練框架。該框架突破傳統(tǒng)模型逐個(gè)訓(xùn)練的局限,通過(guò)動(dòng)態(tài)采樣機(jī)制同時(shí)優(yōu)化不同規(guī)模子模型。具體實(shí)現(xiàn)三大創(chuàng)新:彈性深度機(jī)制使Transformer層數(shù)隨機(jī)變化,促進(jìn)深淺層特征共享;彈性專家容量通過(guò)動(dòng)態(tài)調(diào)整MoE層參與路由的專家數(shù)量,提升計(jì)算資源利用率;彈性稀疏度采用可變Top-k路由,在推理效率與模型性能間取得動(dòng)態(tài)平衡。

生態(tài)建設(shè)方面,文心5.1已啟動(dòng)多平臺(tái)部署計(jì)劃。即日起,全球領(lǐng)先的AI角色扮演平臺(tái)ISEKAI ZERO、創(chuàng)意智能體平臺(tái)Mulan AI、AI原生創(chuàng)意畫布諦聽幻流,以及AI短劇生成平臺(tái)Storymaster等十余個(gè)創(chuàng)作平臺(tái)將陸續(xù)接入該模型。開發(fā)者可通過(guò)千帆大模型平臺(tái)將model_name切換至ernie-5.1調(diào)用API服務(wù),普通用戶登錄文心一言官網(wǎng)即可體驗(yàn)最新交互能力。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新