黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

摩爾線程MTT S5000軟硬協(xié)同發(fā)力 快速適配GLM-5賦能國產(chǎn)AI新發(fā)展

   時(shí)間:2026-02-13 01:13 來源:快訊作者:楊凌霄

國產(chǎn)AI領(lǐng)域迎來重要進(jìn)展,摩爾線程與智譜聯(lián)合宣布,基于摩爾線程旗艦級AI訓(xùn)推一體全功能GPU MTT S5000,成功完成對智譜新一代大模型GLM-5的Day-0全流程適配與驗(yàn)證。這一成果標(biāo)志著國產(chǎn)全功能GPU在支持前沿大模型方面邁出關(guān)鍵一步,為開發(fā)者提供了高性能、低延遲的國產(chǎn)AI解決方案。

作為GLM系列的最新力作,GLM-5定位為全球頂尖的Coding模型,其整體性能較上一代提升20%,在Agentic Engineering(代理工程)能力上實(shí)現(xiàn)突破。該模型不僅能處理復(fù)雜代碼,更具備系統(tǒng)工程與長程Agent任務(wù)處理能力,可實(shí)現(xiàn)從需求分析到應(yīng)用部署的端到端開發(fā)。在全球權(quán)威的Artificial Analysis榜單中,GLM-5位列全球第四、開源模型第一,在SWE-bench-Verified和Terminal Bench 2.0等主流基準(zhǔn)測試中分別取得77.8和56.2的開源模型最高分,性能超越Gemini 3 Pro。

MTT S5000是摩爾線程專為大模型訓(xùn)練與推理設(shè)計(jì)的高性能GPU,基于第四代MUSA架構(gòu)“平湖”打造。該卡單卡AI算力達(dá)1000 TFLOPS,配備80GB顯存和1.6TB/s顯存帶寬,支持從FP8到FP64的全精度計(jì)算。通過原生適配PyTorch、Megatron-LM等主流框架,MTT S5000可幫助用戶實(shí)現(xiàn)“零成本”代碼遷移,在構(gòu)建大規(guī)模訓(xùn)練集群或部署高并發(fā)推理服務(wù)時(shí),展現(xiàn)出與國際主流產(chǎn)品相當(dāng)?shù)男阅芘c穩(wěn)定性。

此次適配的成功,得益于摩爾線程在軟硬協(xié)同技術(shù)上的深度優(yōu)化。針對GLM-5的長序列推理需求,MTT S5000通過高計(jì)算密度架構(gòu)與稀疏Attention支持,在大規(guī)模上下文處理中保持高吞吐與低延遲。MUSA軟件棧的敏捷性是關(guān)鍵因素——其TileLang原生算子單元測試覆蓋率超80%,使多數(shù)通用算子可直接復(fù)用,顯著降低移植成本。在推理效率方面,摩爾線程通過SGLang-MUSA推理引擎與硬件原生FP8計(jì)算單元的協(xié)同,在保持模型精度的同時(shí),將顯存占用降低50%以上,推理吞吐量提升30%。

為解決大模型分布式推理中的通信瓶頸,MTT S5000引入獨(dú)創(chuàng)的異步通信引擎(ACE),通過物理級“通信計(jì)算重疊”機(jī)制,釋放15%被通信占用的算力。配合細(xì)粒度重計(jì)算技術(shù),將計(jì)算開銷降至原有四分之一,全面提升系統(tǒng)吞吐量。在超長上下文支持方面,該卡通過算子融合與框架優(yōu)化,在代碼生成質(zhì)量與響應(yīng)延遲間取得平衡,首字延遲(TTFT)降低40%,生成速度提升35%,特別適合代碼庫分析、智能體任務(wù)等長程開發(fā)場景。

從GLM-4.6到GLM-5,摩爾線程已形成“發(fā)布即適配”的常態(tài)化能力。這種對主流軟件棧的無縫兼容與快速響應(yīng),不僅驗(yàn)證了MUSA軟件棧的成熟度,更為國產(chǎn)AI生態(tài)的繁榮發(fā)展奠定基礎(chǔ)。開發(fā)者可第一時(shí)間獲取最新模型能力,加速AI應(yīng)用的落地與創(chuàng)新。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動(dòng)汽車群
科技數(shù)碼群