黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

摩爾線程全棧技術(shù)亮相:“花港”架構(gòu)與萬卡集群引領(lǐng)GPU新征程

   時(shí)間:2025-12-20 20:02 來源:快訊作者:馮璃月

在近日舉辦的首屆MUSA開發(fā)者大會上,摩爾線程向業(yè)界展示了其在全功能GPU領(lǐng)域的一系列重大突破,涵蓋架構(gòu)創(chuàng)新、集群能力提升以及生態(tài)建設(shè)等多個(gè)維度。其中,新一代GPU架構(gòu)“花港”的發(fā)布和“夸娥”萬卡智算集群的實(shí)際效率披露,成為全場焦點(diǎn)。

“花港”架構(gòu)的推出,標(biāo)志著摩爾線程在計(jì)算密度和效能方面實(shí)現(xiàn)了顯著提升。據(jù)介紹,該架構(gòu)的計(jì)算密度提高了50%,效能提升最高可達(dá)10倍,并全面支持從FP4到FP64的全精度計(jì)算。更引人注目的是,架構(gòu)中集成了自研的MTLink高速互聯(lián)技術(shù),為未來十萬卡規(guī)模以上的集群擴(kuò)展奠定了堅(jiān)實(shí)基礎(chǔ)。摩爾線程創(chuàng)始人、董事長兼CEO在演講中指出,生態(tài)體系是GPU行業(yè)的核心競爭力,也是其價(jià)值所在。基于“花港”架構(gòu),公司已規(guī)劃了兩款芯片:一款是專注于AI訓(xùn)練與推理一體化的“華山”,另一款是瞄準(zhǔn)高性能圖形渲染的“廬山”。其中,“廬山”在圖形性能上實(shí)現(xiàn)了數(shù)量級的飛躍,AI計(jì)算、幾何處理及光線追蹤性能分別提升了64倍、16倍和50倍。這一架構(gòu)與產(chǎn)品路線的發(fā)布,表明摩爾線程正從單一場景的加速卡產(chǎn)品向覆蓋AI計(jì)算、圖形渲染、科學(xué)計(jì)算等全場景的“全功能GPU”平臺邁進(jìn)。

在集群能力方面,摩爾線程首次公開了“夸娥”萬卡智算集群的關(guān)鍵工程效率指標(biāo)。數(shù)據(jù)顯示,該集群在訓(xùn)練稠密大模型時(shí),模型算力利用率(MFU)達(dá)到60%,訓(xùn)練混合專家模型時(shí)MFU為40%,訓(xùn)練線性擴(kuò)展效率達(dá)95%,有效訓(xùn)練時(shí)間占比超過90%。這些指標(biāo),尤其是MFU,是衡量超大規(guī)模AI集群實(shí)際效能的關(guān)鍵,直接關(guān)系到訓(xùn)練的總體成本與可行性。中國工程院院士、清華大學(xué)計(jì)算機(jī)系教授在大會上表示,雖然構(gòu)建國產(chǎn)萬卡乃至十萬卡級別的超大規(guī)模智算系統(tǒng)難度極大,但這是必須完成的產(chǎn)業(yè)基礎(chǔ)設(shè)施任務(wù)。他認(rèn)為,國產(chǎn)計(jì)算顯卡與國外主流產(chǎn)品的性能差距正在逐步縮小,而集群能力的突破是發(fā)展“主權(quán)AI”、實(shí)現(xiàn)“算力自主”的重要一環(huán)。

在推理側(cè),摩爾線程與硅基流動合作,在DeepSeek R1 671B全量模型上取得了性能突破。經(jīng)過優(yōu)化后,MTT S5000單卡在Prefill階段吞吐量突破4000 tokens/s,Decode階段突破1000 tokens/s。這一數(shù)據(jù)為國產(chǎn)GPU在超大規(guī)模模型推理場景樹立了新的性能標(biāo)桿,也反映了從硬件到軟件系統(tǒng)級調(diào)優(yōu)的顯著成效。

除了硬件與集群的突破,摩爾線程還在生態(tài)開放與賦能方面邁出了重要步伐。公司宣布,其自主統(tǒng)一的軟件架構(gòu)MUSA已迭代至5.0版本,并計(jì)劃逐步開源包括計(jì)算加速庫、通信庫及系統(tǒng)管理框架在內(nèi)的核心組件。為降低開發(fā)門檻,摩爾線程發(fā)布了搭載自研“長江”智能SoC的AI算力本MTT AIBOOK,提供端側(cè)50TOPS算力,旨在實(shí)現(xiàn)從芯片到開發(fā)環(huán)境的全棧整合與“開箱即用”。同時(shí),其面向開發(fā)者的“摩爾學(xué)院”平臺已吸引近20萬學(xué)習(xí)者,并通過校企合作覆蓋全國超200所高校。這種從底層技術(shù)開源、到開發(fā)工具供給、再到人才早期培養(yǎng)的全鏈路生態(tài)建設(shè)思路,體現(xiàn)了國產(chǎn)GPU企業(yè)對行業(yè)規(guī)律的深刻理解——生態(tài)的構(gòu)建是一場需要長期投入、多方協(xié)同的馬拉松。

此次發(fā)布還揭示了GPU技術(shù)演進(jìn)的前沿趨勢:圖形、AI與高性能計(jì)算的深度融合。摩爾線程宣布,基于“花港”架構(gòu)實(shí)現(xiàn)了硬件級光線追蹤加速,并推出了自研的AI生成式渲染技術(shù)MTAGR 1.0,推動渲染從“計(jì)算”走向“生成”范式。公司已在具身智能、科學(xué)智能(AI for Science)、AI for 6G等前沿交叉領(lǐng)域展開布局,發(fā)布了具身智能仿真訓(xùn)練平臺MT Lambda及相應(yīng)的機(jī)器人解決方案。這些舉措表明,其技術(shù)路線并非僅追逐單一的AI算力,而是著眼于GPU作為通用計(jì)算平臺在未來更廣闊場景中的滲透與價(jià)值重塑。

摩爾線程此次的全棧技術(shù)展示,反映了當(dāng)前國產(chǎn)高端算力發(fā)展的階段特征:從單點(diǎn)芯片的突破,正進(jìn)入需要攻克超大規(guī)模系統(tǒng)工程、構(gòu)建繁榮應(yīng)用生態(tài)的“深水區(qū)”。萬卡集群的效率公開,意味著國產(chǎn)算力基礎(chǔ)設(shè)施已開始接受大規(guī)模、高負(fù)荷實(shí)際場景的檢驗(yàn)。而架構(gòu)的迭代、圖形與AI的融合,以及對科學(xué)計(jì)算等前沿領(lǐng)域的探索,則展現(xiàn)了企業(yè)試圖參與定義下一代計(jì)算架構(gòu)的技術(shù)布局。然而,通往成熟生態(tài)的道路依然漫長。硬件性能的持續(xù)提升、軟件棧的深度優(yōu)化、與國內(nèi)外主流開發(fā)框架及應(yīng)用的廣泛兼容,以及吸引足夠數(shù)量和質(zhì)量開發(fā)者形成網(wǎng)絡(luò)效應(yīng),均是擺在所有國產(chǎn)GPU廠商面前的共同課題。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群