黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

從模仿到超越:摩爾線程以全功能GPU開啟國產(chǎn)算力新征程

   時間:2025-12-22 16:33 來源:快訊作者:鐘景軒

在摩爾線程舉辦的首屆MUSA開發(fā)者大會(MDC 2025)上,創(chuàng)始人張建中攜一系列重磅成果亮相,向行業(yè)展示了國產(chǎn)GPU在技術(shù)演進與生態(tài)建設(shè)上的全新突破。這場以“全功能GPU”為核心主題的發(fā)布會,不僅展現(xiàn)了摩爾線程從單點技術(shù)到系統(tǒng)級能力的跨越,更釋放出國產(chǎn)算力基礎(chǔ)設(shè)施邁向長期主義的明確信號。

張建中在演講中強調(diào),GPU的發(fā)展史本質(zhì)是算力邊界的持續(xù)拓展。從早期專注于圖形渲染,到通過可編程能力演變?yōu)橥ㄓ貌⑿杏嬎闫脚_,再到如今成為AI時代的核心載體,GPU的每一次躍遷都源于對多樣化計算需求的響應(yīng)。隨著生成式AI向具身智能、物理AI等新形態(tài)演進,未來五到十年,算力平臺需同時具備計算、仿真、圖形與感知能力,這決定了單一功能加速器無法滿足需求。

全功能GPU的架構(gòu)設(shè)計正是為此而生。其核心在于集成四大計算引擎:AI計算引擎支撐模型訓(xùn)練與推理,3D圖形渲染引擎服務(wù)數(shù)字內(nèi)容生產(chǎn),高性能計算引擎賦能科學(xué)模擬,智能視頻編解碼引擎優(yōu)化云端算力傳輸。這種“四引擎協(xié)同”的模式,使得單一硬件平臺即可覆蓋從云端訓(xùn)練到終端推理、從科學(xué)計算到數(shù)字孿生的全場景需求。

作為摩爾線程自主研發(fā)的元計算統(tǒng)一架構(gòu),MUSA在此次大會上升級至5.0版本,標志著其技術(shù)體系步入成熟階段。新架構(gòu)原生支持MUSA C編程語言,深度兼容TileLang、Triton等國際主流語言,核心計算庫muDNN的GEMM與FlashAttention效率突破98%,編譯器性能提升3倍,并集成高性能算子庫,顯著加速訓(xùn)練與推理全流程。

更值得關(guān)注的是MUSA的生態(tài)開放戰(zhàn)略。摩爾線程宣布將逐步開源計算加速庫、通信庫及系統(tǒng)管理框架等核心組件,并推出兼容跨代GPU指令的中間語言MTX、面向渲染+AI融合計算的muLang、量子計算框架MUSA-Q等工具鏈。這一舉措旨在構(gòu)建“國際生態(tài)+國產(chǎn)生態(tài)”的雙輪驅(qū)動模式,覆蓋“云邊端”全系列產(chǎn)品,為開發(fā)者提供統(tǒng)一軟件棧支持。

基于MUSA體系,摩爾線程發(fā)布了新一代全功能GPU架構(gòu)“花港”。該架構(gòu)在計算密度、能效、精度支持與互聯(lián)能力上實現(xiàn)全面突破:算力密度提升50%,支持從FP4到FP64的全精度計算;通過自研MTLink高速互聯(lián)技術(shù),可擴展至十萬卡級智算集群;內(nèi)置AI生成式渲染架構(gòu)與硬件光追引擎,圖形渲染性能較前代提升數(shù)倍。截至2025年6月,摩爾線程累計授權(quán)專利達514項,其中發(fā)明專利468項,為架構(gòu)自主可控提供了堅實保障。

基于“花港”架構(gòu),摩爾線程規(guī)劃了兩款芯片:面向AI訓(xùn)推一體的“華山”系列與專注圖形渲染的“廬山”系列。前者集成全精度張量計算單元,為萬卡集群提供穩(wěn)定算力;后者在幾何處理、光線追蹤等關(guān)鍵指標上實現(xiàn)64倍性能提升,可支持3A游戲與高端創(chuàng)作場景。這兩款芯片的推出,標志著國產(chǎn)GPU在技術(shù)自研與場景覆蓋上邁入新階段。

大會現(xiàn)場,摩爾線程正式發(fā)布夸娥萬卡智算集群,成為國產(chǎn)GPU在集群系統(tǒng)層面的首個標桿案例。該集群浮點運算能力達10Exa-Flops,在Dense大模型訓(xùn)練中算力利用率(MFU)達60%,MOE大模型達40%,訓(xùn)練線性擴展效率95%,且兼容國際主流生態(tài)。在推理側(cè),與硅基流動聯(lián)合優(yōu)化的MTT S5000單卡在DeepSeek R1 671B模型上實現(xiàn)Prefill吞吐4000 tokens/s、Decode吞吐1000 tokens/s,刷新國產(chǎn)推理性能紀錄。

摩爾線程還預(yù)告了MTT C256超節(jié)點架構(gòu)規(guī)劃。該產(chǎn)品采用計算與交換一體化設(shè)計,旨在提升萬卡集群的訓(xùn)練效能與推理密度,為下一代智算中心提供硬件基石。從單卡到集群,從性能追趕到系統(tǒng)優(yōu)化,摩爾線程的路徑選擇,折射出國產(chǎn)GPU從“可用”向“好用”的關(guān)鍵轉(zhuǎn)型。

這場發(fā)布會背后,是國產(chǎn)算力對長期主義的堅定選擇。面對供應(yīng)鏈不確定性、技術(shù)封鎖與生態(tài)薄弱等挑戰(zhàn),摩爾線程選擇以全功能GPU為支點,通過架構(gòu)創(chuàng)新、生態(tài)開放與系統(tǒng)級優(yōu)化,構(gòu)建自主可控的算力基礎(chǔ)設(shè)施。這條道路或許漫長,但至少從MDC 2025開始,國產(chǎn)GPU的演進邏輯已清晰可循——不再局限于參數(shù)競爭,而是以技術(shù)深度與生態(tài)廣度,重新定義算力價值的邊界。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群