黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領先的互聯(lián)網(wǎng)科技媒體

中科曙光scaleX萬卡超集群亮相,多項創(chuàng)新突破引領AI算力新高度

   時間:2025-12-20 15:33 來源:快訊作者:沈如風

在近日于昆山舉辦的光合組織人工智能創(chuàng)新大會上,中科曙光正式推出全球首套國產(chǎn)萬卡級AI集群系統(tǒng)——scaleX萬卡超集群,并以真機形式完成首次公開展示。該系統(tǒng)憑借多項突破性技術指標,成為國產(chǎn)智算基礎設施領域的里程碑式成果,標志著我國在高端AI算力領域實現(xiàn)從跟跑到局部領跑的跨越。

據(jù)中科曙光高級副總裁李斌介紹,該系統(tǒng)專為萬億參數(shù)大模型訓練、科學智能計算等前沿場景設計,通過架構創(chuàng)新與系統(tǒng)級優(yōu)化,在算力密度、網(wǎng)絡性能、能效比等核心指標上達到國際領先水平。系統(tǒng)由16個自主研發(fā)的scaleX640超節(jié)點構成,通過scaleFabric高速互連網(wǎng)絡實現(xiàn)10240塊AI加速卡協(xié)同工作,總算力規(guī)模突破5EFlops,相當于500萬臺高性能服務器的計算能力。

在硬件架構層面,scaleX640超節(jié)點采用全球首創(chuàng)的單機柜640卡設計,通過浸沒式相變液冷技術與高密度刀片服務器集成,將單機柜算力密度提升至傳統(tǒng)方案的20倍,同時將電源使用效率(PUE)優(yōu)化至1.04的行業(yè)最低水平。這種設計不僅顯著降低數(shù)據(jù)中心能耗,更通過模塊化架構支持靈活擴展,可滿足從千卡到十萬卡級集群的彈性部署需求。

網(wǎng)絡通信方面,曙光自主研發(fā)的scaleFabric系統(tǒng)搭載國內(nèi)首款400G原生RDMA網(wǎng)卡與交換芯片,實現(xiàn)400Gb/s超寬帶寬與亞微秒級通信延遲。相比傳統(tǒng)InfiniBand網(wǎng)絡,該方案將集群規(guī)模擴展能力提升2.33倍,網(wǎng)絡建設成本降低30%,同時通過智能流量調(diào)度算法確保萬卡級并發(fā)訓練時的數(shù)據(jù)傳輸零丟包。

針對大模型訓練特有的存儲挑戰(zhàn),系統(tǒng)創(chuàng)新采用"存算傳"三級協(xié)同優(yōu)化技術。通過芯片級數(shù)據(jù)預取、系統(tǒng)級緩存加速和應用級流式傳輸?shù)纳疃热诤?,使萬卡集群并發(fā)讀寫帶寬提升3倍,AI推理響應速度縮短40%,加速卡資源利用率提高55%。這項突破有效解決了傳統(tǒng)架構中存儲瓶頸導致的算力閑置問題。

在運維管理層面,系統(tǒng)構建了數(shù)字孿生與智能調(diào)度雙引擎。數(shù)字孿生平臺可實時映射物理集群運行狀態(tài),實現(xiàn)故障預測準確率達92%的智能運維;智能調(diào)度引擎則支持每秒萬級作業(yè)分發(fā),可同時管理十萬級用戶請求,確保集群長期可用性達到99.99%的電信級標準。

作為"AI計算開放架構"的旗艦產(chǎn)品,scaleX萬卡超集群已完成與400余個主流大模型的適配優(yōu)化,支持多品牌加速卡混合部署。在實際應用中,該系統(tǒng)已成功應用于金融風控模型訓練、地質(zhì)勘探數(shù)據(jù)處理、氣候模擬等關鍵領域,其中某金融機構的萬億參數(shù)模型訓練效率較傳統(tǒng)方案提升6倍。

該系統(tǒng)的推出得益于中科曙光聯(lián)合20余家產(chǎn)業(yè)鏈伙伴構建的開放生態(tài)。通過共享液冷技術、RDMA協(xié)議棧等12項關鍵共性技術,生態(tài)伙伴可基于統(tǒng)一架構快速開發(fā)定制化解決方案,將智算集群研發(fā)周期從18個月壓縮至6個月。這種"技術共研、生態(tài)共建"的模式,正在推動我國AI基礎設施從單機性能競爭轉向系統(tǒng)能力比拼的新階段。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群