黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

華為攜手三大高校開源Flex:ai,以技術(shù)創(chuàng)新破局AI算力資源利用難題

   時(shí)間:2025-11-22 08:36 來源:快訊作者:陸辰風(fēng)

在近日于上海舉辦的2025AI容器應(yīng)用落地與發(fā)展論壇上,華為公司副總裁、數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁周躍峰博士宣布了一項(xiàng)重要技術(shù)成果——AI容器技術(shù)Flex:ai正式發(fā)布。與此同時(shí),華為攜手上海交通大學(xué)、西安交通大學(xué)及廈門大學(xué)共同宣布,將這一產(chǎn)學(xué)研深度融合的成果向全球開源,旨在為破解算力資源利用率低下這一行業(yè)難題提供創(chuàng)新解決方案。

隨著人工智能產(chǎn)業(yè)的迅猛發(fā)展,全球?qū)λ懔Φ男枨蟪尸F(xiàn)爆發(fā)式增長(zhǎng)。然而,一個(gè)不容忽視的問題是,算力資源的利用率卻長(zhǎng)期處于較低水平。具體表現(xiàn)為:小規(guī)模AI模型訓(xùn)練任務(wù)往往獨(dú)占整張算力卡,導(dǎo)致大量資源閑置;大規(guī)模模型任務(wù)則因單機(jī)算力不足而難以推進(jìn);更有一大批缺乏GPU或NPU的通用服務(wù)器,因無法直接支持AI計(jì)算而處于“休眠”狀態(tài)。這種供需之間的嚴(yán)重錯(cuò)配,已成為制約AI產(chǎn)業(yè)進(jìn)一步發(fā)展的關(guān)鍵因素。

針對(duì)上述挑戰(zhàn),華為推出的Flex:ai XPU池化與調(diào)度軟件,基于Kubernetes容器編排平臺(tái)構(gòu)建,通過精細(xì)化管理和智能調(diào)度GPU、NPU等智能算力資源,實(shí)現(xiàn)了AI工作負(fù)載與算力資源的高效匹配,顯著提升了算力利用率。該技術(shù)的成功研發(fā),得益于華為與三所頂尖高校的緊密合作,共同攻克了三大核心技術(shù)難題。

首先,針對(duì)小模型訓(xùn)推場(chǎng)景中的資源浪費(fèi)問題,華為與上海交通大學(xué)聯(lián)合研發(fā)了XPU池化框架。這一框架能夠?qū)螐圙PU或NPU算力卡精細(xì)切分為多個(gè)虛擬算力單元,切分精度高達(dá)10%。通過這種技術(shù),單張算力卡可以同時(shí)承載多個(gè)AI工作負(fù)載,且支持按需切分算力單元,實(shí)現(xiàn)了“用多少切多少”的靈活資源管理。據(jù)測(cè)試,該技術(shù)可使此類場(chǎng)景下的整體算力平均利用率提升30%,大幅提高了單卡的服務(wù)能力。

其次,為了解決大量通用服務(wù)器因缺乏智能計(jì)算單元而無法服務(wù)于AI工作負(fù)載的問題,華為與廈門大學(xué)共同研發(fā)了跨節(jié)點(diǎn)拉遠(yuǎn)虛擬化技術(shù)。該技術(shù)能夠?qū)⒓簝?nèi)各節(jié)點(diǎn)的空閑XPU算力聚合起來,形成一個(gè)“共享算力池”。這一創(chuàng)新不僅為高算力需求的AI工作負(fù)載提供了充足的資源支撐,還使得不具備智能計(jì)算能力的通用服務(wù)器能夠通過高速網(wǎng)絡(luò),將AI工作負(fù)載轉(zhuǎn)發(fā)到遠(yuǎn)端“資源池”中的GPU/NPU算力卡中執(zhí)行。這一技術(shù)有效促進(jìn)了通用算力與智能算力資源的深度融合。

最后,面對(duì)算力集群中多品牌、多規(guī)格異構(gòu)算力資源難以統(tǒng)一調(diào)度的難題,華為與西安交通大學(xué)共同打造了Hi Scheduler智能調(diào)度器。該調(diào)度器能夠自動(dòng)感知集群負(fù)載與資源狀態(tài),結(jié)合AI工作負(fù)載的優(yōu)先級(jí)、算力需求等多維參數(shù),對(duì)本地及遠(yuǎn)端的虛擬化GPU、NPU資源進(jìn)行全局最優(yōu)調(diào)度。即使在負(fù)載頻繁波動(dòng)的場(chǎng)景下,也能確保AI工作負(fù)載的平穩(wěn)運(yùn)行,實(shí)現(xiàn)算力資源的分時(shí)復(fù)用,讓每一份算力都得到充分利用。

Flex:ai的全面開源,意味著其所有核心技術(shù)能力將向全球開發(fā)者開放。華為希望通過匯聚全球創(chuàng)新力量,共同推動(dòng)異構(gòu)算力虛擬化與AI應(yīng)用平臺(tái)對(duì)接標(biāo)準(zhǔn)的構(gòu)建,形成算力高效利用的標(biāo)準(zhǔn)化解決方案。這一舉措無疑將為全球AI產(chǎn)業(yè)的高質(zhì)量發(fā)展注入新的強(qiáng)勁動(dòng)能。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號(hào)
ITBear微信賬號(hào)

微信掃一掃
加微信拉群
電動(dòng)汽車群
科技數(shù)碼群