黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

華為數(shù)據(jù)存儲攜手中科弘云 推出AI推理加速方案 賦能多行業(yè)應(yīng)用

   時間:2025-12-23 19:46 來源:快訊作者:朱天宇

華為數(shù)據(jù)存儲與中科弘云近日聯(lián)合推出了一項AI推理加速解決方案,旨在通過軟硬件深度協(xié)同優(yōu)化,為長序列推理場景提供高效算力支撐。該方案以華為OceanStor A系列存儲為核心數(shù)據(jù)底座,結(jié)合中科弘云自主研發(fā)的HyperCN智算互聯(lián)網(wǎng)云服務(wù)平臺,構(gòu)建起覆蓋數(shù)據(jù)存儲、算力調(diào)度、推理加速的全棧能力體系。

在技術(shù)架構(gòu)層面,方案創(chuàng)新性地融合了華為UCM推理記憶數(shù)據(jù)管理技術(shù)與中科弘云平臺能力。通過KV Cache多級緩存管理機(jī)制,將推理過程中的關(guān)鍵數(shù)據(jù)持久化存儲于OceanStor A系列設(shè)備,實現(xiàn)推理記憶的全量保存與快速調(diào)用。這種設(shè)計有效減少了重復(fù)計算開銷,配合Prefix Cache與GSA稀疏加速算法,在長序列推理場景中可顯著降低首Token生成時延(TTFT)。實測數(shù)據(jù)顯示,在智能問答典型場景中,該方案使TTFT降低57.5%,且序列長度與優(yōu)化效果呈正相關(guān)關(guān)系。

針對復(fù)雜算力環(huán)境,方案構(gòu)建了異構(gòu)資源管理體系。系統(tǒng)支持英偉達(dá)、華為昇騰、寒武紀(jì)等多品牌AI芯片的協(xié)同調(diào)度,兼容MindSpore、vLLM、SGLang等主流開發(fā)框架,并通過Kubernetes容器編排技術(shù)實現(xiàn)與存儲系統(tǒng)的無縫對接。這種設(shè)計使得能源電力、智能制造等行業(yè)的用戶能夠靈活整合現(xiàn)有算力資源,避免硬件鎖定帶來的技術(shù)風(fēng)險。

在算力調(diào)度方面,方案采用細(xì)粒度資源池化策略,可根據(jù)業(yè)務(wù)需求動態(tài)分配計算資源。系統(tǒng)具備集群作業(yè)調(diào)度、實時健康監(jiān)測、故障自動恢復(fù)等運維能力,支持分鐘級任務(wù)重啟與系統(tǒng)自愈。特別是在長文檔處理場景中,結(jié)合GSA稀疏加速算法后,當(dāng)序列長度達(dá)到39K時,系統(tǒng)并發(fā)處理能力提升86%,整體推理吞吐量增長36%,有效提升了復(fù)雜模型的生產(chǎn)部署效率。

為降低AI開發(fā)門檻,方案提供覆蓋全流程的端到端工具鏈,涵蓋數(shù)據(jù)標(biāo)注、模型訓(xùn)練、推理部署等關(guān)鍵環(huán)節(jié)。工具鏈同時支持傳統(tǒng)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)開發(fā)模式,實現(xiàn)AI資產(chǎn)的標(biāo)準(zhǔn)化管理。目前該方案已在國家實驗室、能源電力、智能制造等領(lǐng)域啟動試點應(yīng)用,通過實際場景驗證了其在復(fù)雜業(yè)務(wù)環(huán)境中的技術(shù)可行性。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群